AI智能语音助力5G新通话能“看懂”通话
AI智能语音助力5G新通话能“看懂”通话,其试点推出的无障碍智能通信、可视菜单及远程协助等5G新通话业务,让通话更智能、可视可交互。AI智能语音助力5G新通话能“看懂”通话。
AI智能语音助力5G新通话能“看懂”通话1
4月12日,中国移动在首钢园国家冬季训练中心速滑馆举办“5G新通话,预见新未来”产品发布会,正式发布5G新通话产品,并宣布部分终端已在全国支持5G VoNR超清通话业务,打造可视化、多媒体、高感知、全交互的全新媒体。
在发布会上,中国移动市场经营部总经理首建国介绍,与互联网的语音视频通话相比,5G新通话能够基于中国移动5G网络,实现高清视频通话,通话质量稳定,几乎没有时延,且电话呼入不中断。
同时,结合AI技术,5G新通话可以在通话过程中实现中英文实时翻译、语音转文字等功能,此外还提供了屏幕共享、远程协作等特色功能。首建国还介绍说,目前5G新通话功能正陆续在各大手机终端进行适配,到今年7月,所有终端新推出机型都将支持5G新通话。
从5G新通话所展示的功能来看,有望成为一款“5G杀手级应用”。在这一被业界普遍看好的业务背后,5G网络是核心基础,媒体互动是重要功能扩展,终端支持是保障,其中还有一个关键,就是AI智能语音技术。
5G新通话可以让通话双方实现语音转文字,同时还可以在屏幕上实时翻译,让通话人在听见的同时,“看懂”通话的内容。看似好理解的技术,背后蕴藏的大量黑科技,例如语音识别、口语理解、语音同传等等,非深厚的AI语音技术积累不可为。
这些背后的黑科技,主要来自智能语音和人工智能的头部企业科大讯飞,因此,科大讯飞也成为了中国移动5G新通话的官方合作伙伴。
据悉,科大讯飞是北京2022年冬奥会和冬残奥会官方自动语音转换与翻译独家供应商。资料显示,面向冬奥会场景的多语种语音及语言服务平台,采用了科大讯飞的“自动语音转换与翻译”技术,支持60个语种语音合成、69个语种语音识别、168个语种机器翻译和6个语种交互理解,其中重点语种翻译准确率达到了95%,平均每句翻译响应时间不超过0.5秒。
通话场景下有大量的口语化表达,口语化表达不同于规范的书面文本,一般表现为内容表述不符合语法规范、语气词过重、重复冗余等,这使得直译时出现明显的“机翻”痕迹,给机器翻译在通话场景中的应用提出了更高的挑战。
科大讯飞的'技术负责人介绍,针对5G新通话口语化场景优化,采取了三大措施:一是人机协同标注常用口语数据,并补充口语双语训练;二是系统性运用了无监督/弱监督训练方法,基于大量口语化表达的源、目标语言单语数据,采用自训练、回译算法等强化翻译模型和语言模型,对口语化表达特性实现增强训练;
三是针对语音识别后处理阶段,设计语气词顺滑、规整等模块,将口语化表达尽可能书面化,从而减少机翻“痕迹”,帮助用户更好地理解。
中国移动5G新通话背后的人工智能技术,来源于科大讯飞23年来坚持源头技术自主创新的深厚积累,科大讯飞在人工智能语音识别、机器翻译、语义理解等技术领域处于国际领先地位,在诸多国际技术赛事中取得冠军。
在语音识别领域,科大讯飞参加了2021年OpenASR国际低资源多语种语音识别挑战赛15个语种受限赛道和7个语种非受限赛道,全部取得第一;在机器翻译领域,先后获得了2018年IWSLT国际口语机器翻译评测比赛端到端任务第一和2021年IWSLT国际口语机器翻译评测比赛英德语音同传、文本同传和英日文本同传全部三个同传赛道冠军;
在多语言理解领域,获得世界权威多语言理解评测XTREME(Cross-Lingual Transfer Evaluation of Multilingual Encoders)四项任务中的三项最好成绩,标志着科大讯飞多语言理解与跨语言迁移能力再上新台阶。
在语义评测领域,在第十六届国际语义评测SemEval 2022的比赛中,科大讯飞从30余支参赛队伍中脱颖而出,获得“多语种新闻相似度评测任务”和“多语种惯用语识别任务”两项冠军。
以数智化技术构建美好世界是人类共同的希冀。5G新通话只是5G+AI有机融合的一小步,在中国拥有全球规模最大的5G精品网络,拥有世界领先的人工智能自主核心技术,科大讯飞和中国移动这样深度协同的模式,将会让5G+AI发挥更大的融合倍增效应,必将加速推进科技创新、推动数智化转型,共创人工智能美好新世界。
AI智能语音助力5G新通话能“看懂”通话2
线上营业厅办业务、小程序采购日常所需、APP预约线下服务……当我们畅享5G数智生活时,仍然有一群人尚未跨越“数字鸿沟”。他们可能是不会使用智能手机、看不清屏幕的老年人,也可能是听不清、听不懂的残障人群。如何帮助他们也能和我们一样与5G智能时代快速接轨,成为亟待解决的社会问题。
为此,2022冰雪盛会期间,中国移动推出极具温度的“为了听不到的你”智能AI字幕,以此解决体育赛事直播解说时没有字幕、语言不通等难题,助力有听力障碍的特殊群体也能感知扣人心弦的夺金时刻。这一暖心黑科技覆盖花样滑冰、短道速滑、单板滑雪、自由式滑雪等数百个场次,不仅深受特殊群体的喜爱,而且得到中国聋协的大力点赞。
4月12日,中国移动在5G智能通信服务创新方面又有新动作,对外发布5G新通话产品。作为5G网络环境推出的新一代通话产品,5G新通话与2G/3G/4G网络环境下的传统通话相比,新在“更快、更清、更智、更广”。其试点推出的无障碍智能通信、可视菜单及远程协助等5G新通话业务,让通话更智能、可视可交互。
与互联网语音视频通话相比,5G新通话新在“更稳定、更便捷”,稳在于通话质量稳定,且电话呼入不中断,便捷在于手机终端原生,拨号盘即可拨打视频通话,无需下载App和小程序。
科技向善 沟通无碍
中国移动5G新通话具备5G VoNR超清通话、5G视频客服、AI语音识别(中英文实时翻译、科技助老)、屏幕共享、远程协作、与虚拟数智人通话等特色功能,助力特殊人群也能“零距离”畅享可视化、多媒体、高感知的超清通话体验,可有效解决“银发族”弱视弱听、不会安装、不会使用智能手机、看不清手机屏幕等问题,也能很好地帮助听力受损人群与健听人群顺畅沟通。
其中,5G超清视频通话将以超低时延、超清画质、不占流量、一键视频四大优势,助力特殊人群也能体验流畅、便捷、高效的5G智能通信服务。试商用期间,5G视频通话按时长计费(按分钟数),不收流量费。5月1日起,5G套餐内语音分钟数将升级为可用于5G新通话的分钟数,可用于音、视频通话,畅聊不设限。
敬老助残 关爱无限
中国移动持续为银发族和残障人群提供有针对性的高品质服务,为他们融入移动通信生活排忧解难。5G新通话产品中的5G视频客服10086已在25个省份的部分地市向中国移动客户开放使用,覆盖基础业务查办、高敏业务授权、远程操作指引等多个移动业务场景,帮助银发族和残障人群从“最多跑一次”升级为“一次不用跑”。
关爱不止于此,中国移动线下营业厅设置爱心座椅、无障碍通道,提供优先服务,简化业务办理流程,提供多种业务办理方式,全程做好咨询、引导、解释工作,并在地市标杆营业厅尝试开设智能终端辅导专区,举办日常公益小课堂。
针对残障客户办理手机业务,中国移动还尝试推出基础手语服务、预约上门业务受理等多种暖心服务,以此消除他们与外界的沟通障碍,更好地融入数字生活。
科技向善,步履不停。中国移动将持续坚持“至诚尽性,成己达人”的履责理念,勇立潮头、勇担使命,让5G 时代数字经济的发展成果惠及更多弱势群体,让他们拥有更多的获得感、幸福感和安全感。
一直以来,中国移动依托5G技术优势,持续优化特殊人群的移动通信体验,积极探索各项关爱服务,以5G力量助力更多人跨越数字鸿沟,畅享舒适、便捷的美好数智生活。
AI智能语音助力5G新通话能“看懂”通话3
将5G通话与人工智能技术结合,可实现通话过程中的语音转文字、中英文实时翻译等功能,让通话人不仅能听见,还能“看懂”通话内容。在北京冬残奥会上,这项技术已在各赛区进行了体验试用,近日,中国移动正式发布了这一5G新通话产品。
中国移动市场经营部总经理首建国介绍,5G新通话基于中国移动5G网络实现高清视频通话,通话质量稳定,几乎没有时延,且电话呼入不中断。同时结合人工智能技术,5G新通话可实现中英文实时翻译、语音转文字,以及屏幕共享、远程协作等功能。
科大讯飞项目负责人刘平平表示,通话场景下存在大量口语化表述,常常表现为不符合语法规范、语气词过重、重复冗余等,这对机器翻译工作是个不小的挑战。
因此,技术人员在适配5G新通话功能时,应用了人机协同标注常用口语数据、口语双语训练、回译算法等翻译模型和语言模型等技术,并在语音识别后,尽可能将口语化表达进行书面化处理,减少“机翻”痕迹,便于用户理解。
首建国表示,目前该功能正陆续在各大手机终端进行适配,预计到今年7月,支持安卓系统的手机新机型都将支持5G新通话。