就在5G消息发布两周年之际不久,中国移动近日在北京推出了5G新通话业务,因此中国移动成为了全球首个率先推出5G新通话试商用的电信运营商。或许,5G新通话已经迎来了发展新风口。那么,5G新通话在传统的业务上如何赋能通信服务?而作为通信基础能力的通话服务下一步又将会如何升级发展?
5G VoNR技术瞄准市场蓝海,打造“通信高地”
海量连接蕴藏丰富机会,未来仍存广阔市场空间。目前,全球有70亿人与人之间的话音连接。5G时代,音视频连接将延伸到超过200亿的人与人和人与物的连接[1],通信终端也将从手机变成TV、音箱、车、甚至机器人等新型终端。人与物的音视频连接,让家中的IoT设备成为唾手可得的沟通工具,极大丰富了通信场景。与此同时,语音交互、手势交互等AI交互方式,全面升级通信体验,实现解放双手,自在畅聊;甩屏等创新功能应用,将打破空间的局限,真正打造“以人为中心”的无缝通信服务,让沟通无处不在,让信息自由流动。
目前,业内主流通信厂商从不同角度切入物联终端基于5G VoNR技术的场景创新与应用市场,为智能门铃、智能摄像头、智能音箱、智能台灯等智能终端提供超清视话通信解决方案。
物联网IOT终端关键技术为5G VoNR通信服务
为提升VoNR通信终端覆盖率,拓展IOT通信场景,智慧家庭运营中心创新融合型轻载化高效EVS编码、低功耗通信模组、弱网对抗技术、交互式通信技术。EVS(Enhanced Voice Services, EVS)是继4G移动高清语音编解码器AMR-WB后,VoNR默认和优选的语音编解码方法,相较于G711、AMR语音编码,其最大体验提升在于提供8-48khz的音频覆盖能力,满足了人耳对听觉全域的频率覆盖,适应所有人耳可感知的音频媒体传输,同时EVS在移动通信系统中通信质量和效率方面也有很大的提升。
特点1:支持全频域编码,提供超高清语音\音乐编码
EVS支持全频域编码(语音编码和音乐编码),四种采样率,8kHz、16kHz、32kHz、48kHz,音频带宽的分布如下图所示:
图1 音频带宽的分布[2]
8kHz采样率对应的编码带宽为窄带,范围是300Hz-3400Hz;16kHz采样率对应的编码带宽为宽带,范围是50Hz-7000Hz;32kHz采样率对应的编码带宽为超宽带,范围是20Hz-14000Hz;48kHz采样率对应的编码带宽为全带,范围是20Hz-20000Hz。人耳可以感知的频率范围一般在20Hz-20000Hz,传统通信系统中语音信号频率范围300—3400Hz之间,采用8kHz采样,因此EVS能够覆盖人耳可感知的全频域音源,相比传统通信系统,EVS能够提供无损级话音和音乐音频信号传送服务。
智慧家庭运营中心针对智能家居、数字乡村等场景,基于音视频通信技术孵化如智能喇叭、智能提醒、智能对讲等创新业务,攻关物联网IOT终端全频率音频采集、音频前后处理技术,升级3A算法,引入RNN循环神经网络,实现8-48khz音频采样全频域语音通信能力,赋能家庭业务提升用户体验,如智能喇叭广播业务可以为用户播放无损音质的音频,智能对讲业务提供临场沉浸式沟通体验。
特点2:支持更全面的编码速率,满足泛终端差异化网络环境
EVS不同的编码带宽都支持多种码率,其中WB带宽支持全码率。码率越高需要的带宽就越大。如下图所示:
图2 EVS编码速率[3]
智慧家庭运营中心根据EVS传输码率特性,针对泛家庭场景物联网终端使用场景,攻关QoS网络抗丢包技术,使用WavaRNN技术构建了循环生成网络模型,学习超分信号前后的相关性,构建低频谱模到高频谱模的翻转模型,利用Griffin-lim算法和Mel-GAN声码器,有效解决高频相位的缺失引起的振铃效应,使用ISTFT得到时域信号,实现音频超分变率扩展,打造EVS码率自适应技术,根据网络环境,自适应选择不同的编码速率。通过上述技术,优化EVS在物联网终端在多种网络环境下适应能力,提供更好的语音编码服务和效率,相同网络场景下MOS分平均提高0.4。
特点3:极低延时,提供声临其境的通话体验
EVS处理的语音帧的时长为20ms。当编码带宽为WB/SWB/FB时的编码延时为12ms,当编码带宽为NB时的编码延时为10ms。相对于AMR-WB效率提高了近一倍。
智慧家庭运营中心结合EVS低延迟的特性,创新性提出媒体前协商通信机制,利用5G高带宽、低延时的特性,有效提高泛智能终端的接通率,进一步缩短泛智能终端建立通话的时延。为用户带来高连通率,超低延迟的VoNR超高清通话服务,让语音通话有了身临其境的体验。
特点4:轻载化编解码,广泛赋能各种终端
由于IoT设备普遍存在的性能瓶颈,智慧家庭运营中心针对不同平台的多种设备,使用SIMD技术对EVS进行轻载化,在ARM、MIPS等架构下进行EVS性能优化,有效将帧处理耗时从35ms大幅降低到10ms以内,解决EVS在低功耗芯片上无法运行的问题,为智能物联网终端提供泛终端、泛网络、全频域、超高清的多媒体通信服务。
5G新通话全面升级通话体验
中国移动智慧家庭运营中心以AIoTel 技术为底座,创新面向用户感知的增强型全频域编码技术、物联网多媒体通信EVS码率自适应技术、全域超大规模视联算力并网调度技术、媒体前协商通信机制,创新打造行业首款支持VoNR的智能终端,面向物联网提供泛终端、全场景、高品质的电信级多媒体通信服务,打造数字通信全新体验。
针对家庭细分场景孵化智能电话、智能对讲、智能喇叭、移动看家等业务,结合智能硬件创新出基于智能音箱、宽带电视的大中小屏 VoLTE 视频通话,猫眼门铃 VoLTE 视频对讲,智能摄像头远程广播喊话等特色功能,并借力“数字乡村”工程实现 CHBN 协同发展,进一步牵引产业上下游的产品孵化和创新。
(一)门锁视频对讲(门口):亲友来访,按动智能门锁上的门铃按钮后,主人的手机即可接收到一通视频来电。在通话过程中,主人可一键为亲友开启门锁。
(二)大屏视频通话(客厅):亲友相聚,使用语音遥控器的语音交互指令拨打大屏高清视频通话,向远方的父母报平安。在视频通话过程中实时分享旅行照片。
(三)音箱视频通话(厨房):随着女主人步入厨房,大屏视频通话随之切换到厨房的智能音箱上。女主人一边准备饭菜,一边继续与父母畅谈。
(四)智能台灯通话(书房):画面转到书房,孩子正在做作业,遇到难题后按动台灯的通话按钮,爸爸的手机即可接收到电话,实时通话指导孩子的功课。
(五)智能客服(在线业务):用户在线办理业务场景时,通话建立前展示企业名片及认证信息;通话中智能客服主动推送交互式菜单及业务表单远程指导用户操作;通话结束后定制结束语形成服务闭环。
(六)通话交互(办公/娱乐):通话过程中支持用户进行屏幕共享、文件分享和白板涂鸦等交互操作。
5G VoNR 让“人机物”的边界融合。未来可通过“移步换景”-从室外到室内丝滑串联中国移动VoNR极富特色的人与人、人与物通信场景,全面展现泛终端、泛网络、全场景、电信级的物联通信解决方案,以及智能感知、多模态交互的数字通信全新体验。
参考文献:
[1] 《Vo5G技术白皮书》.
[2] https://www.aes.org/technical/documentDownloads.cfm?docID=548.
[3] https://www.aes.org/technical/documentDownloads.cfm?docID=548.
作者:陈民
单位:中国移动智慧家庭运营中心
来源:移动Labs