搜狗发布“唇语识别”技术 不听声就能识别你说了啥网易科技 2017-12-14 |
搜狗公司在京召开媒体沟通会,正式推出人机交互新技术“唇语识别”,该技术可以通过机器视觉识别,不用听声音,仅靠识别说话人唇部动作,就能解读说话者所说的内容。
据了解,唇语识别是一项基于机器视觉与自然语言处理于一体的技术,搜狗采用端到端的深度神经网络技术进行中文唇语序列建模,通过数千小时的真实唇语数据训练,官方称,在非特定人开放口语测试集上,唇语识别系统可以达到60%以上的准确率,在垂直场景如车载、智能家居等场景下可以达到90%的准确率。
在应用层面,现场工程师介绍,唇语识别可以辅助语音交互及图像识别,比如在车载场景下,周围噪音过大时会对语音指令产生干扰,通过唇语识别技术则可以规避干扰;在不便发声的公共场所保证说话的私密性;在安防领域,由于目前多数监控只有摄像头没有麦克风,唇语识别可以帮助公安获取重要的讲话信息;唇语识别还能帮助先天性听障人群或老年人。
责任编辑:杨茗
最新文章
-
为何太阳系所有行星都在同一平面上旋转?
新浪科技 2021-09-29
-
我国学者揭示早期宇宙星际间重元素起源之谜
中国科学报 2021-09-29
-
比“胖五”更能扛!我国新一代载人运载火箭要来了
科技日报 2021-09-29
-
5G演进已开始,6G研究正进行
光明日报 2021-09-28
-
“早期暗能量”或让宇宙年轻10亿岁
科技日报 2021-09-28
-
5G、大数据、人工智能,看看现代交通的创新元素
新华网 2021-09-28