搜狗发布“唇语识别”技术不听声就能识别你说了啥

网易科技 2017-12-14

　搜狗公司在京召开媒体沟通会，正式推出人机交互新技术“唇语识别”，该技术可以通过机器视觉识别，不用听声音，仅靠识别说话人唇部动作，就能解读说话者所说的内容。

　　据了解，唇语识别是一项基于机器视觉与自然语言处理于一体的技术，搜狗采用端到端的深度神经网络技术进行中文唇语序列建模，通过数千小时的真实唇语数据训练，官方称，在非特定人开放口语测试集上，唇语识别系统可以达到60%以上的准确率，在垂直场景如车载、智能家居等场景下可以达到90%的准确率。

　　在应用层面，现场工程师介绍，唇语识别可以辅助语音交互及图像识别，比如在车载场景下，周围噪音过大时会对语音指令产生干扰，通过唇语识别技术则可以规避干扰；在不便发声的公共场所保证说话的私密性；在安防领域，由于目前多数监控只有摄像头没有麦克风，唇语识别可以帮助公安获取重要的讲话信息；唇语识别还能帮助先天性听障人群或老年人。

责任编辑：杨茗

上一篇：性爱机器人才是真爱它会让婚姻变得更幸福

下一篇：人工智能的“黑暗秘密”：如何让AI解释自身行为？

科普中国APP 科普中国微信 科普中国微博