[科普中国]-人工智能可从嘈杂声中分辨特定声音-

[科普中国]-人工智能可从嘈杂声中分辨特定声音

上传时间：2021-12-31

科普中国-绿色双碳

原创

聚焦绿色低碳技术理念科普助力“双碳”目标实现

人工智能（AI）设备已经能处理来自独立个人的请求，但跟我们一样，它们在嘈杂的鸡尾酒会上或几个人同时发言的情况下，也会感到“纠结”。《新科学家》杂志官网近日文章称，美国剑桥三菱电机研究实验室的研究人员开发出的声音识别AI设备，能实时分离多个声源，大大提升了自动语言识别能力。

这项技术首次在日本东京先进技术综合展览会上公开展示，被团队称为“深度聚类”机器学习，可识别多个声源“声纹”中的独特功能。然后，将每个演讲者声音的不同特征组合在一起，允许它从多个声音中将特定特征的声音选出来，最后重建每个人的话语。智能技术使用了多名人士讲的英语进行了培训和学习，即便说话人是日本人，也能轻松地分辨出来。

据介绍，传统识别语音的方法，利用两个收音器模拟听众两耳朵的位置，只能达到51%的准确性，形成的“鸡尾酒会效应”困扰了AI研究几十年。

新智能系统可以将两个人的语音成功分离，而且，重建单人语音的精确度高达90%，新技术可帮助家庭和汽车更好地执行智能任务，一次可分离多达5个人的声音，可用于电梯、空调机组和家用产品的智能操控。

内容资源由项目单位提供

请科普中国APP发表评论或查看更多评论