版权归原作者所有,如有侵权,请联系我们

穿越无声世界:华为云和千博信息如何打破聋人与健听人沟通壁垒?

智能相对论
深挖人工智能这口井,评出咸淡,讲出黑白,道出深浅。
收藏

文|智能相对论

作者|李永华

让说着不同语言的人能够打破隔阂、自由交流,不再因为语言的不同而被限制,一直是不少科技公司的理想所在,市面上也出现了大量有志于此的语言翻译类产品。时至今日,跨多语种的实时流畅翻译产品已经屡见不鲜。

但是,这个世界上还有一群人,他们与我们的沟通同样存在着“语种”的隔阂,只不过他们使用的是手语,其需求却很少被科技公司所关注——让聋人与健听人实现正常沟通,背后的技术与产品挑战太大。

欣慰的是,总有人会愿意站出来。

在9月26日“国际聋人日”这天,新华网、爱的分贝、华为发起倡议,呼吁大众给予聋人群体更多的社会关怀,可通过简单的手语表达善意;与此同时,一条微电影《无声回响》发布,讲述手语爱好者帮助聋人更好地沟通、维护法律权益的事迹,引发了大众广泛关注。

微电影中,华为云联合其生态伙伴长沙千博信息技术有限公司(下称“千博”)针对聋人群体的需求所定制研发的无障碍信息交流平台与工具令人印象深刻,用技术打破听力障碍带来的局限已经成为现实。

其背景是华为与马栏山(长沙)视频文创园、湖南联通、芒果TV四方签约战略合作,推出“马栏山视频产业云”,基于该平台,以建设“无障碍城市”为基点,千博研发了手语计算云平台及终端产品,服务中国超2700万听障人士,延伸到背后上亿的社交圈层。

无声世界已被穿越,聋人群体与健听人的沟通桥梁正在被建立起来。

以技术之名,聋人与健听人的沟通不再有障碍

以往针对聋人群体的技术与产品也有不少,但多数是从单一维度片面思考用途,随着云计算、AI、大数据的发展,全维度推动聋人与健听人无障碍沟通变成了可能——这恰恰是华为云与千博合作成果的展现。

具体而言,这表现为三个方面:

1、多场景、多产品的体系化建设,塑造无处不在的生活方式

华为云与千博除了一个提供核心计算能力的云平台,还推出了功能各异的终端产品体系,包括手语教育支撑系统、精准翻译工具、手语APP、手语AR、同声手语会议系统、网页手语、电视手语AI系统、双向无障碍交流服务平台等,确保在聋人群体日常接触到的主要设备上都能够有相关的应用呈现。

基于此,以长沙为例,银行、机场、政务大厅、医院、商场、景点等场所都有相关产品的身影,配置了相应的手语演示动画,一个健听人生活要是什么样子,聋人群体通过技术就尽可能在实现什么样子(图:长沙市开福区政务大厅-问询导航系统):

如果说我们对技术的需求很多时候是一种对生活更便利的额外追求,那么聋人群体在各种场合对技术的需求就是一种实现与世界无障碍沟通的刚需。现在,通过华为云与千博的努力,这种刚需正在得到释放。

2、点对点完善,推动聋人工作场景的突围

针对身体缺陷或智力障碍的特殊人群,社会已经在尽可能给予帮助,例如有很多特殊工作岗位就是专门为他们而设计。

但是,聋人群体在走向一般大众所从事的工作时,例如坐到写字楼成为一个通常意义上的白领,往往会面临很多健听人不会面临的困难,在通过技术实现生活便利化后,提升工作场景的融合度、增加社会生存能力甚至有更好的人生成就,就成为更进一步的需求。

可以看到,华为云与千博通过一系列解决方案帮助聋人群体通畅工作,例如针对十分依赖实时听觉的工作会议,千博手语智能会议系统可将健听人的语音快速翻译成文字,供聋人阅读,也可以将文字准确翻译成3D手语动画,保证信息的准确传达,甚至还支持对实时会议手语过程进行录制,方便听障人士会后进行会议记录查阅,等等。

这也使得有听障人士参与会议、教学、演讲场景需求的政府机构、高等教育机构和大型企业都有了可行的解决方案。

未来,在各类工作场景下,相信更多帮助聋人群体的产品会源源不断推出,使他们与健听人参与工作时的差距越来越小。

3、将已有的聋人帮扶体系再度升级

针对聋人群体帮助他们更好地生活,原本已经有不少的社会性配套措施,或者商业性产品。现在,技术的介入帮助它们进一步升级,让造福聋人群体也可以“提质”。

较为典型的是特殊教育学校,它们为聋人群体设计了一系列针对性的课程,帮助聋人学习和成长,而华为云与千博的产品已经深入课堂,帮助课堂教学效率进一步提升,目前已经在益阳特殊教育学校、长沙特殊职业教育学院得到应用。

图为益阳特殊教育学校一堂数学课上,千博的终端产品正在将有关知识翻译成手语方便孩子们更好地学习:

此外,对于原本已有的一些商业化产品,例如手语翻译,华为云与千博也进行了提升,其推出的千博手语APP把手语词典和聋人社交合二为一,一方面可以通过APP随时查询手语翻译,另一方面还搭载了同声翻译系统,可以即时将健听人说的汉语转译成手语,让聋人能“看”懂声音,切实解决聋人交流问题。

这种做法,附带解决了聋人在社交上往往更孤立的痛点问题,让他们也能被关心和关注,提升心理健康水平。

手语计算与应用——“新基建”技术土壤里长成的又一果实

实际上,虽然华为云与千博推出的产品在功能上简单明了,但其背后却有一系列技术支撑,是“新基建”的技术土壤里所长成的又一果实。

这种技术能力,至少包括三个方面:

1、软硬件能力带来的高性能

聋人群体规模庞大,其相关的场景已涉及社会的方方面面,因而提供服务的产品必然会面临巨大的需求涌入,对那些大型机构或企业而言,也内在需要更高应对能力的解决方案。

加上手语翻译中大量的AI计算,这时候,云端强大的算力就必不可少,能够支撑终端产品更好地“履行职责”。

以千博手语计算平台为例,过去一台1台公有云服务器可以支撑6路语音文字转手语手势视频的输出,现在,通过采用马栏山视频产业云G5r实例云服务器,1台云服务器可以支撑9路语音文字转手语手势视频的输出,效率提升50%。

随着帮助聋人的技术产品更广泛地落地,这种高性能的价值将进一步显现。

2、弹性化部署带来的合理成本

如果只有高性能但部署成本却十分昂贵,或者因为资源安排的问题造成成本的浪费,对很多采纳产品的企业或机构来说也是无法接受的。

这时候,华为云帮助建设的马栏山视频产业云所提供的弹性伸缩能力就发挥了必要的作用。

一方面,企业和机构可以按需申请资源,实现资源的最大化利用,将每一分钱花在该花的地方,不造成资源的浪费,也不出现高峰期云资源不足的境况;另一方面,通过云端集中管理,后台调度,让企业或机构随时可用而又不必额外配备硬件维护专员,也不必自行购买设备,避免重资产部署带来的风险。

3、前沿技术创新带来的产品化落地能力

有强大的服务器性能,有更合理的部署成本,技术要发挥对聋人群体的价值,还需要更好的产品化落地,即要将技术更好地呈现出来,以最便捷和最易于接受的方式让聋人使用。

这方面,最典型的莫过于千博手语AR,这是专为AR眼镜打造的一款千博手语系列软件,将原本要呈现在其他终端屏幕上的手语,更好地适配到AR眼镜产品上。

实测中,聋人用户戴上AR眼镜后,周围声音的有效信息会被提取出来并翻译成手语显示在AR眼镜显示屏上,这使得聋人群体的双手被解放,在工作、学习、生活等方面更便捷,几乎没有额外操作步骤的拖累。

听起来很科幻,但这已经是现实,技术正在展现出改变一切的魅力。

有温度的科技,也可以有广阔的产业空间

挖掘技术潜力、让技术也能为社会责任的践行出一份力,现在已成为科技领域的共识,只不过真正能长久坚持、做出深度的并不多。

说到底,科技是中性的,能为善也能为恶,很多时候要面临商业价值的拷问,在没有价值观的支撑下,很多企业包括所谓的大厂很难将之践行下来,多数时候可能只是“最少成本应付应付舆论就行了”。

而华为云与千博共同推动的手语产品,始终以聋人群体的需求为核心,真真切切走进他们生活工作的方方面面,这背后体现的是科技平台公司的价值观。

事实上,早在2019年,华为云就提出“Cloud for Good”,这是一个旨在推动技术普惠、联合伙伴赋予技术温度和感性、为社会创造不凡价值的理念,包括“探索边界、优化环境、提升品质、关注个体”四大领域,其要做的,就是在商业之外,与合作伙伴一起把云、AI、5G等技术分享给更多有需要的个体和组织,以技术创新,让美好发生。

这次与千博的合作,无疑是“Cloud for Good”的最好证明,技术正在普惠给更多人群,包括最为迫切的聋人群体。

而更进一步看,“Cloud for Good”之后,其实新的商业价值也被打开。在聋人群体这里,服务2700万的庞大人群,甚至全球3亿人群,它们的工作生活学习一定还有大量的需求等待去满足,很多新的产品创新将被实现,一个新的产业或在开启。

只要技术积淀深厚,生态伙伴紧密协同,能够真正从弱势人群的需求去考虑,践行社会责任从来不意味着就只是一种商业利益的牺牲,它也能为企业、为平台带来丰厚的回报,反过来,这又能让正向的价值观更好地坚守下去。

*本文图片均来源于网络

深挖智能这口井,同好添加vx:zenghy2017

此内容为【智能相对论】原创,

仅代表个人观点,未经授权,任何人不得以任何方式使用,包括转载、摘编、复制或建立镜像。

部分图片来自网络,且未核实版权归属,不作为商业用途,如有侵犯,请作者与我们联系。

智能相对论(微信ID:aixdlun):

•AI产业新媒体;

•今日头条青云计划获奖者TOP10;

•澎湃新闻科技榜单月度top5;

•文章长期“霸占”钛媒体热门文章排行榜TOP10;

•著有《人工智能 十万个为什么》

•【重点关注领域】智能家电(含白电、黑电、智能手机、无人机等AIoT设备)、智能驾驶、AI+医疗、机器人、物联网、AI+金融、AI+教育、AR/VR、云计算、开发者以及背后的芯片、算法等。