工具开放: 开启人工智能“全民时代”

文·本报记者 何晓亮

科技日报 2016-12-08

  

  

  给阿基米德一个支点,他能撬起地球。给开发者们一个工具,他们能创造一个“世界”。 独乐乐不如众乐乐,众乐乐不如与人乐乐。让所有人参与的全民共舞,才是新技术走向产业化的前提。

  独乐乐不如众乐乐,众乐乐不如与人乐乐。早在2000多年前,孟子就在《孟子·梁惠王下》篇中,阐述了快乐与分享之间的关系。

  如今,占据着人工智能这一前沿技术高地的科技巨头们,也开始“遵循”先贤的教诲,以提供开发工具等方式授人以渔,让更多的人参与到这项事业的发展进程中。

  给追随者一颗火种

  人工智能,已经成为当下热门的创新研发领域。与台式机时代的windows系统、移动互联时代的安卓、IOS系统一样,人工智能的商业化应用和普及,离不开大量第三方开发者的参与和支持。

  但是到目前为止,很少有开发人员能构建、部署并大规模扩展具备AI能力的应用程序。因为这样做需要访问大量数据,以及机器学习和神经网络方面的专业知识。

  业内专家表示,若要有效地应用AI,涉及大量手动操作,以开发并调整许多不同类型的机器学习和深度学习算法(例如自动语音识别、自然语言理解、图像分类),收集清理训练数据,训练并调整机器学习模型。并且,这一过程必须对应用程序中的每个对象、面部、语音和语言特性重复。

  “要想涉足AI,应用研发者必须具备更好的算法、对大量数据的广泛访问以及由云提供的高效经济的计算能力。”亚马逊网络服务公司数据库、分析和AI副总裁拉朱·古拉巴尼说。

  普通技术人员,显然不可能有如此丰富的资源。因而,一个真正能够服务于开发者的工具,应当能够消除所有这些繁重的工作,让AI可以为所有应用程序开发人员广泛地访问,提供强大且可靠的深度学习算法和技术。

  拿出自己的真本事

  这一资源的最好提供者,显然就是各大科技巨头。

  而亚马逊就是其中的积极分子之一。上月末,亚马逊推出了多款供开发者使用的人工智能工具,让有志于AI事业的人走到一起,共同铺筑通向未来的路。

  本次亚马逊发布的人工智能工具,包括图像识别服务“Rekognition”,文本转换语音服务“Polly”,以及多个为开发语音应用打造的工具。普通开发者借助它们,就可以构建新一代的应用程序。这些应用程序具有类似人类的智能,可以看到、听到、说话,并与人和他们的环境进行交互。

  可以看到,为了建立起产业生态圈,亚马逊这回真拿出了压仓底的本领,基本涵盖了亚马逊在自然语言理解、语音识别、文本到语音和图像分析技术等方面积累得来的技术能力。

  Amazon Rekognition可让开发者快速、容易地构建应用程序,分析图像,识别人脸、物体和场景。

  该工具使用深度学习技术,自动确定物体或场景,例如汽车、宠物或家具,并提供一个置信度得分,让开发者可以给图像打标签,这样应用程序使用者就可使用关键词搜索特定的图像。还可以在图像内定位面部并探测属性,例如是否在微笑,或眼睛是否是睁开的。

  使用Rekognition,开发者可构建一个应用,评估两张图像中的面部是来自同一个人的可能性,从而能够实时地根据参考照片验证用户。类似地,开发者可创建成百上千万面部(在图像中探测到)的集合,根据其参考图像,在集合中搜索相似的面部。

  Rekognition的意义在于,帮开发者实现了全面的图像分类、探测和管理能力,消除了开发和管理昂贵的图像处理流程所需的复杂性和开销。

  与Rekognition专注于图像不同,Polly是能把文本以语音形式输出的程序。它使开发人员能够轻松地向现有应用程序添加自然语音功能,或创建全新类别的语音功能产品。

  Amazon Polly提供了47个逼真的声音和24种语言支持,开发人员可以选择男性

  和女性的声音与各种口音,使应用程序面向全球用户。流畅的文本内容发音意味着,应用程序可跨多种文本格式,提供高质量的语音输出。

  亚马逊还推出了名为“Lex”的新服务。Lex把亚马逊语音助手Alexa开放给开发者。它能够理解语音输入,方便开发者打造基于语音问答的应用。亚马逊表示,用户可以使用Lex开发聊天机器人和其他支持用户参与的网页和移动应用。用户开发的机器人能够提供信息,支持应用,简化工作活动,或者为机器人、无人机和玩具提供控制机制。

  合纵连横的时代

  虽然亚马逊目前只推出了三款不同的工具,但随着时间的推移,显然将会推出更多的工具,以便更大规模地“圈地”、“吸粉”。

  与亚马逊一样意图做大自家势力的,自然不止一家。

  据美国“连线”网站报道, 谷歌旗下的人工智能研发机构DeepMind实验室,宣布将会开放其3D游戏平台的代码,相关代码将供开发者使用。他们可以通过对外开放平台和源代码,在谷歌的平台上测试自己的人工智能开发水平,以及了解谷歌未来是否有机会采用自己的成果。

  实际上早在去年11月25日,IBM已经宣布免费为外部程序员提供人工智能工具System ML的源代码。Facebook去年2月也开放了该公司的Torch Software人工智能软件的部分内容。微软同样推出了机器学习开源工具包DMTK。

  创新方面,自然少不了“钢铁侠”马斯克。他的OpenAI公司,近期对外推出了一款名为Universe的开源游戏工具平台。第三方开发者可以用OpenAI提供的工具,让自己的软件玩游戏。

  当然,互联网思维的本质之一是“开放”,彼此暗中较劲儿的科技巨头们,也懂得“适时合作”的价值。

  9月末,谷歌携旗下公司DeepMind,联合微软、亚马逊、Facebook以及IBM共同宣布:各方已正式缔结人工智能合作伙伴关系,并已成立名为Partnership on AI的组织(以下简称PAI),以共同摸索AI技术的安全研发之路,并促进公众对AI的正确理解。

  根据谷歌方面介绍,PAI成立后,将“加快对AI技术的研究,并将对该技术的用途和最佳实践方式提出自己的意见”。其主要研究方向包括但不限于:AI可能会对社会伦理、公平公正、社会宽容度以及个人隐私产生的影响;人类与AI协作的可能性;该技术的稳健性、可信性和可靠程度等等。

责任编辑:李阳阳

科普中国APP 科普中国微信 科普中国微博
科技日报
是中国科协为深入推进科普信息化建设而塑造的全新品牌,旨在以科普内容建设为重点,充分依托现有的传播渠道和平台,使科普信息化建设与传统科普深度融合,以公众关注度作为项目精准评估的标准,提升国家科普公共服务水平。

猜你喜欢