[科普中国]-聊天机器人-

聊天机器人（Chatterbot）是经由对话或文字进行交谈的计算机程序。能够模拟人类对话，通过图灵测试。

聊天机器人可用于实用的目的，如客户服务或资讯获取。有些聊天机器人会搭载自然语言处理系统，但大多简单的系统只会撷取输入的关键字，再从数据库中找寻最合适的应答句。目前，聊天机器人是虚拟助理（如Google智能助理）的一部分，可以与许多组织的应用程序，网站以及即时消息平台（Facebook Messenger）连接。非助理应用程序包括娱乐目的的聊天室，研究和特定产品促销，社交机器人。

简介聊天机器人（chatterbot）是一个用来模拟人类对话或聊天的程序。“Eliza”和 “Parry”是早期非常著名的聊天机器人。它试图建立这样的程序：至少暂时性地让一个真正的人类认为他们正在和另一个人聊天。

Chatterbots已应用于在线互动游戏Tinymuds。一个单独的玩家可以在等待其他“真实”的玩家时与一个chatterbot进行互动。目前至少有一个公司正在制造一种产品，这种产品让你建立一个chatterbot以便用来掌握相关市场或关于你网站的其它问题。不难想象两个chatterbots互相交谈甚至互相交换关于自身的信息，如此一来，他们的对话将会变得更为复杂。（看看人工智能就会知道这个想法如果实现了会引起怎样的惊慌）。当然，他们可以使用更多普通的聊天缩略词。

盛行缘由说白了，聊天机器人产生的原因是，研发者把自己感兴趣的回答放到数据库中，当一个问题被抛给聊天机器人时，它通过算法，从数据库中找到最贴切的答案，回复给它的聊伴。

此外，聊天机器人的成功之处在于，研发者将大量网络流行的俏皮语言加入词库，当你发送的词组和句子被词库识别后，程序将通过算法把预先设定好的回答回复给你。而词库的丰富程度、回复的速度，是一个聊天机器人能不能得到大众喜欢的重要因素。千篇一律的回答不能得到大众青睐，中规中矩的话语也不会引起人们共鸣。此外，只要程序启动，聊士们24小时在线随叫随到，堪称贴心之至。

进展早期经典的聊天机器人是 ELIZA (1966)与 PARRY (1972)。近期值得注意的则包括 A.L.I.C.E.，Jabberwacky，以及 D.U.D.E。虽然 ELIZA 和 PARRY 仅仅用于模拟笔谈，现在许多聊天机器人纳入游戏及网络搜寻的功能。1984年，《警察的胡子造了一半》(Policeman's Beard is Half Constructed)出版，据称作者是聊天机器人“瑞克特”(Racter)。1

相关的人工智能领域是自然语言处理。通常“弱人工智能”(Weak AI) 领域使用专门的软件或编程语言以完成特定的功能。例如 A.L.I.C.E.使用一种叫做 AIML 的标记式语言，适用于谈话代理的功能，并且已被各类开发人员采用，他们的产品叫做爱丽丝机器人(Alicebots)。不过 A.L.I.C.E.仍是纯粹运用类型配对的技巧，缺乏思考能力，跟1966年的 ELIZA 并无不同。“强人工智能”(strong AI) 则不同, 必须有智慧和逻辑推理的能力。

Jabberwacky 基于与使用者的即时互动，习得新的对答和语境，而不是驱动于静态的数据库。一些较新的聊天机器人也融合了即时学习与进化算法，根据每次聊天的经验，改善沟通的能力，一个著名的例子是“凯尔”(Kyle) ——2009年里奥迪斯 (Leodis) 人工智能奖得主。不过，至今通用型的谈话人工智能仍不存在，有些软件开发人员专注于实用方面：资讯检索。

“聊天机器人”竞赛聚焦于图灵测试或者更特定的目标。其中的两个年赛为“罗布能奖” (The Loebner Prize) 和“话匣子挑战赛” (The Chatterbox Challenge)。

种类TalkBot

最初作为一个在线聊天系统，TalkBot 是克莉斯·克沃特于1998年用javascript 和PERL语言编写完成的，并于2001年和2002年两次获得“Chatterbox Challenge”比赛的冠军。

Elbot艾尔伯特

在德语聊天机器人查理的程序改进后诞生了艾尔伯特，2000年底德语版艾尔伯特就开始在线聊天，并且到了2001年连英语版也有了。在2003年获得“Chatterbox Challenge”比赛冠军。

eLise伊莉斯

讲德语的聊天机器人。伊莉斯由Java分子编辑器前端、Java服务器以及一种知识编辑器组成。其中，知识程序包括了1100多节点，而且还在不停升级。

Alice艾丽斯

1995年11月23日，艾丽斯Alice诞生了。艾丽斯的名字是由英文“人工语言在线计算机实体”的头一个字母的缩写拼成。科学家华莱士将这个聊天程序安装到网络服务器，然后待在一边观察网民会对它说什么。随着华莱士对艾丽斯的升级与艾丽斯聊天经验的日渐丰富，艾丽斯越来越厉害。2000年、2001年、2004年艾丽斯三夺勒布纳奖。艾丽斯是乔治的强劲对手，曾一度被认为是最聪明的聊天机器人。

Laylahbot蕾拉伯特

由原始的艾丽斯程序改头换脸而来。整个程序和华莱士在2002年编写的艾丽斯的程序基本没什么差别。蕾拉伯特的存在是试图对基本的“人工语言在线计算机实体”聊天机器人的性能、功能提供一个范本。

爱情玩偶

一个可以领取机器人，打造自己的聊天机器人，名字，和图片可以自己添加。也算国内比较好玩点点了的聊天机器人。玩家也可以自己是调教他的对话。缺点也很明显，因为语言部分是联通的，所以违和感极强……

使用于对话系统聊天机器人通常整合于对话系统，例如虚拟助理，使其能够在其主要的专家系统的范畴之外进行闲聊等等。

通讯平台目前聊天机器人广泛运用于即时通讯平台，例如脸书 Messenger，WeChat，LINE和 Kik，以娱乐、零售行销、以及客服为目的。此外，即时通讯平台提供易于整合的webhook，使得第三方开发商易于可通用于不同通讯平台之聊天机器人。这些软件机器人以客服的身份出现或是成为团体聊天的一员。有些即时通讯的机器人可以连接外部数据库，提供使用者新闻，气象，导航，电影放映时间，股价等资讯。达美乐、必胜客、迪士尼、Nerdify、雅玛多 Line、全食超市都已推出各自的聊天机器人，以便与终端消费者增进交流，推销公司的产品与服务，并且让消费者订货更加方便。2016年，观光业的一些旅行社和航空公司透过 Messenger 推出了聊天机器人的服务，墨西哥航空利用人工智能售票、回答问题，墨航和荷兰皇家航空并且提供航班资讯，处理乘客报到，发出行动登机证，推荐旅馆、餐厅、目的地行程。中国的旅行社在此之前已用 Wechat 提供这些服务。

教育有些聊天机器人，例如 Nerdify 开发的 Nerdy Bot，针对大中小学生面对的问题，让学习更简单又有效率。该软件利用脸书 Messenger 即时回答学生作业相关的问题以便加速学习。加大尔湾分校图书馆的聊天机器人 ANTswers，2014年开始试用，被认为非常成功。2

各种疑问如何评判一个机器人是否足够智能。

旁观者大多认为一个机器人能够回答的问题多，可以视为较智能，而不论是什么数据结构或算法的机器人，只要堆砌足够大的数据，在回答问题方面都能做到较为相近的正确率，显然，能够回答的问题数量只是代表了这个机器人后台的数据库是否足够大。

而智能不应是比较谁的数据库足够大，智能是多方面的体现：

1、学习能力

这是最根本，也是最难以提升的一条标准，一个可以自动成长、但数据量很小（能够回答的问题较少）的机器人显然是比一个不能自动成长、但数据量庞大（能够回答的问题较多）实用。机器人的本质是帮助人类，减少人类在各个领域的劳动量，如果一个机器人需要人工录入所有的知识，这本身就增加了人类的负担，是与制造机器人的初衷所违背的，这也是当前聊天机器人虽然较热，但应用较少的一个根本原因。

2、数据筛选能力

在拥有了自学习能力之后，机器人是对知识照单全收，还是有选择的学习较为正确的知识，是进一步评判机器人智能程度的一个标准。

如果机器人只能对知识照单全收，这个学习能力是不完整的，机器人还应或多或少拥有筛选能力。

3、自升级能力

在机器人按照设计者的数据结构、算法做到了自学习，并且拥有了一定程度的知识筛选能力之后，自升级能力会成为下一个堡垒。

学习能力的本质是按照设计者的算法将输入数据结构化为这个机器人的数据组织结构。

当“按照初始算法去结构化各类输入数据”之后，经过统计，发现这类规则不能适应某类知识组织形式或某领域知识时（错误率提高），设计者们应考虑如何让机器人尝试调整算法规则和数据组织结构以使得在错误率较高的知识组织形式或领域降低学习的错误率。

而很多早年出现的各类中文机器人，由于使用的都是最原始的“关键词匹配”方式，并没有数据结构的概念，是不应列入“智能聊天机器人”的范畴。

以下是A和J的一段对话：

1-A：你做梦么？

2-J：做。

3-A：当然。那么，你能记住你的梦么？

4-J：我能非常清晰生动地回想起它们。

5-A：是怎么样的？

6-J：我还不想跟一个机器人调情

很明显，机器是可以有“记忆的”。

如果没有长时记忆体，根据第2句：做。如何能够产生第3句？

如果没有长时记忆体，A是不会知道第2句的“做”是指的做什么，而第3句却精确的继续围绕“梦”的话题在讨论，说明A是有长时记忆体的。

飞信助手同样还没能在这方面更进一步，它只能对一句话做出快速反应，而没有连贯的思维能力和逻辑能力。距离真正的人工智能，飞信助手还只能称得上是小把戏，本质上它没有主动思考联想和记忆的能力。正如获得勒布纳奖铜奖的罗伯茨所说：“我并不深信图灵的理论，也不相信艾尔博特能思考。”作为艾尔博特的创造者，他打比方说，“如果你知道一种魔术秘密何在，明白它如何完成，它对你来说就不再神秘。”

但是它又确实代表着一种方向，在一定意义上，飞信助手相当于一个网络搜索引擎，负责网络信息的自动搜索、查询和处理，只是，它更亲切形象化，更符合人际交流习惯。飞信助手们的出现，似乎也有另一层意义，它展现出来的聪明与狡黠，会不会意味着——我们人类的思维和语言也许没有这么难模仿？会不会意味着——人类的语言习惯可以被总结复制，然后再将这个规律用在人类身上？

再进一步想象一下，或许某一天，电影《黑客帝国》里的场景真的会出现。人类制造了机器人，机器人却叛变，与人类爆发战争。会思考的电脑控制了人脑，人类则在电脑的欺骗下生活？

2014年，国内首个人工智能公司北京光年无限科技有限公司推出了图灵机器人，是中文语境下智能度较高的机器人大脑，是全球领先的中文语义与认知计算平台。

图灵机器人对中文语义的理解准确率高达90%，可为智能化软硬件产品提供中文语义分析、自然语言对话、深度问答等人工智能技术服务。

图灵机器人要应用场景包括智能客服、虚拟机器人、智能手表、智能车载和智能家居。其中虚拟机器人可接入微信、QQ等平台，搭建聊天机器人，与用户流畅交流。图灵机器人提供自然的中文对话能力，精准的中文语义分析能力，准确判断用户意图，同时还具有丰富的上下文场景及强大的自我学习能力。

本词条内容贡献者为:

王沛 - 副教授、副研究员 - 中国科学院工程热物理研究所