知识图谱：我们什么时候才能相信AI专家？-

从很久以前开始，人类对人工智能的终极幻想之一，就是有一个无所不知，知无不言的天才机器人，可以回答人类的任何问题。从70年代的《星球大战》到21世纪的《钢铁侠》，我们都能看到这种全能智能助手的身影。

因此，人工智能的先驱们希望可以对人类的知识系统进行建模，让机器可以理解人类的知识，回答问题，这被称作专家系统。

图片来源：pixabay

一、知识编码的符号学派

他们首先思考的问题是，知识到底是什么，怎样才能把知识编码成计算机可以理解的文件格式？他们相信，人类的知识体系其实就是把无数实体和它们的关系组合起来。这样，就能通过专家系统完成知识检索和逻辑推理任务了。

实体，是指世界上的事物以名词的形式出现在人类语言里。关系，就是这些事物之间的各种抽象或现实的关系，比如A和B是同事，或者狗是哺乳动物的一种。这些试图通过实体和关系的符号来表示知识的科学家后来被称为人工智能的符号学派。

符号学派的学者们还发明了一种新的程序语言Prolog来解决专家系统的建模问题。在那时，关系型数据库还没有出现。因此，Prolog很像是现代程序语言和现代数据库的某种结合体：它既是一种程序代码，也能储存实体之间的关系。

举个例子，在Prolog里，你可以定义具体两个实体的关系：

【[实体：小王][关系：喜欢][实体：小李]

[实体：小李][关系：喜欢][实体：小王]

[实体：小张][关系：喜欢][实体：小李]】

然后，还可以通过组合简单的关系定义复杂的逻辑，例如：

【[新关系：好朋友]：[A喜欢B]而且[B喜欢A]

[新关系：单相思]：[A喜欢B]】

第一个做出相对成熟专家系统的是爱德华·费根鲍姆。他的老师是当时在卡耐基梅隆学院的人工智能的先驱之一司马贺。随后他来到斯坦福大学做教授，继承了司马贺的符号主义传统。

在斯坦福，费根鲍姆和一名化学家合作，把化学家们理解的知识提炼成可以输入计算机的规则，并开发了第一个相对成熟的专家系统DENDRAL。DENDRAL可以根据化学实验数据推断出化合物的结构。

此后，一些类似的专家系统也出现了，比如医学专家系统MYCIN，地质勘探专家系统PROSPECTOR，语音理解系统HEARSAY。

二、伟大宏图的失败

时间来到20世纪80年代，费根鲍姆已经不满足于垂直领域的专家系统了，他希望能建立一个包含人类所有知识的专家系统。

恰好那时，美国政府也在担心当时日本的“第五代计算机计划”，专门牵头成立了一家公司用来开发通用知识系统。这家公司名为微电子和计算机技术公司，简称MCC。

公司由美国海军上将波比·英曼负责。费根鲍姆向英曼推荐了他最有才华的学生道格拉斯·雷纳特，开启了一个新项目，试图把人类的所有常识编码，建成知识库。这个新项目叫Cyc，取自英文单词“百科全书”（encyclopedia）。

雷纳特预测，要让Cyc成为一个有用的专家，需要向其中编码25万条规则，相当于35个程序员工作10年。于是雷纳特雇了35个工程师，他们每天的工作就是把教育、商业、娱乐和体育领域的各种生活常识编码成规则，输入到Cyc系统里。

雷纳特在1984年预测，15年后，每台电脑里都会装上Cyc。但他们的方法却存在显而易见的问题。首先，纯粹依靠人工输入规则速度太慢，成本太高。世界上每天都在发生很多事情，人类的知识也在不停增加，手工知识库增长速度完全无法跟上。

另外，如果我们仅仅依靠人工来设置规则，会发现规则数量越来越多。例如，如果发现新输入的知识和以前的知识有矛盾怎么办？如果新输入的知识适用范围不同怎么办？这些情况都需要设置新的规则，而且这些规则与已有规则不能有矛盾。于是，规则系统越来越复杂，也越来越脆弱，很容易让整个系统崩溃。因此，虽然直到今天雷纳特仍然在不停地完善他的Cyc系统，但他的工作和产品早已不是行业主流。

Cyc的失败成为了从70年代开始到90年代初的专家系统时代告一段落，某种意义上，这甚至导致了第二次人工智能寒冬的开始。从那时开始，所有科研人员如果说自己是研究人工智能的，就拿不到科研经费。

三、连接学派的复兴

本来，专家系统已经鲜被提及，但符号学派的失败却意外被曾被自己压制的连接学派拯救。在互联网时代，无数用户自发贡献了大量的知识数据，并储存在了互联网上。维基百科就是这样的例子。

另外，深度学习可以非常精准地从文字段落中抽取出实体名和实体之间的关系，因此避免了大量的人为构建。在这样的条件下，大规模知识系统才成为了可能。

2012年，谷歌开始把它们的知识系统应用于实践，并起了一个新名字“知识图谱”。今天我们打开搜索引擎，搜索一个实体，比如达芬奇，就能看到他的出生和去世日期，父母姓名，主要作品等。

同时，我们也可以直接在搜索引擎里直接问一个问题，例如世界上最长的河流是什么？搜索引擎也会根据知识图谱给出正确答案。

现在，研究知识图谱的科研人员还有一个重要的课题，就是如何把知识系统灌输到现在非常流行的大模型中，避免它们“一本正经的胡说八道”。其实，目前应用广泛的深度学习可以类比为人的感知系统，而知识图谱可以类比为认知图谱。很多人工专家认为，只有结合了机器的感知和认知能力，真正的人工智能才能实现。

文章由科普中国-星空计划（创作培育）出品，转载请注明来源。

作者：管心宇科普作者

审核：于旸腾讯玄武实验室负责人