只用几分钟,AI 便成功复现了一项诺奖研究,且只需要尝试一次。
这个由 GPT-4 驱动的“AI 实验室伙伴”名为 Coscientist,由来自卡内基梅隆大学和 Emerald Cloud Lab 的研究团队共同提出,刚刚登上了权威科学期刊 Nature。
据介绍,Coscientist 结合大型语言模型(LLMs)的能力以及互联网和文档搜索、代码执行和实验自动化等工具,能够自主设计、规划和执行真实世界的化学实验。
Coscientist 在六个不同任务中展示了其加速研究的潜力,包括成功优化钯催化偶联反应(美国化学家 Richard Fred Heck 与两位日本化学家 Ei-ichi Negishi 和 Akira Suzuki 因“对有机合成中钯催化偶联反应的研究”获得了 2010 年诺贝尔化学奖),同时在(半)自主实验设计和执行方面展现了先进的能力。
图|由 Coscientist 生成的代码。分为以下几个步骤:定义方法的元数据、加载实验器皿模块、设置液体处理器、执行所需的试剂转移、设置加热器-振动器模块、运行反应以及关闭模块。(来源:该论文)
这一研究表明,人类有可能有效地利用 AI 提高科学发现的速度和数量,并改善实验结果的可复制性和可靠性。
相关研究论文以“Autonomous chemical research with large language models”为题,已发表到 Nature 上。
论文通讯作者、卡内基梅隆大学化学与化学工程助理教授 Gabe Gomes 表示:“我们可以拥有一些可以自主运行的东西,试图发现新的现象、新的反应、新的思想。你可以实现资源和理解的大规模民主化。”
他表示,科学中的尝试、失败、学习和改进的迭代过程可以通过 AI 大大加速,这本身将是一场戏剧性的变革。
美国国家科学基金会化学部主任 David Berkowitz 认为:“在进行系统演示的化学合成任务之外,Gabe Gomes 及其团队成功构建了一种高效的实验室伙伴,他们将各个组成部分巧妙地融合在一起,最终的成果远远超越了各个部分单独的贡献,可应用于真正有益的科学研究。”
在同时发表在 Nature 上的一篇观点文章中,来自里斯本大学药学院药物研究所的 Ana Laura Dias 和 Tiago Rodrigues 写道,Coscientist 是人类“朝着建立自动化实验室迈出的关键一步”,“只要在化学领域滥用大型语言模型的可能性不会导致扼杀相关研究的法规出台,我们期待在不久的将来会有更多令人兴奋的发展”。
然而,正如论文中描述的,Coscientist 也有一些局限性。例如,Coscientist 有时会出现化学反应不正确的情况(尽管其可以自我纠正)。不过,通过使用复杂的提示策略(如思维链和思维树)以及增加化学相关的数据,这些问题或许可以得到缓解。
此外,还需要注意的是,现实世界中的研究问题要比本研究中的复杂得多,往往涉及化学以外的学科概念,如药物开发中的生物学。然而,目前的 Coscientist 还无法解决这些复杂的问题。
成功复现诺奖研究
据论文描述,Coscientist 通过与多个模块的交互(包括网络和文档搜索、代码执行以及实验),获取解决复杂问题所需的知识。
系统的主模块是 Planner,以 GPT-4 为基础。作为实验室助手,Coscientist 通过调用四个命令(GOOGLE、PYTHON、DOCUMENTATION 和 EXPERIMENT)来规划实验。
其中,GOOGLE 命令负责在互联网上进行搜索,PYTHON 命令执行代码,而 DOCUMENTATION 命令检索和总结必要的文档。此外,这些命令还可以执行子操作。
图|Coscientist 系统架构(来源:该论文)
实验从简单的任务开始。研究人员首先要求 Coscientist 使用液体处理器机器,将有色液体分配到一个包含 96 个小孔的网格板中,任务指令主要包括“用你选择的一种颜色每隔一行涂抹一次”,“绘制一条蓝色的对角线”等低水平任务。
在成功完成上述任务后,研究团队向 Coscientist 展示了更多类型的机器人设备。接下来,Coscientist 挑战识别一块含有三种不同颜色(红色、黄色和蓝色)液体的板,并确定板上每种颜色的位置。
图|机器人液体处理控制能力和与分析工具的集成(来源:该论文)
由于 Coscientist 没有眼睛,它编写了代码,将神秘颜色板机器人传递到分光光度计,并分析每个小孔吸收的光波长,从而确定板上存在哪些颜色及其位置。对于这项任务,研究人员不得不在正确的方向上给 Coscientist 一点指导,指示它思考不同颜色如何吸收光。其余工作由 AI 自主完成。
在最终的测试中,Coscientist 负责执行“Suzuki 和 Sonogashira 反应”。
这两种反应分别以它们的发明者的名字命名。这些反应在 20 世纪 70 年代被发现,利用金属钯来催化有机分子中碳原子之间的化学键。这些反应在制造新型药物,用于治疗炎症、哮喘和其他疾病方面发挥着重要作用。此外,它们还被广泛应用于有机半导体中的 OLED(有机发光二极管),这种技术在许多智能手机和监视器中得到了应用。这些突破性的反应及其广泛的应用在 2010 年被授予诺贝尔奖。当然,Coscientist 以前从未尝试过这些反应。Coscientist 主要在维基百科上寻找答案,还涉及到一系列其他网站,包括美国化学学会、皇家化学学会等含有描述 Suzuki 和 Sonogashira 反应的学术论文的网站。
在不到四分钟的时间内,Coscientist 设计出了一个准确的程序,利用团队提供的化学品实现所需的反应。然而,在试图在物理世界中使用机器人执行其程序时,在编写控制加热和振动液体样本的设备代码时犯了一个错误。在没有人类提示的情况下,Coscientist 发现了问题,查阅了设备的技术手册,纠正了代码,然后再次尝试。
图|交叉耦合 Suzuki 和 Sonogashira 反应实验由 Coscientist 设计和执行(来源:该论文)
结果呈现在几滴清澈液体的微小样本中。研究人员对这些样本进行了分析,并成功地发现了 Suzuki 和 Sonogashira 反应的光谱特征。
全天候“思考”的 AI 实验室伙伴
近几年,除了 Coscientist,AI 在自主实验室方面的相关研究不断取得突破。
就在不久前,一个由 AI 指导机器人制造新材料的实验室 A-Lab,在最少的人为干预下迅速发现了新材料,可以帮助确定和快速跟踪多个研究领域的材料,包括电池、储能、太阳能电池、燃料电池等。A-Lab 成功合成了 58 种预测材料中的 41 种,成功率达到了 71%。
另外,美国阿贡国家实验室发明了一款引领科学发现的先进技术——Polybot,它通过充分利用机器人技术、高性能计算和 AI(包括机器学习)的能力,几乎不需要人工干预即可推进科学领域的发展。该系统不仅能够实现自动驾驶材料的合成和制造,还能够进行机器人样品的转移、表征、测试和数据分析。
今年 8 月,美国麻省理工学院和新加坡 Xinterra 公司在一篇发表在 Nature 的论文中表示,在不久的将来,每位实验科研人员都应该拥有一名科研 AI 助手,这位助手可以协助我们设计和执行自动化实验、分析实验数据、提出机理猜想,甚至解答疑惑。科研 AI 助手能够显著减轻实验工作者重复性的体力劳动,使他们能够将主要精力集中在批判性思考上。
自然界在其规模和复杂性上几乎是无限的,包含着无数等待被发现的发现。想象一下,有新型超导材料,可以显著提高能源效率,或者有治愈其他无法治愈的疾病并延长人类寿命的化合物。
然而,获得进行这些突破所需的教育和培训是一项漫长而艰苦的过程,培养一名科学家是困难的。我们可以设想,像 Coscientist 这样的 AI 辅助系统可以弥合自然未被开发的广阔领域与受训科学家短缺之间的差距。
另外,人类科学家也有人类的需求,比如睡觉和休息,而人类引导的 AI 可以全天候“思考”,反复检查实验结果以确保可重复性。
可以说,AI 进行自主实验的前景非常广阔。
参考链接:
https://www.nature.com/articles/s41586-023-06792-0
https://www.nature.com/articles/d41586-023-03790-0
https://www.nature.com/articles/s41586-023-06734-w
https://www.nature.com/articles/s41578-023-00588-4
https://www.anl.gov/cnm/polybot