近日,伴随着2024年诺贝尔奖的陆续揭晓,科学界对这一领域盛事的讨论热度空前。除了奖项两度花落AI之外,最受关注的莫过于诺奖历史上首位“85后”得主——化学奖获得者约翰·江珀了。很多人会疑惑:年纪轻轻,他何以担起诺贝尔奖?这位天才研究的究竟是什么,能助他一举夺得世界所有科研工作者都梦想得到的顶级荣耀?让我们略窥一二。
“85”后诺贝尔奖获得者约翰·江珀
“一把破解宇宙和生命奥妙的钥匙”
北京时间10月9日,2024年诺贝尔化学奖被授予3位对蛋白质结构的设计和预测作出杰出贡献的科学家。其中一半授予美国科学家戴维·贝克(David Baker),以表彰他在“计算蛋白质设计”方面的贡献;另一半授予就职于英国人工智能公司谷歌“深层思维”的两位科学家——德米斯·哈萨比斯(Demis Hassabis)和约翰·江珀(John M. Jumper)(前者是“深层思维”的联合创始人兼CEO,后者是“深层思维”的高级研究科学家),以表彰他们“对蛋白质结构预测的贡献”。
诺贝尔奖委员会评价称,这3位科学家“破译了蛋白质惊人结构的密码”,而这将为人类带来极大益处。贝克成功完成了构建全新蛋白质这一“几乎不可能完成的任务”;而哈萨比斯和江珀则开发了一种名为AlphaFold2的人工智能模型,可以预测蛋白质的复杂结构。
那么,这些研究的重要性从何得知?首先要从蛋白质的作用说起。
蛋白质是生物非常重要的组成成分,是一切生命活动的基础。
长期以来,化学家们一直梦想着全面了解和掌握蛋白质这个“生命的化学工具”。但这个梦想要实现起来难上加难。因为蛋白质通常由20种氨基酸呈念珠状扭曲折叠连接形成独特的三维形状,而形状本身决定了蛋白质的功能——其中一些可以创建肌肉、角或羽毛等,而另一些则可能成为激素或抗体。许多蛋白质形成酶,这些酶以惊人的精度驱动生命的化学反应。位于细胞表面的蛋白质也很重要,它们充当细胞与其周围环境之间的通信渠道……研究它们亦如破解生命的密码。
从20世纪70年代以来,科学家们就试图从蛋白质的氨基酸序列中预测出它的三维结构,但这一目标的难度堪比解开宇宙的奥秘。传统的实验方法(如X射线晶体学、核磁共振光谱和冷冻电子显微镜等)尽管能够提供高分辨率的蛋白质结构数据,但通常耗时、昂贵且具有技术挑战性。此外,这些方法并不是对所有蛋白质(如膜蛋白)适用,限制了其广泛应用。
就像在迷雾中突然亮起了一盏明灯,4年前,哈萨比斯和江珀给我们带来了惊喜——他们推出了一款名为AlphaFold2的人工智能模型。这个模型正如诺贝尔奖委员会评价中描述的:它解决了一个已有50年历史的难题,能够用AI预测大约两亿种已知蛋白质的复杂结构,已被全球190个国家/地区的200多万人使用。
而创造这一佳作的“超级英雄”之一——江珀备受关注,只因为他不仅是AlphaFold模型的主要负责人,更是一位年纪轻轻的天才科学家。他1985年出生于美国阿肯色州小石城。有趣的是,江珀最初对宇宙的无限好奇驱使他学习物理和数学,他在青少年时期就自学了计算机编程,并梦想会“成为一个‘发现宇宙定律’的物理学家”。但当他开始使用超级计算机模拟蛋白质及其动态时,他发现,原来那些探索宇宙的物理知识,竟然可以用来解决关乎人类健康的医学问题,就像是用一把神奇钥匙,不仅可以打开宇宙的大门,还意外地发现了通往生命奥秘的另一扇门。
开启人工智能细胞生物学的新时代
2017年,江珀获得博士学位后获悉“深层思维”正在开展蛋白质结构预测方面的研究,他投递申请后很快成为这个团队小组的重要成员。彼时,“深层思维”公司开发的AlphaFold迟迟未能取得进一步突破,江珀提出了采用新思路改进原有设计。很快,他被提拔为AlphaFold项目主管,和哈萨比斯共同领导开发AlphaFold 2的工作。
在江珀带领下,一个年轻团队对AlphaFold最初版本进行了重新梳理,在此基础上全面调整和改进,对每个细节给予挖掘以期达到尽善尽美。比如,他们引入空间立体结构和进化理念;整合已有蛋白质结构的详细信息如原子半径和键角等;完善机器有效学习策略以利于从有限数据中提取最大信息;特别是抛弃传统算法的束缚,更强调空间靠近而非线性相邻等。
2021年7月15日,详细描述AlphaFold2内容的论文在《自然》期刊在线发表立即引起科学界轰动。这项成就被《科学》期刊评选为2021年度十大科学突破之首,当年全世界各种“十大科学进展”评选也不约而同将AlphaFold列为榜首,这也是多年来少有的。
2021年,“深层思维”在《自然》上发表论文并开源了AlphaFold 2模型
AlphaFold2体现了江珀独特的创造性。它能通过深度学习模型直接从氨基酸序列预测蛋白质的三维结构,大幅提高了预测的准确性和效率。其预测结果的平均准确率达到了92.4%,几乎与实验结果相媲美。值得一提的是,与以往科学家获得一个蛋白质结构通常需要数年时间不同,有了AI的加持,同样的实验现在只需几分钟就能完成!这实在是令人惊叹。
那会儿,36岁的江珀就被科学家们预测迟早会获得诺贝尔奖,只是很多人没想到预言这么快就能成真。也没想到,他获得的不是生理学或医学奖,也不是物理学奖,而是化学奖。
今年5月,“深层思维”又推出了新一代产品AlphaFold 3,它能够以更高的精度预测蛋白质、DNA、RNA,以及小分子等生命分子的结构,包括抗体-抗原的相互作用等,这在以前是很难实现的。这些进步使得AlphaFold在生物医药研究领域具有潜在的“戏剧性”影响,可能会加速新药的开发和蛋白质工程领域的创新,进而开启人工智能细胞生物学的新时代。