人工智能(AI)再次超越了人类,这一次,是在改造蛋白质方面——
人类科学家可能耗费 6-12 个月才能完成的任务,AI 只需要几周时间,且无需人类干预、反馈或主观判断。
这是一个能对蛋白质进行工程改造的、由 AI 驱动的全自动机器人——SAMPLE,由来自威斯康星大学麦迪逊分校(University of Wisconsin–Madison)的研究团队提出,是对无需人类干预的蛋白质设计和构建的一次概念验证。
相关研究论文以“Self-driving laboratories to autonomously navigate the protein fitness landscape”为题,已发表在 Nature 子刊 Nature Chemical Engineering 的创刊号上。
研究团队表示,SAMPLE 自动化并加速了科学发现过程,对蛋白质工程和合成生物学领域具有重要意义。
AI智能体,改造出了耐热性更好的酶
蛋白质是地球上一切生命的物质基础,参与细胞活动的每一个进程。
蛋白质设计,能够创造出具有特定功能和特性的新蛋白质,已广泛应用于生物技术、化学和医学等领域,比如:
开发新型药物和疗法,特别是在癌症、心血管疾病、遗传病治疗等领域,也有助于疫苗的研发和个性化医疗;
创建用于生物制造的酶和其他生物催化剂,将原料高效地转换为有用的产品,如生物燃料、药物或食品成分;
提高农作物的抗病性、抗旱性和营养价值,进而提高农业生产力和食品安全;
降解环境中的污染物,如重金属和有机污染物;
构建新型生物材料,如用于医学工程的生物兼容材料,或具有独特物理特性的高性能材料;
帮助科学家深入理解蛋白质的结构和功能关系,推动生物化学、分子生物学等领域的发展。尽管蛋白质工程(Protein engineering)的应用潜力巨大,但创造一种具有改进或新功能的新型蛋白质,仍然是一个重复且费力的过程,人类科学家有时甚至需要耗费多年时间。
在生物系统的研究过程中,科学家通过假设生成、设计实验验证假设、在实验室进行实验并解读数据来加深对系统的理解,然后再反复迭代这一过程,从而逐步揭示生物机制并设计出性能和行为更优的新系统。
如今,AI 被用于自动化完成各行各业的工作,但由于生物性状和实验的复杂性,开发一个不休息、自动对蛋白质进行工程改造并能从产生的数据中学习的全自动系统,依然是一个难题。
据介绍,SAMPLE 由一个 AI 智能体驱动,可以学习蛋白质序列与功能之间的关系,设计新的蛋白质,并将这些蛋白质发送到一个完全自动化的机器人系统中,该系统实验性地测试所设计的蛋白质,并提供反馈,从而提高 AI 智能体对系统的理解。
图|SAMPLE,一个完全自主的蛋白质工程系统。
为了测试该系统,研究人员使用 4 个 SAMPLE 智能体分别改造出了耐热性更好的糖苷水解酶。尽管搜索行为不同,每个 SAMPLE 智能体最终都能发现热稳定性更好的酶,比最初的起始序列至少稳定 12°C。
图|4 个 SAMPLE 智能体自主发现热稳定性更好的酶。
一个通用的蛋白质工程平台
研究团队表示,SAMPLE 是一个通用的蛋白质工程平台,可广泛应用于生物工程和合成生物学领域。
尽管他们只展示了该系统在热稳定性工程中的表现,但同样的方法也可用于改造酶的活性、特异性,甚至创造自然界中未曾有过的化学反应。
与定向进化一样,该系统不需要事先了解蛋白质结构或机理,而是采用一种无偏见的方法,研究序列变化如何影响功能。
然而,研究团队也指出,为新的蛋白质功能建立 SAMPLE 的最大障碍是所需的生化检测。这项工作中使用的机器人系统只能使用微孔板阅读器,因此需要基于比色或荧光的检测方法。
原则上,更先进的分析仪器,如液相色谱-质谱联用仪或核磁共振光谱仪,可以集成到自动化系统中,从而扩大可设计的蛋白质功能类型。
另外,获取资源延迟、机器人故障和系统宕机,也可能会影响该系统研发蛋白质的总耗时。
目前,研究团队在 Strateos 云实验室上实施了完整的实验流程,创造了一个经济高效、易于使用的系统,可供其他合成生物学研究人员采纳。
未来,诸如 SAMPLE 这样的自主实验室将彻底改变生物分子工程和合成生物学领域,使效率低下、耗时费力的蛋白质工程活动自动化,使得科研人员更加专注于重要的下游应用。
随着深度学习、机器人自动化和高通量仪器的不断发展,用于科学发现的智能自动化系统将变得越来越强大。
论文链接:
https://www.nature.com/articles/s44286-023-00002-4