2003年,清华大学计算机系一个叫王小斐的研究生,选修了一门神经生物学的课,提交了一份 “把计算机CPU和人脑联在一起”的课程作业,收获了生物学老师这样的评价:“计算机系每隔十年就会来一个你这样的。”
从计算机诞生起,人们就试图通过一些数学分析和计算机模拟方法来研究人类大脑,也因此有了计算机神经科学这一分支,计算机和生物学专家都在利用新工具和跨学科的交叉技术应用,推动脑科学的研究。
让王小斐没想到的是,20年过去,他当年的梦想又迎来了一个新机会。
近日,在杭州的蚂蚁A空间,有个异常烧脑的“基于图计算的脑仿真架构”项目启动会,蚂蚁技术研究院和复旦大学脑科学研究院联合启动了一个全新的产学研融合科研项目,用图计算技术做类脑研究,让人们有了理解大脑的新方式。
一次跨界的新尝试
作为一个既懂计算机又懂神经科学的跨界学者,王小斐是这个项目的牵线人,现在的他是复旦大学脑科学研究院的工程师,而目前担任蚂蚁技术研究院的院长陈文光,也是蚂蚁图计算主要负责人,曾是清华大学计算机系的教授,王小斐和他相识多年。
“小斐有一天在清华门口约我喝咖啡,然后递给我一份论文,说脑的这事儿已经这样了,你这个图计算应该有得搞,能用上。”陈文光回忆说,自己看完后第一感觉:这是好事啊。
另一边,王小斐把自己的想法和复旦大学脑科学研究院高级PI、博士生导师王云沟通,尽管第一次听说“图计算”三个字,但当看到图计算与脑神经网络具有天然的相似性,尤其是图关系的动态可变化与神经突触的生长和可塑性非常相像。王云觉得这将是自己退休前干得最有意义的事情了。
双方都有一种强烈的期待:在这样一个新技术层出不穷的时候,是时候做一些突破性的事情了。
“当然,跨界是一个非常不容易的事情,刚开始我讲的名词陈文光老师不知道,陈文光老师讲的名词我不理解。”王云坦言,好在他们中间有个王小斐。
左起:陈文光、王小斐、王云、朱晓伟
接下来,这个项目将依托复旦大学脑科学研究院神经药理实验室与蚂蚁技术研究院图计算实验室,通过图计算、人工智能与实验神经科学的紧密结合,打造新一代大规模高精度脑仿真系统,为理解生物智能和治疗脑疾病提供新的研究手段,助力尖端科学研究。
用计算机模拟大脑
脑仿真是什么?图计算又是什么?可能很多人看完一头雾水:难道计算机真的可以模拟大脑了?就像科幻影片《超验骇客》在2017年上映时,无数看了该片的人不禁发出疑问:我们有朝一日真的能够将主演约翰尼·德普的大脑上传到计算机中吗?
“我们都知道人的大脑特别复杂,又极其重要,这也是为什么说一个人的脑子只占人身体重量的2%-3%,但它的耗氧量占整个人的20%。“王云给大家科普,人脑的基本单位是神经元,我们的大脑里有约1000亿个神经元,并由约100万亿个神经突触连接,神经元通过这种错综复杂的连接关系,用来传递和处理信息。
我们常说的一朝被蛇咬十年怕草蛇,其原理就是一个一个的神经元信息传递形成了“恐惧记忆”,并影响着我们今后生活中的行为。
一直以来,人类对脑科学前沿的探索从未停止,目前,欧洲、美国和日本等先后启动了“蓝脑计划”“BRAIN计划”等赫赫有名的研究项目,我国也于2021年正式启动“中国脑计划”,世界各国的脑计划已经获取了大量的神经生物数据。
与此同时在技术层面,IBM2014年发表了仿人脑芯片,该芯片拥有一百万个“神经元”以及2.56亿个“突触”,可以短暂模拟大脑活动。同年,日本的“京”超级计算机(K Computer)使用八万三千个处理器,也成功模拟了人类一秒钟脑部活动的百分之一。此前,马斯克也曾宣称已将自己的大脑上传到云端。
然而,当前脑仿真系统常用的架构还是立足于20年前的数据量、计算机能力和生物学对神经的理解。因此,计算神经学需要一个全新的脑仿真架构,来容纳更大量的数据、提供更宏伟的算力,从而实现更精确的仿真和预测。从这个层面来讲,图计算技术先天性的与神经元和脑仿真有相似性,基于图计算技术搭建的高精度脑仿真架构有望为揭示大脑的秘密提供一种新的研究方法和手段。
一个高精度脑仿真架构
一说到图,普通人最常见、最好理解的是一张图片。“但是我们这里的图不是图片的图,而是更类似于知识图谱,一种抽象的数据结构,由两种基本的数据类型组成:顶点和边。”蚂蚁技术研究院图计算实验室研究员朱晓伟解释。举个例子,如果把项目、员工和公司当作三个不同的顶点,这些不同类型顶点之间又有各种各样的关系,员工和员工之间可能是好友,员工可能受雇于某个公司,可能会参与某个项目,这些关系就是边。
作为一种以点和边来构建关联关系的计算模式,图计算最大的优势是可以对大到百万亿规模的点边关系进行动态性和实时性分析。蚂蚁从2015年开始探索图计算,布局了图数据库、流式图计算引擎、图学习等相关技术,打造了世界规模领先的图计算集群。
支付宝作为一个重要的金融工具,在一些刷单、诈骗等黑灰产的风险管控中已经在使用图计算。以互联网场景为例,不良商家常常通过不同的银行卡、熟人来完成刷单或者套现“回路”,纯资金流的数据模式无法看出端倪,但借助图数据模式发现此类闭环模式,提前预防风险。
也正因如此,未来可以尝试通过图计算来高精度还原神经元的结构,模拟生物实验得到数据,并进一步结合生物实验互相验证。王云笑称,一般大家一提到生物学家,第一反应就是“整天研究小白鼠”的,的确关于脑科学的研究如果只是局限在生物实验室,无疑是非常枯燥且低效,但有了高精度仿真大脑的辅助,科学实验将会变得更加高效、快速且低碳。
当人类对自己的大脑研究透彻,那后续的想象空间也将会更大。如疾病的治疗,为药物研究早期靶点筛选提供模型,促进更精细、更高效的药物开发,缩短药物上市时间等。
当然,这一切才刚刚开始。就像蚂蚁技术研究院陈文光所言:“交叉领域很有前景,但科学探索它本身就是一个不确定性的事情,在这个领域到底能产生什么样的结果还很未知,只是说我们在正确的道路上和正确的方向上。”
都市快报·橙柿互动 记者 刘永丽