版权归原作者所有,如有侵权,请联系我们

清华大学张学工教授:未来智能医健之路—数基生命系统

中国人工智能学会
原创
我国智能科学技术领域唯一的国家级学会
收藏

摘 要:对生命和智能的探索是世界科技的重要前沿,智能技术与医疗健康事业是国民经济的主战场和国家重大需求, 发展智能医疗健康技术是保障和提高人民生命健康的必由之路。我们提出,实现对生命全方位跨尺度数据感知和数 字化建模,实现对生命机理从微观到宏观的全方位数学化理解,建立以信息空间中人体数字孪生为核心的数基生命 系统,是未来生命科学研究的新范式和智能医疗健康发展方向。

关键词:数基生命系统;人体数字孪生;智能健康;智能医疗

0 引言

对生命的认识和对健康的追求,是人类长久以来不懈探索的共同目标。古埃及时期对人体解剖结构的探究拉开了对人体分解式研究的序幕,中国古代在公元前5世纪前后形成了以“望闻问切”观察为基础的对人体系统的认识。1674年显微镜用于医学观察,1816年诞生了听诊器,开始了人类利用仪器设备对人体进行观察的历程。这个历程随着现代科学技术革命在20世纪前后得到快速发展,1895年伦琴发现 X 射线,1913年和1929年先后诞生了心电图和脑电图观测技术,1953年发明了医用超声技术,1971年诞生了医用计算机断层成像(CT)和医用磁共振(MRI)技术……这些对人体生理和病理信息进行临床观测的技术,协同20世纪一系列新的药物和手术治疗技术,以及工农业生产和公共卫生事业的发展,共同推动人类预期寿命从20世纪初的三四十岁提高到了21世纪的七八十岁。

与此同时,人们对生命机理的探索也不断深入。1865年孟德尔发现了基本的遗传定律,1869—1902年 期间人们陆续发现了DNA、RNA、蛋白质和染色体,1953年DNA双螺旋结构的发现,确定了DNA为生物遗传物质的基本载体。1968年,吴瑞(Ray Wu)测得第一个DNA 序列,开启了人类读取基因组信息的征程。1990—2003 年完成的人类基因组计划,建立了人类全部遗传信息的参照图谱,推动了一系列生物组学技术发展,使针对个体组学特性开展精准医疗成为可能。单细胞测序技术推动下的人类细胞图谱计划,旨在解密各组织器官中各种细胞类型的分子特性,将是人类探索生命机理道路上又一个里程碑。

人类生命科学和医学研究取得了巨大进展,但随着人民平均寿命增加和对健康生活追求的提高,医疗健康事业仍面临着巨大挑战。在我国,国民死亡首因的心脑血管疾病发病率、死亡率居高不下,恶性肿瘤发病率、死亡率仍在上升,地区间、医院间医疗资源和质量差距显著,院外健康管理和康复存在巨大缺口。医疗健康事业面临发展不充分、不平衡的两大挑战——对生命机理的认识和医疗健康技术发展尚不充分,优质医疗资源发展极不平衡。

1 智能医健的关键:信息获取、理解与呈递

进入新世纪以来,智能技术在多个领域的成功应用,使人们对智能医健寄予极大希望,认为是解决两大挑战的法宝。但需要清醒的看到,医疗健康面临的关键问题是多方面的:有些问题在顶级医院可以做好但技术发展不平衡,以机器学习为代表的智能技术可以发挥很大作用;有些问题尤其是一些更根本性的挑战,是人类自身认识尚不可及的,当前的机器学习与人工智能技术无从学起,需要发展综合信息技术、生物技术、医学技术、智能技术的新研究范式。

全方位、跨尺度地获取人体多维度信息,是认识生命与健康的基础。现代临床医学检测技术,提供了对人体多方位、多尺度的表型信息观测;以高通量组学技术为代表的现代生物学技术,可以提供器官和组织样本单细胞、单分子分辨率的基因型和分子表型观测;近年来快速发展的各种可穿戴和可植入设备,有望能提供对人体实时的生理信息检测。这些技术还有很多方面不完善,当今物理学、化学、材料科学、微纳电子技术和人工智能技术等的新发展,正在不断催化出新的信息检测技术,将使生命健康信息获取技术体系日益成熟和完备。

信息获取是基础,对信息内含规律和机理的理解是认识生命的关键。人类已经积累了大量生物和医学知识,但这些知识很多是分散的、局部的、定性的,大部分知识尚未上升到能用数学模型描述的程度。在数据和知识的基础上,完善对复杂生命现象和规律的定量理解,建立生命的数学模型,是发展未来智能医健的关键。

信息获取和理解的重要性是不言而喻的,而信息在医疗健康实践中的有效呈递,是同样重要却容易被忽略的问题。医疗健康实践中另一个重要挑战是,医疗决策所需的信息和知识已越来越超出平均的人类医生能有效掌握的程度,随着更多信息获取技术的发展和对生命机理认识的不断深化,这一矛盾将更加突出。图1示意了当前医疗实践中对信息的呈递情况:当前科学研究只回答了关于生命健康的部分问题,这些研究中只有部分转化为有临床应用潜力的原理,其中只有部分能成为可临床应用的药物、技术和设备;由于技术复杂性、医院及医生能力、医疗成本等原因,其中只有部分能到达具体的病人;而由于病人个体差异和依从性等原因,病人最终受益又一次被打折扣。这一现状说明,把信息全部集中到临床医生进行决策实施的现有医疗范式已遇天花板难题,需寻找更有效的信息呈递和应用范式。

图 1 现代生命科学和医学的患者可及性示意图

2 数基生命系统:未来智能医健解决方案

基于对医疗健康关键问题的分析和多年的生物与医学信息学研究,我们提出“数基生命系统”这一新概念。

数基生命系统包括下面三重含义。

一是对生命的数据感知和数字化表示。通过全方位跨尺度、多模态生物医学大数据,把人体表征为数字化实体。

二是人体系统的全维度数学模型。在数字实体中实现贯穿分子、细胞、组织、器官、系统的数学模型,让数字实体“活起来”,模拟生老病死各种生命过程,形成人体“数字孪生”。

三是在通用数字孪生基础上,融合个人基因组、生理病理和生活环境等数据,建立个体化数字孪生,模拟个体健康演化和疾病发生发展过程,智能推演过程中各种因素的作用,实现重要生命过程定量评估、精准的动态健康指导和疾病治疗方案精准优化,用数基智能解决信息呈递难题,实现智能精准医疗。

人体是碳基生命系统,数基生命系统是在数字空间中用智能技术实现的人体孪生生命系统。数基生命系统的本质特性是在数字和数学空间中实现的生命,并不依赖于数字空间是在当前的硅基计算机中,还是在未来其他形式的计算机中实现。

建立完备的数基生命系统是一个很长远的目标,但数基生命系统并非在完全解码生命机理后才能建立和发挥作用。它既是一个目标,也是一种新的研究范式,把对生命的研究映射到数字空间中,通过在数字空间中的数学模拟、校验观测数据、外推科学发现,再反馈到科学实验,这种数基 - 碳基耦合的科学研究模式,将大大加快对生命机理的认识进程。在我们最近的工作中,已成功地按这种范式,把高通量组学观测、生物信息学分析、数学建模、数字空间仿真、合成生物学实验相结合,在发现基因调控规律和设计靶向肿瘤的合成基因线路智能药物上取得了重要进展。

数基生命系统是未来智能医健的解决方案,也是当前生命科学探索和智能医健研究的新范式。

3 数基生命系统的发展路线图

数基生命系统是涉及到多学科的远大科学目标,需要攻克多个关键科学技术问题:

● 需发展一系列基础理论和技术,包括生命的全方位跨层次数据感知、数据汇集、数据认知、知识发现、知识应用;

● 需研究设计数基生命系统的基本框架,发展新的数学语言和工具,建立理论和方法体系,建立数基生命的“操作系统”;

● 需与应用研究密切结合,以应用需求驱动基础研究,以基础研究推动应用发展;

● 需选择有代表性的医疗应用场景和健康应用场景,用示范性数基生命解决方案推动整个领域发展。

图2给出了数基生命系统的发展理念图。我们相信,把信息技术、智能技术与生物技术、医疗技术有机融合的数基生命系统,将成为未来智能医疗健康的理想解决方案,为人民生命健康事业做出重大贡献。

图 2 数基生命系统发展理念图