“耗时五年,这个心血管RWE研究项目终于发表了。”
“读博的时候参与的项目,现在毕业2年了,项目终于发表了!”……
这些对于医学研究人员及相关从业者,是最熟悉不过的场景。从临床问题的确定、到数据情况评估、研究设计选择,以及统计方法确定、数据管理、开始研究、结果解读和评价、事后分析等等一系列环节,为了提升项目结果价值,传统做法上每个环节都需要耗费大量人力物力。而在最新的一场医药行业相关发布会中,记者了解到行业前沿的研究团队,已开始用“人工智能+”的大模型方式,“革新”了医药行业的研究全链路。
近日,一场属于医药人的AI盛会在上海隆重举行,该会议由CphMRA主办,健交科技承办,以"人工智能+医药,新质生产力"为主题,会上同时宣布"CphMRA医药大模型专业组"正式成立,开启医药研究AI时代。专业组组长单位健交科技,在此次会议上重磅发布由其自主研发的GPT Hybrid专利技术驱动的【PDS®人工智能医药研究平台】。健交科技首席科学家汤子欧博士向记者介绍到:PDS®平台可提供针对医药研究全流程的"数据治理-信息提取-知识发现-建模预测-扩展应用"一站式应用,将一改过往耗时耗力的医药项目研究状态,"让真理更快被发现,让医药人工作更高效"。
1**、一个“灵感”,造就比GPTs(Agent)早4个月诞生的领先技术**
采访过程中,记者了解到,健交科技的GPT Hybrid专利算法架构比GPTs(Agent)宣布时间还要早4个月申请专利,可以说是首个基于GPT Hybrid架构并融汇LLM、神经网络、精算模型、矢量建模等联合决策训练的人工智能自适应、自学习算法体系(GPT-H)。而这一切都源自于健交科技首席科学家汤子欧博士的一个“灵感”——大语言模型(LLM)的“两个天生BUG”,相关研究成果已刊登于科学中国。
汤子欧博士介绍到,科学层面上,LLM的工作原理是基于注意力机制进行文本预测的算法模型,对于数值型预测工作,LLM仍然是把数字当成文本进行处理并运用文本注意力机制进行文本型数字的选取和产生,对于数值型预测工作结果的精度和可重复性不具备技术上的优势,其结果也就较差,甚至对于数值型预测工作无法回答问题;哲学层面上,“LLM威胁论”认为LLM可能很快会通过学习全部人类语料后超越人类,然而,这个认知存在逻辑悖论。
总结来看,大语言模型(LLM)的“两个天生BUG”其一,LLM还不能很好的胜任数值型预测工作;其二,LLM难以超越人类语料,因此“LLM威胁论”的认知目前无法成立。认识到LLM的这“两个天生BUG”,也为我们进一步提升AI的能力找到了可行的路径,健交科技的(GPT Hybrid)专利技术集群应时而生。
然而,从灵感到技术群实现,再到应用落地,以及最终实现商业化,这条路并不好走。尤其是在如此火热的市场环境下,各类新兴的大模型正以肉眼可见的速度“席卷”大健康行业。但应用过于分散、不成体系、深度不够则是整个行业都在努力突破的痛点。“噱头很多,变现很难”是一位行业资深专家对如今大模型产品的形容。针对这个现状,汤子欧博士也早已进行布局。
2**、走出“无人区”,要让医药场景化应用价值“遥遥领先”**
“我对自己的定位是一个研究人员,带着研究团队经常就是没日没夜在无人区进行探索。”汤子欧博士说到。作为最早一批EDA拓荒者,从20世纪90年代起,汤子欧博士便已开始大数据挖掘与研究工作。“也许是因为从业经历、又或者是巧合,在无人区默默耕耘十余载以后,我们研究团队的成果竟与医疗医药行业场景化应用需求不谋而合。”
技术上实现多元融合,没有天花板:从【PDS®人工智能医药研究平台】发布这一时刻开始,宣告大语言模型和相关的AI技术正式形成合力,帮助医药人高效探究客观世界的真理。场景上实现多维全覆盖,【PDS®人工智能医药研究平台】,一站式解决"数据治理-信息提取-知识发现-建模预测-扩展应用"医药研究全流程。
图:健交科技首席科学家汤子欧博士现场展示【PDS®人工智能医药研究平台】
汤子欧博士详细介绍了PDS®平台,其内核包括:
人工智能数据预处理系统TM——首个基于GPT Hybrid架构的智能自学习自进化的数据质量评价和清洗系统,从过去的“规则穷举驱动”向“Gen AI 自动进化”的质的飞跃。在数据预处理阶段,实现自动进化、流程简化、高标准少误差与灵活迭代,运用自学习自适应机制可以“越用越好用”。可用于某类适应症人群数据处理、某类药品使用情况数据处理、某类手术数据处理等;
人工智能知识萃取系统TM——首个基于GPT Hybrid架构的信息自动萃取问答系统,从过去“关键词检索”向“智能化知识萃取”的飞跃,并能自动权衡类似知识的优先级和权威性,内容回答科学、准确且全面。首个应用场景已经在医学知识问答中落地,这个“医问智答TM”智能助手能够应用于患者教育、医生提升技能水平等;其他应用场景还包括“出院小结解读助手”,瞬时提取关键信息,提供知识点、综述、参考资料等关键信息,可用于患者服务或住院相关研究;
人工智能数据挖掘系统TM——首个基于GPT Hybrid架构的自动知识挖掘系统,从过去“人工分析”向“大模型、神经网络和自研技术高效联动,自动智能挖掘”的质的飞跃。在数据挖掘知识发现工作中,支持海量大数据多表复杂逻辑关系解析,支持各种观察视角,实时人机交互产生数据挖掘结果,并实时启发进一步挖掘方向等思路。首个应用场景是用于医药真实世界研究的“人工智能医学科研助手TM”,自适应多元异构大数据源,从适应症、药品、行为等多个视角出发,无边界地进行患者特征、化验、检查、诊断、用药、手术、趋势、路径、旅程等各种行为的分析、比较、建模、预测等的人工智能化挖掘分析。
人工智能矢量建模系统TM——首个基于GPT Hybrid架构并融汇机器学习和精算模型多领域技术的建模和决策支持系统,从过去“人工分析-筛选-再分析”向“人工智能自动跨范式建模和自动筛选并实时应用生产”的飞跃。首个应用场景已经实现在“人工智能医疗行为风控助手TM”,不同于传统的几个月甚至几年的大人群大数据统计分析,可以在数天内通过大规模计算自动产生和迭代最优化的海量行为模式的海量模型,可用于疾病负担分析、疾病负担预测、重疾预测与特定疾病缺失值的预测、病种费用合理性评估等等,更好地管理和优化医疗服务的成效。
人工智能诊断系统TM——首个基于GPT Hybrid架构的LLM与神经网络技术联合决策训练的智能诊断系统,从过去“专家经验判断或临床路径或诊断决策树的封闭式选项”或“不严谨的生成文字”向“生成式AI不断总结和逼近人类诊断经验极限”的跃迁。在底层算料选用国际权威机构金标准并辅以“人工智能数据挖掘系统TM”实证研究支持迭代进化,一改以往固化的选择题模式,用自然语言结合启发式问答形式,帮助医生或患者快速精准发现诊断或备选诊断,提升诊疗效率和诊断科学性、一致性。
3**、GPT-Hybrid,可能是迈向通用人工智能****(AGI)**的“中国解”
用GPT Hybrid打造了【PDS®人工智能医药研究平台】,在汤子欧博士看来还远远不够。“下一步计划不断加强PDS®的能力,尤其是通过其内部知识萃取、数据挖掘、矢量建模等AI能力的相互加持和循环推动去逐步实现和强化“人工智能发现新知识”的能力。我们希望这是一条逐步逼近AGI的可行路径。”在(GPT Hybrid, GPT-H)专利算法架构、(Multi-order GPT, MO-GPT)专利计算架构、(Real World Tracing Matrix, RWT)专利生产架构等相关技术集群不断进化与迭代中,健交科技已迈入下一个无人区。
联想到此前人民论坛与科学中国等相关权威媒体提到的大语言模型(LLM)的局限性等相关文章披露,GPT-Hybrid专利算法框架是否会成为迈向通用人工智能(AGI)的“中国解”?