人工智能的发展趋势与AIGC应用的探讨-

导读：2023年10月20-21日，以“智能涌现生成未来”为主题的第二十五届中国科协年会通用人工智能产业创新发展论坛在安徽省合肥市成功召开。欧洲科学院院士、中国自动化学会副理事长、华南理工大学教授陈俊龙受邀出席并作题为“人工智能的发展趋势与AIGC应用的探讨”的主题报告。报告聚焦工业智能与智能系统前沿，探讨了人工智能赋能制造业的关键科学问题和重点推进内容，指出人工智能作为制造业数字化转型的新生产工具，正催生AI for Engineering这一工程研发新范式。同时进一步探讨了工业智能的内涵，并提出了工业智能前沿研究的重点内容和总体目标，即：从信息感知本质、信息理解深度和系统行为决策出发，开展跨时空感知与统一表征、多模态信息可解释泛化认知和人机共融决策与动态博弈的基础理论与关键技术研究，实现制造过程高端化、绿色化、智能化运行。

以下为报告全文。

自2009年以来，国家在物联网、云计算、大数据和人工智能领域取得了显著进展。这些进展得益于算力、数据和算法模型的不断支持，以及深度学习技术的兴起。此外，在2008年和2009年间，软件和硬件领域也经历了重大的发展，促成了近期通用人工智能的兴起。

一、算力

最近，国家在通用人工智能（AIGC）领域的发展受益于算法、算力和数据的显著提升。为了提供企业强有力的算力资源，政府在2022年统筹启动了东数西算工程。这个工程概念类似于早期的南水北调和西电东送工程，旨在建立8个关键枢纽点，分布于长三角、珠三角、宁夏、贵州、内蒙等地，这些枢纽点也配置了数据中心的重要角色。目前东数西算工程正在进行大规模建设。这些举措不仅在土建工程、软件工程和信息技术等领域对国家产业链的发展产生了积极作用，而且为能源利用和双碳减排工程贡献了一份力量，并满足了中小企业对大规模数据资源的需求。合肥市也在呼应该计划在组建算力上扮演着非常重要角色。

英伟达公司今年5月宣布了"Hopper"计划，旨在分析当前的GPU技术。该计划旨在推动GPU技术的发展，以满足不断增长的计算需求，尤其是在人工智能和科学计算领域。计划的一部分包括推出基于新架构的GPU产品，以提供更高的性能和效能。这将有助于满足日益增长的计算要求，帮助研究人员、科学家和工程师在各个领域开展创新性的工作。该计划启动时，国内尚未受到美国的限制，但它给我们带来了一系列未来发展的思考。回顾早期CPU技术，特别是在大型语言模型的训练方面，以ChatGPT为例，实现这一目标需要巨大的计算资源。然而，借助GPU计算中心资源，成本约为40万美元，能源消耗也仅相当于传统CPU的约1/8。若投入1000万美元，我们能够实现4倍LLM（Large Language Model）大语言模型的规模。进一步考虑到能源消耗，我们甚至可以实现高达150倍LLM的容量，如图1所示。

图1 CPU/GPU资源对比

这引发了深刻思考，若我们拥有足够的计算能力和资源，大型语言模型规模有可能增加到150倍。随着算力和数据更深度的协同作用，未来通用人工智能预计会变得更加智能，这意味着通用人工智能将在各行各业中发挥作用，为各种问题提供解决方案。

目前国内正在积极研究除了GPU之外的其他算力支持大型语言模型的方案，其中包括MPU（混合处理器单元），NPU（神经元处理单元），和TPU（张量处理单元），如图2所示。最近，研究人员开始探讨如何利用量子计算来克服DPU（深度处理单元）所面临的局限，这引起了广泛的讨论。谷歌很早之前就在进行TPU和MPU的研究，而现在，阿里巴巴、寒武纪等公司也在积极研究这些新的计算架构，这些努力有望突破目前GPU所面临的限制。

图2 CPU、GPU、TPU方案

二、数据

数据在大型语言模型中起着关键作用，一个大型语言模型的性能和智能程度与训练数据的质量密切相关。因此，数据的重要性不可忽视。国家在2021年底便开始建立数据聚集和管理系统，不仅着重管理整个数据生命周期，包括数据来源、存储、处理、交换和传输，并且实施数据分析等级的分类处理，以确保数据在未来如何进行去标识化和去敏感化处理，如图3所示。这一举措强调了数据的关键性，以确保数据在各个方面的安全和有效管理。

图3 数据安全生命周期

同时，国家在各个省市纷纷设立数据交易所，如在广东和深圳同时建立了数据交易所，这些交易所是由省市共同支持和发展的。未来，各行各业的数据可以像煤气、水电一样进行交易。这意味着在模型训练时，不再局限于使用公共数据，而可以利用交易的数据进行模型训练，这是国家在数据领域取得的重要突破，将为人工智能的发展提供更多的数据资源和可能性。

三、模型与算法

大型模型的概念首次出现在2015年和2016年，由于生成式模型尚未崭露头角，所以当时还没有引起广泛的关注。当时OpenAI组成的GPT-3在当时尚未加入Chat功能，当时也没有类似文心一言、通义千问，讯飞的星火等大模型。从今年开始这些模型开始逐渐涌现，如图4所示。大型模型的主要特点之一是其拥有千亿级参数的规模，同时希望能够通过标注的小样本来进行模型训练。

图4 国内外语言大模型

最近，网络上已经发布了大约80个具有超过10亿参数的模型，然而，目前只有11个模型通过了国家的认证。这表明不同机构对于这些大型模型的价值评估各有不同。总体而言，中美两国的大型模型已经占据了全球的80%份额，这引发了国内各行各业都希望构建自己的大型模型的热情。然而，通用大型模型的构建相对困难，因为它需要庞大的计算资源支持。因此，国内正在进行所谓的“百模大战”，旨在建立各个领域的小型专用大型模型，以满足不同行业的需求。这凸显了大型模型在国内的广泛应用和重要性。

当前最主要的问题国内大型模型的计算能力仍然高度依赖国外的生态系统，包括依赖微软、英伟达等公司的产品以及算子库。尽管国内拥有华为的昇腾系统算子库，但仍然需要与用户合作开发。这个问题涉及的领域非常广泛，最主要的挑战是如何改变国内显卡的生态系统。国外的生态系统已经形成了全球性的格局，而要改变国内生产的显卡的生态系统相对更具挑战性。国内拥有两三家显卡生产商，如曙光、寒武纪等，但由于缺乏与生态系统的深入了解，难以推广和普及。未来，这些企业需要积极探讨如何构建生态系统，以改变国际局势并打破依赖国外生态系统的现状。

在构建大型模型时，需要考虑两个关键要素。首先，数据的规模对于模型构建速度至关重要，大型数据集需要更多的时间来建立模型，所以快速构建准确有效用的模型至关重要。其次，也应考虑在模型构建后如何快速应用增量数据进行更新。这方面的挑战在于涉及大量数据，因此更新过程可能相对复杂。目前，我们正在探索边缘端的实时模型更新方法，使得在模型训练完成后，客户端可以实现随时更新，而不必将模型返回到原始大型模型进行批量更新。宽度学习在这一领域发挥了重要作用，尤其是对于实时增量数据的更新。

图5 宽度学习系统

在算力和模型都达到要求满足时，算力冷却便成为了一个难题。现在，算力冷却系统采用了多种方法，包括风冷系统、液冷系统以及浸没冷却。在浸没冷却方面，我们建立了一个模型，以调整化学成分，将冷却效率最大化。这种方法可以使PUE值降至1.07，低于国家规定的水平，并且此种冷却形态需要更少的空间。相比于传统的大型计算机柜，这种方法在效率和空间利用方面都有显著的优势。

图6 基于浸没式液冷技术的高性能算力解决方案

四、AIGC对公司生态的影响

近期人工智能研究公司OpenAI推出的聊天机器人模型CHAT-GPT不断出圈，继2019年向OpenAI注资10亿美元之后，微软与OpenAI的合作进入第三阶段。据Semafor引知情人士报道，微软以290亿美元估值，向OpenAI 投资100亿美元，一切均指向人工智能模型的新范式“生成式AI模型（Generative Model）”。决策式AI模型（Discriminant Model）是根据已有数据进行分析、判断、预测，典型应用为内容的智能推荐（短视频）、自动驾驶等；而生成式AI更强调学习归纳后进行演绎创造，生成全新的内容，本质是对生产力的大幅度提升和创造，已催生了营销、设计、建筑和内容领域的创造性工作，并开始在生命科学、医疗、制造、材料科学、媒体、娱乐、汽车、航空航天进行初步应用，为各个领域带来巨大的生产力提升。

在AIGC方面，来谈谈数字人及人机交互的应用。目前，为解决人体大健康领域的问题，我们获批的教育部的健康智能和数字平行人工程中心正在探讨在数字世界与真实的物理世界里人机交互的问题。。目前已经初步开发了数字人，使其能够进行对话并相互了解，数字人之间也可以互相交互，而且数字人可以在现实空间与真实人进行互动。我们的团队正在致力于情感识别及在数字世界与物理世界人体健康监控及交互的研究。。

生成式人工智能对公司生态的影响最大的是互联网公司。现在，如果公司能够熟练使用生成式人工智能来编写代码和开发嵌入式应用，未来的公司将变得更小而更精致。这将带来更多的盈利机会，使员工有机会成为创业者或老板。他们可以迅速将生成式人工智能整合到公司中，以实现更高效的嵌入式应用。目前，国内在生成式人工智能方面仍有很大的发展空间，各种小型科学家和企业都有机会嵌入到人工智能平台应用中，未来的创新和发展会涌现更多机会。

从产业价值角度来看，生成式人工智能可以迅速分为上游、中游和下游三个方向。上游产业涉及基础建设，下游产业则涉及应用，而中游产业在各个行业中起到枢纽作用。初创公司在这一领域属于中小型，但未来可能成为龙头企业，这将产生巨大的产业价值。在实际生产应用中，还没有大规模采用生成式人工智能的情况，主要是因为大部分应用仍然依赖传统的专用小型大模型，这些模型使用相对较小的计算资源进行训练。未来，生成式人工智能将在各个领域得到更广泛的应用，这取决于我们拥有的算力和数据基础。

ChatGPT是AIGC目前最典型及最有名气的平台产品。此类的平台它具有正面和负面两面的影响。一方面它扩大了知识的传播途径，提供了便捷的信息获取方式，个性化的服务，以及自动化客户支持，同时还有创新应用的潜力。另一方面，其具有不准确信息和偏见传播的风险，可能对隐私构成威胁，引发失业风险，以及可能被滥用。解决这些问题需要审查数据来源、开发偏见识别和修正技术，强化隐私法规，以及进行社会伦理和道德教育。总而言之，ChatGPT和AIGC类似技术在未来将继续发挥重要作用，但需谨慎管理，以最大程度地提升积极影响，降低其潜在负面的影响。

作者简介：

陈俊龙，博士，国家特聘专家，华南理工大学计算机学院院长、讲座教授，陈教授是中国自动化学会副理事长、教育部健康智能与数字平行人工程中心主任、广东省计算智能与网络空间信息重点实验室主任、广东省人工智能产业协会联席会长、琶洲实验室副主任。他是IEEE Fellow、AAAS Fellow、IAPR Fellow、欧洲科学院院士（Academia Europaea）、欧洲科学与艺术院院士（European Academy of Sciences and Arts）、中国自动化学会(CAA) 、中国人工智能学会(CAAI)、及香港工程师学会 (HKIE) Fellow。陈教授曾任IEEE Trans. on Cybernetics （2020-2021），及IEEE Trans. on Systems, Man, and Cybernetics: Systems （2014-2019）两个顶级SCI期刊主编，曾任该学会国际总主席 (2012-2013)，也是国内期刊 CAAI Trans on AI,《中国科学》，和《自动化学报》的编委。 2018年陈教授获得了IEEE系统科学控制论的最高学术维纳奖(Norbert Wiener Award)，获 2021 IEEE Joseph Wohl 终身成就奖，及我国人工智能学会吴文俊人工智能杰出贡献奖。陈教授科研方向主要在智能系统与控制，计算智能，混合智能，数据科学方向。他是2018-2022连续5年Clarivate Analytics的全球高被引科学家（2018 在计算机，2018-2022年在工程及计算机双学科）。