版权归原作者所有,如有侵权,请联系我们

引领端侧体验变革 高通混合AI或成取胜之匙

重庆市科学技术协会
原创
重庆市科学技术协会倾力打造的科普资源共享平台。
收藏

AI正在端侧发挥着越来越重要的作用,它将进一步改变人们现有的行为逻辑,为用户的生活生产带来深刻的变革。生成式AI的热潮意味着用户向探索更加多样化、个性化的数字世界迈出了重要一步。

近两年光景,由ChatGPT和Stable Diffusion等生成式AI模型引领涌现出了全新的企业级和消费级用例,在实用性、生产力和娱乐性方面带来了增强体验。毫无疑问,AI即未来。

最好的科技是让人感觉不到存在,但AI已经从幕后走向台前。经过十数年的发展,众多厂商的努力让AI从边缘小透明变成了深度参与终端运行的强大一环。在AI发展的关键节点,高通提出了“混合AI是AI的未来”这一论断,在混合AI方向不断发力,推动混合AI取得新突破。

混合AI是什么

高通认为,混合式AI是传统基于云端的AI与端侧AI的结合,云端和终端共同处理AI计算,借助端侧的即时感知、即时处理优势填补云端AI在延迟方面的短板,同时云端的超高算力也能对端侧AI性能不足的情况进行强有力的补充。

未来AI将在云端、边缘云和终端侧协同运行,构建混合AI架构。利用5G在云端算力和终端应用的关键桥梁作用,实现混合AI系统中的计算和处理能力以最有效的方式分布,让AI更强大、更高效、更优化。

正如高通公司全球高级副总裁钱堃在世界互联网大会数字文明尼山对话上提到的,“能够实现终端和云端协同工作的混合AI架构将构筑AI的未来,是推动人工智能走进千家万户、惠及百业千行的关键所在。”

全栈式AI优化赋能终端侧AI应用

再强大的AI算力都需要开发者利用,形成用户可以实际使用的应用或服务。上游厂商、开发者、OEM与用户共同构成了AI应用的生态闭环。作为行业领导者的高通不仅拥有软硬件优势,还能够从底层为开发者和众多OEM厂商提供工具、配套设施和解决方案,让AI开发的活力充分涌动。

目前,高通为应用、神经网络模型、算法、软件和硬件进行全栈AI研究和优化。高通AI软件栈旨在帮助开发者实现一次开发,即可跨高通所有硬件运行AI负载。高通 AI 软件栈全面支持主流AI 框架,同时它还集成了推理软件开发包(SDK),包括面向 Android、Linux 和Windows 的不同版本。高通开发者库和服务支持最新编程语言、虚拟平台和编译器。

在更底层,高通的系统软件集成了基础的实时操作系统(RTOS)、系统接口和驱动程序。我们还支持广泛的操作系统(包括Android、Windows、Linux和QNX),以及用于部署和监控的基础设施。

高通AI软件栈还集成了Qualcomm® AI Studio,支持从模型设计到优化、部署和分析的完整工作流。这一工具相当于为开发者搭建了一个官方的“工具箱”,在这个工具箱界面内,开发者可以自由选择需要的工具,极大地降低开发难度,有助于缩短开发时间、提高开发效率,同时还支持开发者实时查看模型开发进度。

高通所推崇的混合AI解决方案是一个全栈优化的整体解决方案。高通为应用、神经网络模型、算法、软件和硬件进行了全栈AI研究和优化。异构计算方法利用硬件(比如 CPU、GPU和AI加速器)和软件(比如高通AI软件栈)来加速终端侧AI。

从算法和模型开发到软件和模型效率、从量化编译到硬件加速,高通的全栈式AI优化如同齿轮般精密啮合,形成了如今我们看到的样子。

坚实一步 10亿参数模型已可在移动端应用

在本届世界互联网大会上,高通展示了基于Android终端的超10亿参数模型的生成式AI模型。关注图片生成式AI的朋友们对Stable Diffusion一定不陌生。

这是一个非常出色的从文本到图像的生成式AI模型,能够基于任何文本输入,在数十秒内创作出逼真图像。由于这一模型的参数超过10亿,因此现阶段主要在云端运行。

高通采用全栈AI优化的方式,通过量化、编译和硬件加速进行优化,使Stable Diffusion能在搭载第二代骁龙8移动平台的手机上运行,在15秒内执行20步推理,生成一张512×512像素的图像。

高通表示,这是在智能手机上最快的推理速度,其运算时延足以媲美云端,且用户文本输入完全不受限制。目前,高通也已经将Stable Diffusion这一生成式AI用例扩展到搭载骁龙计算平台的PC产品上。

另一款ControlNet图像生成图像模型是一项语言-视觉模型(LVM),它的参数量级更是达到了15亿,能够通过调整输入图像和输入文本描述,更精准地控制生成图像。

在这项演示中,ControlNet能够在终端侧实现高效交互运行,通过一套跨模型架构、AI软件和神经网络硬件加速器的全栈式AI优化,12秒内便可完成16步推理,生成AI图像,无需访问任何云端,便能提供高效、有趣、可靠且私密的交互式用户体验。高通AI模型增效工具包、高通AI软件栈和高通AI引擎在此过程中发挥了关键作用。

随着强大的生成式AI模型不断缩小以及终端侧处理能力的持续提升,混合AI的潜力将会进一步增长。骁龙移动平台能够支持超过10亿参数的生成式AI模型,而在不久的将来我们就能看到高通在移动端部署的100亿参数的大语言模型,这在此前的移动端是难以想象的。

混合AI策略适用于几乎所有生成式AI应用和终端领域,包括手机、笔记本电脑、XR头显、汽车和物联网。这一策略对推动生成式AI规模化扩展、满足全球企业与消费者需求至关重要。

加速推动终端侧AI落地 高通领导力优势明显

端侧是高通关注的重点,也是AI惠及用户的落脚之处。在倡导终端侧AI落地方面,高通具有十足的实力与发言权。

高通在AI方面的研发已经超过15年。就移动端来说,早在2007年高通就在骁龙平台上推出了首个Hexagon处理器,2015年的骁龙820处理器则集成了首个专门面向移动平台的高通AI引擎,支持图像、音频和传感器的运算。骁龙855则集成了张量加速器(Tensor Accelerator),专门处理运行过程中的AI运算任务。

高通明确地洞察了AI在移动端的应用前景。生成式AI必然是趋势,而高通已经能够提供在边缘侧终端上低功耗运行生成式AI所需的处理性能,例如大语言模型(LLM)等。

目前生成式AI正处于快速迭代并广泛采用的阶段,就不能像目前这样仅在云端进行推理,还必须在终端侧进行大量AI处理。同时高通也明白,端侧的算力并不能完全承担生成式AI的运算。

此外,正如前文所提到的高通已经在移动端运行超过10亿参数的AI运算,在终端侧AI推理方面,通过AI 硬件加速和高通AI软件栈这样的简化开发的软件解决方案,高通将在未来几个月具备在终端侧运行超过100亿参数的模型,这将进一步提升AI在终端侧运算能力的上限,也意味着可以用于更加复杂的AI运算,帮助用户解决更多实际问题。

高通的AI加速架构灵活、稳健,能够应对生成式AI模型架构的潜在变化。随着大语言模型和其他生成式AI模型持续演进,高通AI软件栈和技术将随之不断发展。加之为开发者所提供的AI架构与全栈AI套件,无论何时开发者都有能够轻松开发混合AI应用。

在推进混合AI发展的路上,高通部署的边缘侧终端规模十分庞大,具备其他方案提供商所不具备的规模优势。骁龙平台在移动平台AI基准测试中处于领先地位,高通的AI能力已经赋能包括手机、汽车、XR、PC和物联网等一系列广泛产品,搭载骁龙和高通平台的已上市用户终端数量已达到数十亿台。

前文所提到的AI加速解决方案以及各类关键IP创新和技术能能够进行稳定迭代,并且支持跨细分领域快速普及相关功能并下沉到主流和入门级产品。

写在最后

混合AI之风劲吹,而引领混合AI发展的领军角色,高通已经站在了高屋建瓴的位置。可以预见的是,生成式AI用例将持续演进并成为未来的主流。而随着生成式AI的不断迭代,其对算力的需求也将进一步水涨船高,因此对于云端和基础设施需求也将不断增加。

高通过十数年的布局,以深厚的技术积累、广泛的合作伙伴与完备的生态为混合AI搭建了舞台,凭借终端侧AI的先进能力,混合AI架构将在高通的引导下规模化扩展,满足企业和消费者的需求。

而高通的混合AI在成本、能耗、性能、隐私、安全和个性化等多方面都具备明显优势。高通期待通过未来云端和终端的协同工作,依托强大、高效且高度优化的AI能力,打造下一代全新的用户体验。

投稿单位:重庆天极网络有限公司

审核专家:李志高

声明:除原创内容及特别说明之外,部分图片来源网络,非商业用途,仅作为科普传播素材,版权归原作者所有,若有侵权,请联系删除。