自从 ChatGPT 横空出世,人工智能(AI)再度引爆话题以来,很多人都心怀一个疑问:我希望人工智能可以帮我扫地洗碗,好让我有心情去写诗画画。可为什么现在的人工智能却都写诗画画去了,就我们人类还在扫地洗碗?
图片截取自社交媒体
网友吐槽的这个情况,跟人工智能技术的发展路径有关,也跟技术的商业化过程有关,到也不是科研人员“刻意为之”的。与此同时,也有无数的人工智能研发人员正在努力工作,让这项技术能帮助大家实现一些更实际的目标。
最近,华为云团队在《自然》杂志发表的一项 AI 大模型,就试图解决一个困扰全人类的、非常实际的问题:天气预报。
图库版权图片,转载使用可能引发版权纠纷
天气预报最大的难点之一,就是决定天气如何发生的大气系统在演变时所具有的混沌性。
尽管目前的 NWP 方法已经取得了显著的进步,但仍然存在一些限制。首先,NWP 模型需要大量的计算资源来求解复杂的物理方程。这对大规模的全球气象预报而言,可能是一个“致命”的问题。其次,NWP 模型通常需要详细的初始条件,这些条件往往由卫星和地面测量提供,但数据可能存在不确定性或误差。这会影响预测的准确性。
因此,尽管我们已经能够做出相当准确的短期天气预报(如未来几小时或几天的预报),但中期和长期预报(如未来几周或几个月的预报)的准确性仍然是一个挑战。如今,AI 大模型的出现,或许能让我们向更精准的中长期预报更进一步。
在 2023 年 7 月 5 日的《自然》杂志正刊上,华为云团队报告了一项基于华为云盘古气象(Pangu-Weather)大模型进行的中期天气预测的工作。这项工作首次解决了 AI 预报天气精度不及传统数值预报的世界性难题,而且预测速度快了 1 万倍,实现了“秒级”全球气象预测。
华为云盘古气象大模型的核心是一种三维深度神经网络(3D Earth-Specific Transformer),能够捕获天气数据中的复杂模式,使用了约 40 年的全球天气数据进行训练。同时,团队采用了一种层次化时域聚合策略,以减少中期预报中的累积误差。其结果是,盘古气象大模型在部分情况下,其精度和速度方面超越了此前全球最好的 NWP 系统。
华为云研发团队发现,此前 AI 气象预报模型的精度不足主要有 2 个原因:第一,原有的 AI 气象预报模型都是基于 2D 神经网络,无法很好地处理不均匀的 3D 气象数据;第二,AI 方法缺少数学物理机理约束,因此在迭代的过程中会不断积累迭代误差。
华为云盘古天气大模型的一个关键突破是对地球上的天气模式的理解。通过将高度信息整合到新的维度中,该系统可以在三个维度中理解天气模式,从而更准确地预测天气。此外,层次化时域聚合策略也是一项重要的技术突破,它极大地减少了中期天气预报所需的迭代次数,由此降低了累积误差。
图库版权图片,转载使用可能引发版权纠纷
业界对华为的这项研究给予了高度评价。相关专家普遍认为,盘古气象大模型的出现代表了人工智能在天气预报领域的重大突破。中国国家气象中心和欧洲中期天气预报中心(ECMWF)等机构在实测中证实了盘古大模型预测的优越性,其结果包括温度、湿度、风速、海平面气压等,可以直接应用于多个气象研究细分场景。
不过,尽管盘古大模型从某种意义上来说开辟了新的预报途径,但它仍依赖 NWP 来训练,且结果并没有碾压 NWP。因此,站在客观角度来看,同行专家们也对盘古气象大模型提出了一些不足和改进方向,这些仍是研究团队需要进一步研究和验证的。
2023 年 5 月,台风“玛娃”作为今年迄今为止最强的热带气旋引起了世界的关注。国家气象中心利用人工智能快速增强识别技术,提前 12 小时实现趋势预报。《中国气象报》在相关报道中称,华为云盘古模型在玛娃轨迹预测方面表现出色,提前 5 天预测了其在台湾岛东部海域的转弯轨迹。在第 19 届世界气象大会上,欧洲中期预报中心也指出,华为云盘古气象大模型在精度上有不可否认的能力,纯数据驱动的 AI 天气预报模型展现出了可与数值模式媲美的预报实力。
华为云研发团队还提出了适应性学习策略,让模型在针对新数据进行预测时能够进行实时调整。这项技术的成功实现将进一步提高盘古气象大模型的预测准确性,使其在实际应用中更具价值。
在农业、航空、能源、灾害预警等领域,准确的天气预报具有重大的社会和经济价值。例如,在农业应用中,准确的降水量预报将有助于农民合理安排农事活动,提高农业生产效率。而在航空运输领域,准确的风速预报将有助于航空公司合理安排航线,降低运营成本。
在过去的几十年里,气象科学家们一直在努力,设法提高天气预报的准确性,但这个领域仍然有很多挑战。未来人工智能技术有可能成为应对这些挑战的关键。
注释
[1]论文摘要描述为39年。华为官网新闻报道为43年。
作者丨闻非 科学记者
审核丨于旸 腾讯玄武实验室负责人