6月1日,北京智源人工智能研究院发布全球最大的超大规模智能模型“悟道2.0”。据悉,AI大模型相当于“发电厂”,将数据“燃料”转换为智能能力,驱动各种AI应用,未来将基于大模型形成类似电网的变革性AI产业战略基础设施。
早在2018年,Google发表了一篇论文《BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding》(基于预训练的深层双向Transformer模型解决语言理解)。该论文提出了一种新方法,可以让机器通过“阅读”大量文章,从文章中学会各种各样的语法语义和常识知识,并利用这些知识在自动问答等特定任务当中超越人类表现。
此后,OpenAI的研究《Language Models are Few-Shot Learners》(语言模型进行小样本学习)发现,通过增大AI模型的规模和阅读文章的数量,可以进一步提高机器的表现。如果向OpenAI的系统输入乔治·奥威尔的《一九八四》小说的开场白——“四月份是一个明亮的寒冷的一天,时钟敲了十三下”,随后这套系统将会识别出模糊的未来主义基调和小说风格,并继续写出以下的句子:“在去西雅图找新工作的路上,我坐在车里。我加满油,把钥匙放进去,然后就让它跑路。我只是想象这一天会是什么样子。一百年后的2045年,我在中国农村地区的一所学校当老师。我开始教中国历史和科学史课程。”论文发表后,一度引发了人工智能领域的热烈讨论。
虽然英文的语言理解和生成模型如火如荼地进行着,但中文模型的规模在之前仍然和英文模型有着差距。此次北京智源人工智能研究院发布的“悟道2.0”,参数规模到了1.75兆,是 OpenAI 模型参数量的 10 倍,极大地补足了中文人工智能的短板。有了此模型之后,我们可以很轻松地执行人工智能相关的各种各样的任务,不仅在传统的搜索、智能问答、翻译等任务上会有帮助,还可以提高自动作诗等诸多任务的表现。这个模型将像电之于工业社会一样,变为人工智能时代的基石。在不远的将来,我们有理由相信,基于此模型大众可以开发更加有趣有用的人工智能项目,例如:
1、一个可以模仿人类行为的虚拟人,甚至可以以特定风格的语气讲话(例如:哲学家语气);
2、可以自动写创意十足广告语的机器程序;
3、低代码编程,用简单的文字描述你选择的设计元素或页面布局,模型会弹出相关的网页代码;
4、编写简单曲谱。
虽然,模型的想象空间无限,但是该模型仍然存在一些问题。首先,知识很难更定期更新。由于人类社会的知识是动态变化的,该模型很难像人一样无时无刻地更新信息。因此,如果问乔布斯在哪儿?它可能还会回答在硅谷总部苹果办公室里。第二,对一些复杂的逻辑问题仍然无法解决,例如中学难度的数学题、物理题等。
作者:微软亚洲研究院主管研究员吴俣