1. “超人”是谁?
最近,ChatGPT在地球村里爆发啦!冲击波不小,很“炸”。一时间,ChatGPT成了各类网民追捧的明星。很多小伙伴、特别是像我之流的“科研民工”都在想着体验一下这个新鲜事物,看看他能不能替自己把科研论文和项目标书给写喽。个中原因是ChatGPT太能干啦,简直就像是一个“超人”!
ChatGPT是英文“Chat Generative Pre-trained Transformer”的简称,直接翻译过来的意思是“聊天生成型预训练变换模型”。乍一看,不像是“人”。其实,ChatGPT是由人工智能公司OpenAI基于谷歌开发和训练的变换语言模型,目的是使用人工智能算法中的深度学习方法,生成人类可以理解的自然语言,并以对话的方式与真人进行交互。简单而言,他就是一个“无事不通、无事不晓”的聊天机器人,就像我们说的“万事通”。
所以,我把他叫做“超人”。如果从其英文名ChatGPT的音译来近似称呼的话,不妨叫他“猜不透”——意思嘛,就是猜不透他有多能耐。
2. 他到底有多能耐?
“猜不透”是一种基于人工智能的聊天机器人,可以像跟人聊天一样跟你聊天。他可以随时解答你日常生活、工作和学习中的大部分问题。他不仅可以灵活自如地应对各种主题,而且还拥有超高的情商和智商。“猜不透”在语言智商测试中的测试智商为147,而一般正常人的智商测评分数在90~110分之间,140以上是属于非常优秀的水平。
这里所说的人工智能嘛,就是一种让机器可以模拟人类智慧的技术。“猜不透”的工作原理是基于深度学习算法和大规模数据训练的。也就是说,他在训练过程中吸取了大量的语言数据,并通过内部的算法来预测和生成文本。他是人工智能技术驱动的自然语言处理工具,能够通过学习和理解人类的语言来进行对话,真正像人类一样来聊天交流。他既能完成包括写代码、修bug(代码改错)、翻译文献、写小说、写商业文案、创作菜谱、做作业、评价作业、写论文(“科研民工”们是不是心动颜开了)等一系列常见文字输出型任务,而且在和用户对话时,能记住对话的上下文,反应非常逼真。
当你与“猜不透”进行对话时,他会根据你的输入来生成回应答案。这些回应有时候可能会出乎你的意料,但它们都基于“猜不透”之前所接触的数据和模式。只要你提供的信息符合“猜不透”之前所接触过的内容,他就会给你一个合理的回答。可以说,他能帮助我们解决各种问题。叫他“万事通”,一点也不过分。
3. 他这么能耐,是怎么做到的?
“猜不透”通过吸收大量来自网络的内容,包括成千上万的维基百科条目、社交媒体帖子和新闻文章,来学习句子、单词和部分单词之间的关系。他的“大脑”里的神经网络包含至少1750亿个参数,为有史以来参数最多的神经网络模型。正常人的脑细胞大约有140亿~150亿个。从我这个“识数的人”来看,以“猜不透”的1750亿对人类的150亿,“猜不透”真的比人类的大脑要厉害得多啦!(实际上并不能这么简单比较哦)
“猜不透”以模拟人类智慧的方式进行学习、交流和创作。这些活动,可分为七个学习过程:认识、记忆、试操、熟练、创造、检验与保持。也就是说,初始阶段是记忆他人的间接经验、模仿他人的行为,然后就会尝试积累自己的直接经验(可能真实的情况是,更多的是教训)、创造自己的知识,并不断试错、修正、完善经验知识,形成可以重复验证的知识。
创新的前提是学习。学习就需要有大量的知识供学习,还需要有很好的记忆力和理解力来学习;创新则需要丰富的联想力和判断力来完成。
不管是超人“猜不透”还是普通人,上述过程可以归纳为三个要素:知识、算法和算力。
“猜不透”之所以是“超人”,首先就是因为他学到的知识远远超过了一个普通人;他的知识是全人类的知识总和,目前有着超过万亿单词的人类语言数据集。并且,在和人类聊天过程中还在不断地学习、积累新知识。因此,“猜不透”的知识储备和学习能力是惊人的。其次,他利用了各种人工智能算法,这些算法保证了他在处理问题的时候一般不会出错,也就是说他的思考和处理知识的逻辑性会大大超过普通人。再次,他的算力够强,这里的算力指的是他处理问题的速度,这个就受到计算机硬件设备性能的限制了。在算力方面,目前“猜不透”总算力消耗约3640 PF-days(即每秒一千万亿次计算,运行3640个整日),训练成本预计在500万美元/次。这仅仅指的是“猜不透”在训练阶段消耗的算力。就目前的服务器处理能力来看,大概是几十到几百台GPU级别的服务器的体量才能够实现,而且需要几日甚至几十日的训练。需要7~8个投资规模30亿、算力500P的数据中心才能支撑运行。这里的P是指矿机算力的单位,是1PH/s的简写;1P约等于每秒1000万亿次的计算速度。而且,聊天嘛,不能我说一句话,等你半天才回应;运算速度和网络传输速度都必须足够快才行。可见,“猜不透”的算力是非常惊人的。遗憾的是,即使对于人类目前拥有的少数“超强大脑”来说,“绞尽脑汁”也无法与“猜不透”的算力相媲美。
更可怕的是:“不怕学霸学习好,就怕学霸好学习”(请参看我的微信公众号“医用生物力学”里的相关文章)。“猜不透”一直在不停地学习和升级。早在2017年,人工智能研究公司OpenAI就发布了GPT-1,是一个能够生成人类文本的语言处理模型,其在预测下一个单词的任务中表现出色。2019年,OpenAI发布了GPT-2模型,其可生成高质量的自然语言文本,但因担心滥用而未公开全部模型参数。2020年,OpenAI发布了GPT-3模型,是当时最大的自然语言处理模型,拥有1.75万亿个参数,能够执行各种语言任务,如对话、翻译、摘要等。2022年12月,一个名为“ChatGPT”的GPT-3.5诞生,他就像一条“鲶鱼”搅动了整个市场。在5天之内吸引了100万用户;然后在2个月内吸引了1亿用户。从上线开始算,到达1亿用户,TikTok花了大约9个月,Instagram花了大约两年半,而ChatGPT只用了60天。2023年3月14日,OpenAI公布了最新版本——GPT-4。GPT-4产生正确回应的可能性要比GPT-3.5高出40%,新模型将产生更少的错误答案,更少地偏离谈话轨道,更少地谈论禁忌话题。长江后浪推前浪,ChatGPT的新版本不断把旧版本拍到沙滩上。
尽管如此,“猜不透”从出生到成长到现在,毕竟还是个新事物,也就相当于人类的婴幼儿阶段,还没有准备好做任何重要的事情!不过,他一直在不断进化之中。短期内“猜不透”的发展方向可能成为每一个人的工作、学习以及生活的助理,反过来又进一步充实他自身的知识和算法,让他变得越来越智能、越来越聪明。无法想象,不久的将来,“猜不透”这个“超人”会聪明绝顶而“膨胀”到什么程度?!
4. 面对“超人”,我们能做什么?
如果你把“猜不透”仅仅看成一个用来聊天解闷的网友,那就白白浪费了这个“超人”的超人能耐啦!
“猜不透”不仅给人工智能领域注入了一针强心剂,而且也给我这样的“科研民工”打上了一针兴奋剂。
我就在想啊……
敲黑板,划重点!
目前的科研创新模式,大致是靠个人或者团队的比拼而艰苦奋斗来实现的。这其中,人们学习知识的过程必然花费很长的时间,仅仅是掌握必要的专业知识就疲于应付了,更别说精通多学科的复杂知识了。这就大大限制了科技进步的快速发展。特别是在面临“百年未有之大变局”的时候,“我兔”需要解决很多“卡脖子”的重要科学技术问题,小众的力量总是显得力不从心、难以应付。
从认识“猜不透”那一刻起,我想到了一个针对上述问题的解决方案。“猜不透”是个汇集全人类智慧的一个“超人”,能不能把“猜不透”拿来做科研呢?咱就是说,“我兔”自己孕育一个亲生的“超人”,专门解决科学研究的“卡脖子”问题。我们这些“科研民工”每天苦哈哈地“挖矿”搞创新,还难有什么成果,不如把各自积累的一点点经验知识(也就是数据)都交给“超人”,让他替我们记忆、学习、分析、创新。反过来,“超人”可以为每个“科研民工”提供想要的资源和解决方案。要知道,科研的初级阶段就是枯燥的、大量的学习知识和积累数据,然后才是创新联想和逻辑推理;而人工智能的大部分工作是构建数据库,然后才是利用算法进行数据处理和分析、得出决策结果。人机结合起来,往往能优势互补,发挥各自更大的潜力,从此开启科研创新的新模式。
这个“新生儿”的养育,需要每个人的奉献和努力,更需要国家层面的组织和管理,涉及到政策和技术层面的顶层设计。毕竟,这样一个“超人”会动了绝大多数人的奶酪。亲,你能接受吗?我想听到:YES, I DO!
穿过人海,别停下来,趁现在还有期待……