“超人”降生- · 科普中国网

1. “超人”是谁？

最近，ChatGPT在地球村里爆发啦！冲击波不小，很“炸”。一时间，ChatGPT成了各类网民追捧的明星。很多小伙伴、特别是像我之流的“科研民工”都在想着体验一下这个新鲜事物，看看他能不能替自己把科研论文和项目标书给写喽。个中原因是ChatGPT太能干啦，简直就像是一个“超人”！

ChatGPT是英文“Chat Generative Pre-trained Transformer”的简称，直接翻译过来的意思是“聊天生成型预训练变换模型”。乍一看，不像是“人”。其实，ChatGPT是由人工智能公司OpenAI基于谷歌开发和训练的变换语言模型，目的是使用人工智能算法中的深度学习方法，生成人类可以理解的自然语言，并以对话的方式与真人进行交互。简单而言，他就是一个“无事不通、无事不晓”的聊天机器人，就像我们说的“万事通”。

所以，我把他叫做“超人”。如果从其英文名ChatGPT的音译来近似称呼的话，不妨叫他“猜不透”——意思嘛，就是猜不透他有多能耐。

2. 他到底有多能耐？

“猜不透”是一种基于人工智能的聊天机器人，可以像跟人聊天一样跟你聊天。他可以随时解答你日常生活、工作和学习中的大部分问题。他不仅可以灵活自如地应对各种主题，而且还拥有超高的情商和智商。“猜不透”在语言智商测试中的测试智商为147，而一般正常人的智商测评分数在90~110分之间，140以上是属于非常优秀的水平。

这里所说的人工智能嘛，就是一种让机器可以模拟人类智慧的技术。“猜不透”的工作原理是基于深度学习算法和大规模数据训练的。也就是说，他在训练过程中吸取了大量的语言数据，并通过内部的算法来预测和生成文本。他是人工智能技术驱动的自然语言处理工具，能够通过学习和理解人类的语言来进行对话，真正像人类一样来聊天交流。他既能完成包括写代码、修bug（代码改错）、翻译文献、写小说、写商业文案、创作菜谱、做作业、评价作业、写论文（“科研民工”们是不是心动颜开了）等一系列常见文字输出型任务，而且在和用户对话时，能记住对话的上下文，反应非常逼真。

当你与“猜不透”进行对话时，他会根据你的输入来生成回应答案。这些回应有时候可能会出乎你的意料，但它们都基于“猜不透”之前所接触的数据和模式。只要你提供的信息符合“猜不透”之前所接触过的内容，他就会给你一个合理的回答。可以说，他能帮助我们解决各种问题。叫他“万事通”，一点也不过分。

3. 他这么能耐，是怎么做到的？

“猜不透”通过吸收大量来自网络的内容，包括成千上万的维基百科条目、社交媒体帖子和新闻文章，来学习句子、单词和部分单词之间的关系。他的“大脑”里的神经网络包含至少1750亿个参数，为有史以来参数最多的神经网络模型。正常人的脑细胞大约有140亿～150亿个。从我这个“识数的人”来看，以“猜不透”的1750亿对人类的150亿，“猜不透”真的比人类的大脑要厉害得多啦！（实际上并不能这么简单比较哦）

“猜不透”以模拟人类智慧的方式进行学习、交流和创作。这些活动，可分为七个学习过程：认识、记忆、试操、熟练、创造、检验与保持。也就是说，初始阶段是记忆他人的间接经验、模仿他人的行为，然后就会尝试积累自己的直接经验（可能真实的情况是，更多的是教训）、创造自己的知识，并不断试错、修正、完善经验知识，形成可以重复验证的知识。

创新的前提是学习。学习就需要有大量的知识供学习，还需要有很好的记忆力和理解力来学习；创新则需要丰富的联想力和判断力来完成。

不管是超人“猜不透”还是普通人，上述过程可以归纳为三个要素：知识、算法和算力。

“猜不透”之所以是“超人”，首先就是因为他学到的知识远远超过了一个普通人；他的知识是全人类的知识总和，目前有着超过万亿单词的人类语言数据集。并且，在和人类聊天过程中还在不断地学习、积累新知识。因此，“猜不透”的知识储备和学习能力是惊人的。其次，他利用了各种人工智能算法，这些算法保证了他在处理问题的时候一般不会出错，也就是说他的思考和处理知识的逻辑性会大大超过普通人。再次，他的算力够强，这里的算力指的是他处理问题的速度，这个就受到计算机硬件设备性能的限制了。在算力方面，目前“猜不透”总算力消耗约3640 PF-days（即每秒一千万亿次计算，运行3640个整日），训练成本预计在500万美元/次。这仅仅指的是“猜不透”在训练阶段消耗的算力。就目前的服务器处理能力来看，大概是几十到几百台GPU级别的服务器的体量才能够实现，而且需要几日甚至几十日的训练。需要7~8个投资规模30亿、算力500P的数据中心才能支撑运行。这里的P是指矿机算力的单位，是1PH/s的简写；1P约等于每秒1000万亿次的计算速度。而且，聊天嘛，不能我说一句话，等你半天才回应；运算速度和网络传输速度都必须足够快才行。可见，“猜不透”的算力是非常惊人的。遗憾的是，即使对于人类目前拥有的少数“超强大脑”来说，“绞尽脑汁”也无法与“猜不透”的算力相媲美。

更可怕的是：“不怕学霸学习好，就怕学霸好学习”（请参看我的微信公众号“医用生物力学”里的相关文章）。“猜不透”一直在不停地学习和升级。早在2017年，人工智能研究公司OpenAI就发布了GPT-1，是一个能够生成人类文本的语言处理模型，其在预测下一个单词的任务中表现出色。2019年，OpenAI发布了GPT-2模型，其可生成高质量的自然语言文本，但因担心滥用而未公开全部模型参数。2020年，OpenAI发布了GPT-3模型，是当时最大的自然语言处理模型，拥有1.75万亿个参数，能够执行各种语言任务，如对话、翻译、摘要等。2022年12月，一个名为“ChatGPT”的GPT-3.5诞生，他就像一条“鲶鱼”搅动了整个市场。在5天之内吸引了100万用户；然后在2个月内吸引了1亿用户。从上线开始算，到达1亿用户，TikTok花了大约9个月，Instagram花了大约两年半，而ChatGPT只用了60天。2023年3月14日，OpenAI公布了最新版本——GPT-4。GPT-4产生正确回应的可能性要比GPT-3.5高出40%，新模型将产生更少的错误答案，更少地偏离谈话轨道，更少地谈论禁忌话题。长江后浪推前浪，ChatGPT的新版本不断把旧版本拍到沙滩上。

尽管如此，“猜不透”从出生到成长到现在，毕竟还是个新事物，也就相当于人类的婴幼儿阶段，还没有准备好做任何重要的事情！不过，他一直在不断进化之中。短期内“猜不透”的发展方向可能成为每一个人的工作、学习以及生活的助理，反过来又进一步充实他自身的知识和算法，让他变得越来越智能、越来越聪明。无法想象，不久的将来，“猜不透”这个“超人”会聪明绝顶而“膨胀”到什么程度？！

4. 面对“超人”，我们能做什么？

如果你把“猜不透”仅仅看成一个用来聊天解闷的网友，那就白白浪费了这个“超人”的超人能耐啦！

“猜不透”不仅给人工智能领域注入了一针强心剂，而且也给我这样的“科研民工”打上了一针兴奋剂。

我就在想啊……

敲黑板，划重点！

目前的科研创新模式，大致是靠个人或者团队的比拼而艰苦奋斗来实现的。这其中，人们学习知识的过程必然花费很长的时间，仅仅是掌握必要的专业知识就疲于应付了，更别说精通多学科的复杂知识了。这就大大限制了科技进步的快速发展。特别是在面临“百年未有之大变局”的时候，“我兔”需要解决很多“卡脖子”的重要科学技术问题，小众的力量总是显得力不从心、难以应付。

从认识“猜不透”那一刻起，我想到了一个针对上述问题的解决方案。“猜不透”是个汇集全人类智慧的一个“超人”，能不能把“猜不透”拿来做科研呢？咱就是说，“我兔”自己孕育一个亲生的“超人”，专门解决科学研究的“卡脖子”问题。我们这些“科研民工”每天苦哈哈地“挖矿”搞创新，还难有什么成果，不如把各自积累的一点点经验知识（也就是数据）都交给“超人”，让他替我们记忆、学习、分析、创新。反过来，“超人”可以为每个“科研民工”提供想要的资源和解决方案。要知道，科研的初级阶段就是枯燥的、大量的学习知识和积累数据，然后才是创新联想和逻辑推理；而人工智能的大部分工作是构建数据库，然后才是利用算法进行数据处理和分析、得出决策结果。人机结合起来，往往能优势互补，发挥各自更大的潜力，从此开启科研创新的新模式。

这个“新生儿”的养育，需要每个人的奉献和努力，更需要国家层面的组织和管理，涉及到政策和技术层面的顶层设计。毕竟，这样一个“超人”会动了绝大多数人的奶酪。亲，你能接受吗？我想听到：YES, I DO！

穿过人海，别停下来，趁现在还有期待……

“超人”降生

微信扫一扫：分享