让AI自发推理!引发热议的“DeepSeek”到底是个啥?

科普中国
公众科普,科学传播。
收藏

当地时间1月27日,纳斯达克股指出现3%下跌,原因是中国人工智能公司DeepSeek模型引发美国投资者关注。

央视记者在纳斯达克交易所现场对纳斯达克副主席麦柯奕进行了采访。麦柯奕表示,他认为,DeepSeek将是人工智能领域革命的重要组成部分。

因受到DeepSeek人工智能模型冲击,美国芯片巨头英伟达(NVIDIA)当日股价暴跌约17%,博通公司股价下跌17%,超威半导体公司(AMD)股价下跌6%,微软股价下跌2%。此外,人工智能领域的衍生品,如电力供应商也受到重创。美国联合能源公司股价下跌21%,Vistra的股价下跌29%。

图虫创意-944323507260358685.jpeg

版权图库图片,转载可能引发版权纠纷

01 最新开源模型R1引发关注

本月,DeepSeek在世界经济论坛2025年年会开幕当天发布了最新开源模型R1,再次引发全球关注。

据介绍,R1模型在技术上实现了重要突破——用纯深度学习方法让AI自发涌现出推理能力,在数学、代码、自然语言推理等任务上,性能比肩OpenAI的o1模型正式版,且训练成本仅为560万美元,远低于美国科技巨头的数亿美元乃至数十亿美元投入。

02 DeepSeek到底是个啥?

DeepSeek是一款由国内人工智能公司研发的大型语言模型,拥有强大的自然语言处理能力,能够理解并回答问题,还能辅助写代码、整理资料和解决复杂的数学问题。

与OpenAI开发的ChatGPT相比,DeepSeek不仅率先实现了媲美OpenAI-o1模型的效果,还大幅降低了推理模型的成本。其新模型DeepSeek-R1以十分之一的成本达到了GPT-o1级别的表现,引发海外AI圈的广泛讨论。

北京邮电大学人工智能学院人机交互与认知工程实验室主任刘伟介绍,DeepSeek最大的优势在于算法的改进和优化,节省了算力和数据量。以前如果说OpenAI是“大力出奇迹”,如今DeepSeek则是“小力也可以出奇迹”——小的算力用新的方法也能创造奇迹。

03 更大不再等于更聪明

据深度求索公司官网介绍,DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有很少标注数据的情况下极大提升了模型的推理能力,在数学、代码、自然语言推理等任务上,测评性能与GPT-o1模型正式版接近。

国际投行摩根士丹利表示,“更大(的模型)不再等于更聪明”,DeepSeek通过显著提高数据质量和改进模型架构,展示了一条与之前大模型不同的高效训练途径。摩根士丹利说,DeepSeek的模型现在低成本优势突出,与国际知名大模型相比,其成本大约低了一个数量级。

高盛集团也认为,DeepSeek新模型的成本远低于现有模型,这意味着开发利用大模型的门槛降低,互联网巨头将面临初创公司的潜在竞争。

英国《金融时报》发表的一篇评论文章指出,DeepSeek挑战了人工智能产业在过去一段时间的核心信念,即认为更强大的硬件才是推动人工智能发展的关键。

图虫创意-913608881867718707_副本.jpg

版权图库图片,转载可能引发版权纠纷

04 开源:未来的发展方向?

DeepSeek采用了完全开源策略,不仅降低了用户的使用门槛,还促进了AI开发者社区的协作生态。通过开源,DeepSeek吸引了大量开发者和研究人员的关注,推动了AI技术的发展。英伟达AI科学家Jim Fan称赞DeepSeek是“真正开放的前沿研究,赋能所有人”。

当然,开源也面临着保护知识产权和开源社区秩序维护等挑战。

俞扬表示,开源只是一种商业模式,即便开源项目也拥有版权。开源与闭源之争,实质上是不同商业模式在特定场景和时代背景下的有效性对比。

DeepSeek的成功被一些人视为中国技术理想主义的体现,甚至被外国人比喻为神秘的东方力量。

但从整个AI大模型产业来看,DeepSeek的成功或许代表了一种全新的发展方向——通过算法优化而非单纯依赖算力和数据量来提升模型性能。这一方向也为AI大模型产业的发展提供了新的思路。

综合来源:央视新闻、中央广电总台中国之声、新华社等

评论
桂林科普小达人
太师级
Deepseek模型是中国AI发展的有力引擎,凭借自主创新能力,在国际AI舞台崭露头角,吸引顶尖人才汇聚,激发产业活力,促进产学研深度融合,为中国AI在全球竞争中抢占先机,意义非凡。
2025-01-31
桂林科普小达人
太师级
Deepseek模型是中国AI发展的关键力量,打破国外技术垄断,提升本土科研实力,加速产业智能化转型,拓宽应用边界,推动AI技术在各领域落地生根,为中国AI崛起筑牢根基,引领行业大步向前迈进。
2025-01-31
桂林科普小达人
太师级
DeepSeek模型堪称AI领域的璀璨新星!它拥有强大的语言理解与生成能力,能精准把握复杂语义,输出内容逻辑清晰、连贯流畅,无论是撰写文案、回答问题,还是进行创意写作,都表现得极为出色。在处理多领域任务时,展现出卓越的通用性和适应性,可轻松应对科研、教育、商业等各种场景的需求。同时,其训练速度快、性能稳定,能为用户带来高效、可靠的服务体验,正以强劲的实力推动AI应用迈向新高度,成为推动行业发展的重要力量!
2025-01-31