终于......阿法狗被打败了中国科技网 2017-10-23 |
人工智能领域出现新突破——据英国《自然》杂志18日发表的论文报道,一款新版的“阿法狗”(AlphaGo)计算机程序能够从空白状态起,在不需要任何人类指导的条件下,迅速“自学成才”。这款名叫“阿法狗—零”(AlphaGo Zero)的新程序,以100比0的战绩打败了旧版“阿法狗”。
人工智能的最大挑战,是研发一种能从零开始、以超人类的水平学习复杂概念的算法。在2016年3月一场世所瞩目的比赛中,谷歌旗下深度思维(DeepMind)公司的“阿法狗”软件击败了人类围棋世界冠军。但为了赢得这场比赛,科学家在训练“阿法狗”时,同时用到了监督式学习(基于上百万种人类专业选手的下棋步骤)和基于自我对弈的强化学习。其训练过程长达几个月,用到多台机器和48个TPU(神经网络训练所需的专业芯片)。
此次在最新论文中,英国深度思维公司“阿法狗”项目主要负责人戴维·西尔弗、戴密斯·哈萨比斯及其同事,报告了新版“阿法狗”软件——“阿法狗—零”。与前辈版本在刚开始学习围棋时要依靠人类知识不同,新软件的学习从“零”开始,且单纯基于与自己的对弈,人类的输入仅限于棋盘和棋子,没有任何其他数据。“阿法狗—零”仅使用一台机器和4个TPU,依靠一张经过训练的神经网络来预测程序自身的棋步和棋局的赢家,在每次自我对弈中飞速进步。
通过几天的训练——包括近500万局自我对弈——“阿法狗—零”已能够超越人类并打败所有之前的“阿法狗”版本。在程序训练的过程中,它独立发现了人类用几千年才总结出来的围棋规则,还建立了新的战略,为这个古老的游戏带来新见解。
本文由科普中国专家北京工业大学教授、博士生导师,中国人工智能学会科普工作委员会秘书长于乃功进行科学性把关
责任编辑:李阳阳
上一篇:智商太高,也有烦恼
下一篇:你需要机器人陪伴吗?
最新文章
-
为何太阳系所有行星都在同一平面上旋转?
新浪科技 2021-09-29
-
我国学者揭示早期宇宙星际间重元素起源之谜
中国科学报 2021-09-29
-
比“胖五”更能扛!我国新一代载人运载火箭要来了
科技日报 2021-09-29
-
5G演进已开始,6G研究正进行
光明日报 2021-09-28
-
“早期暗能量”或让宇宙年轻10亿岁
科技日报 2021-09-28
-
5G、大数据、人工智能,看看现代交通的创新元素
新华网 2021-09-28