阿尔法狗再进化 可以完全靠自己学习围棋

10月19日消息,谷歌旗下人工智能研究部门DeepMind发布了新版AlphaGo(阿尔法狗)软件,它可以完全靠自己学习围棋。这款名为AlphaGo Zero的系统可以通过自我对弈进行学习,它利用了一种名为强化学习的技术。在不断训练的过程中,这套系统开始靠自己的能力学会围棋中的一些高级概念。团队称,AlphaGo Zero的水平已超过之前所有版本的AlphaGo。对阵李世石那版AlphaGo时,它取得100:0的压倒性战绩。

在以往版本AlphaGo与人类的对决中,我们输的并不服气。因为AlphaGo学习了千年来所有的人类高手,吸收了太多人类的智慧,相当于站在巨人的肩上。更恐怖的是,没有任何人类选手的记忆力和知识储备可以超过它,几乎永远不会出现失误,这本身就是不公平的。

AlphaGo Zero的出现让我们彻底心服口服。AlphaGo Zero完全不依赖于人类数据,在只知道比赛规则的情况下自我对弈,3天训练后就以100比0击败了上一版本的AlphaGo。这种上升速度超越了古往今来所有的对手。

人工智能研究长期以来的目标是“创造出在没有人类输入的条件下,在最具挑战性的领域实现超越人类能力的算法。”AlphaGo Zero的成功让这个目标提前实现,标志着人类在人工智能的研究上迈出了一大步。

大数据的重要性进一步被削弱,在很多领域,人类数据,尤其是专家数据,往往太过昂贵,或者根本无法获得。如果AlphaGo Zero可以应用到其他领域,这些突破就有可能产生巨大的影响力与生产力。



来源:http://www.sohu.com/a/198885699_395138