阿尔法狗再进化 自学3天击败李世石版旧狗

来源:太平洋电脑网  2017/10/19 13:14:12  作者:纪小北  浏览次数:

  如皋商务信息网讯 北京时间19日01:00,谷歌旗下人工智能研究部门DeepMind发布了新版AlphaGo(阿尔法狗)软件,它可以完全靠自己学习围棋。这款名为AlphaGo Zero的系统可以通过自我对弈进行学习,它利用了一种名为强化学习的技术。在不断训练的过程中,这套系统开始靠自己的能力学会围棋中的一些高级概念。

  经过3天的训练后,这套系统已经可以击败AlphaGo Lee,也就是去年击败韩国顶尖棋手李世石的那套系统,而且比分高达100比0。经过40天训练后,它总计运行了大约2900万次自我对弈,使得AlphaGo Zero得以击败AlphaGo Master(今年早些时候击败世界冠军柯洁的系统),比分为89比11。

  结果表明,具体到不同技术的效果,人工智能在这一领域仍有很多学习的空间。AlphaGo Master使用了很多与AlphaGo Zero相同的开发技术,但它需要首先利用人类的数据进行训练,随后才切换成自我对弈。

  值得注意的是,虽然AlphaGo Zero在几周的训练期间学会了一些关键概念,但该系统学习的方法与人类有所不同。另外,AlphaGo Zero也比前几代系统更加节能,AlphaGo Lee需要使用几台机器和48个谷歌TPU机器学习加速芯片,其上一代AlphaGo Fan则要用到176个GPU芯片,AlphaGo Zero只需要使用一台配有4个TPU的机器即可。

  对于希望利用人工智能推动人类社会进步为使命的DeepMind来说,围棋并不是AlphaGo的终极奥义,他们的目标始终是要利用AlphaGo打造通用的、探索宇宙的终极工具。AlphaGo Zero的提升,让DeepMind看到了利用人工智能技术改变人类命运的突破。他们目前正积极与英国医疗机构和电力能源部门合作,提高看病效率和能源效率。(原标题:“阿尔法狗”再进化:“自学”3天高分赢过旧版)

猜您喜欢的

经营性网站 网络备案 公共信息安全网络监察 不良信息举报中心 W3C CSS验证完美通过 文明网