围棋吧 关注:339,227贴子:10,281,054
  • 9回复贴,共1

简单说下围棋的AI吧

只看楼主收藏回复

前几天刚学完深度学习算法和alphago
发现以前对alphago有一定误解,以至于对下面的两句话不能深刻理解
1:运行alphago够需要消耗大量的计算资源,一般人用不起
2:运行简化版alphago比完全版alphago弱很多


1楼2017-01-03 11:01回复
    计算机的速度越来越快,算法也越来越进步,迟早会出现pc上能下赢职业选手的软件的


    IP属地:广东2楼2017-01-03 11:05
    收起回复
      alphago, 其实可以分解为:
      1. 深度神经网络算法
      2.一些额外策略补充
      其中,深度神经网络是12层,重要的是它的参数,
      求这些参数的确需要大量的时间,50个gpu算了三周才算出来,
      算出来后又花了大量的时间左右互搏来微调


      3楼2017-01-03 11:06
      回复
        问题在于, 一旦这些参数求出来了, 真正做成执行文件使用的时候
        每一步其实就是一瞬间的事
        所以,简化版的alpha只包含深度神经网络算法, 其实是随便一台电脑都能运行
        举个最直观的例子:
        大家都知道google翻译也用的深度学习算法, 算参数的时候也算了很久(据说算了300mb的参数)
        但是真正使用的时候, googl翻译只需要点一下就能秒出


        4楼2017-01-03 11:10
        回复
          以前我还以为, 类似alphago的软件只有大公司才用得起,而且运行成本太高
          现在才知道, 真正在比赛中占用计算资源的只是那无关紧要的 额外策略补充
          真正的核心程序,只要给了参数,随便什么人都能用


          5楼2017-01-03 11:14
          收起回复
            选点的直觉和局面判断的直觉确实是一秒出来,因为参数已经确定,局面作输入自然很快出来。求解参数的过程即学习过程才是漫长的。
            但阿狗真的下棋并不是只有一层选点啊,这其中也包括搜索,即蒙特卡洛搜索。这个搜索的广度深度是很费时间的,需要很好的硬件支撑。即你根据参数直觉确定了一组可能的选点,判断了当前局面的胜率,然后他会对每个选点进行对方走子的选点,又是一堆,然后在自己走子的选点一直这么下去展开一个博弈树,显然这个过程和传统软件没撒差别,是很耗时的,而且搜索树越深最终选点也越准确(其实就是反复调用参数进行局面判断的选点层层下推,对当前局面走子的验真过程)。
            所以单机版本和分布式差距还是很大的。不过由于训练的好,一般来说单机版本参数直接算出的值(即直觉)已经有很高的准确度


            IP属地:上海6楼2017-01-03 11:28
            回复
              确实是这样。所以去年8月美国围棋大会上,Aja说如果阿法狗运行在手机上,也能轻松击败他。


              IP属地:河北7楼2017-01-03 11:30
              回复