象棋吧 关注:278,097贴子:6,097,803
  • 16回复贴,共1

在知乎上看到一篇文章 AlphaZero实践——中国象棋

只看楼主收藏回复

知乎用户程世东原创文章


IP属地:广西1楼2018-04-07 13:44回复
    作者最后说:
    我来说说训练情况,因为是从白板一块开始训练,刚开始都是乱下,从乱下的经验当中学会下棋是需要大量对弈才行的。解的空间是很稀疏的,相当于100个数据,有99个是负例,只有1个正例。论文中训练了700K次的mini-batch,国际象棋开源项目chess-alpha-zero也训练了10K次。我呢,训练不到4K次,模型刚刚学会用象和士防守,总之仍然下棋很烂。如果您有条件可以再多训练试试,我自从收到信用卡扣款400美元通知以后就把aws下线了:D 贫穷限制了我的想象力O(∩_∩)O


    IP属地:广西2楼2018-04-07 13:46
    回复
      想说明什么呢?


      IP属地:重庆来自Android客户端3楼2018-04-07 13:49
      回复
        可以笃定的是,这玩意训练出来,会狠惊吓人下


        IP属地:重庆来自Android客户端4楼2018-04-07 13:50
        回复
          我只知道巨杰克才是中象完美战斗体,类似龙珠的沙鲁


          IP属地:广西5楼2018-04-07 13:51
          回复
            有模型吗?发给我,我这边有超算


            来自Android客户端6楼2018-04-07 14:15
            收起回复
              解压后放到项目根目录下即可,文件夹名叫做gpu_models
              现在介绍下命令如何使用:
              命令分为两类,一类是训练,一类是下棋。
              训练专用:
              --mode 指定是训练(train)还是下棋(play),默认是训练
              --train_playout 指定MCTS的模拟次数,论文中是1600,我做训练时使用1200
              --batch_size 指定训练数据达到多少时开始训练,默认512
              --search_threads 指定执行MCTS时的线程个数,默认16
              --processor 指定是使用cpu还是gpu,默认是cpu
              --num_gpus 指定gpu的个数,默认是1
              --res_block_nums 指定残差块的层数,论文中是19或39层,我默认是7
              下棋专用:
              --ai_count 指定ai的个数,1是人机对战,2是看两个ai下棋
              --ai_function 指定ai的下棋方法,是思考(mcts,会慢),还是直觉(net,下棋快)
              --play_playout 指定ai进行MCTS的模拟次数
              --delay和--end_delay默认就好,两个ai下棋太快,就不知道俩ai怎么下的了:)
              --human_color 指定人类棋手的颜色,w是先手,b是后手
              训练命令举例:
              python main.py --mode train --train_playout 1200 --batch_size 512 --search_threads 16 --processor gpu --num_gpus 2 --res_block_nums 7
              下棋命令举例:
              python main.py --mode play --ai_count 1 --ai_function mcts --play_playout 1200 --human_color w


              IP属地:广西8楼2018-04-07 16:46
              收起回复
                不明觉厉!


                IP属地:山东来自Android客户端10楼2018-04-07 17:02
                回复
                  不明觉厉(⊙o⊙)


                  IP属地:广东来自Android客户端11楼2018-04-07 18:34
                  回复