在知乎上看到一篇文章 AlphaZero实践——中国象棋_象棋吧

04月18日漏签0天

象棋吧关注：278,097贴子：6,097,803

16回复贴，共1页

<返回象棋吧

在知乎上看到一篇文章 AlphaZero实践——中国象棋

只看楼主收藏回复

知乎用户程世东原创文章

送TA礼物

IP属地:广西

1楼2018-04-07 13:44回复

作者最后说：
我来说说训练情况，因为是从白板一块开始训练，刚开始都是乱下，从乱下的经验当中学会下棋是需要大量对弈才行的。解的空间是很稀疏的，相当于100个数据，有99个是负例，只有1个正例。论文中训练了700K次的mini-batch，国际象棋开源项目chess-alpha-zero也训练了10K次。我呢，训练不到4K次，模型刚刚学会用象和士防守，总之仍然下棋很烂。如果您有条件可以再多训练试试，我自从收到信用卡扣款400美元通知以后就把aws下线了：D 贫穷限制了我的想象力O(∩_∩)O

IP属地:广西

2楼2018-04-07 13:46

想说明什么呢？

IP属地:重庆

来自Android客户端3楼2018-04-07 13:49

可以笃定的是，这玩意训练出来，会狠惊吓人下

IP属地:重庆

来自Android客户端4楼2018-04-07 13:50

我只知道巨杰克才是中象完美战斗体，类似龙珠的沙鲁

IP属地:广西

5楼2018-04-07 13:51

有模型吗？发给我，我这边有超算

来自Android客户端6楼2018-04-07 14:15

收起回复

解压后放到项目根目录下即可，文件夹名叫做gpu_models
现在介绍下命令如何使用：
命令分为两类，一类是训练，一类是下棋。
训练专用：
--mode 指定是训练（train）还是下棋（play），默认是训练
--train_playout 指定MCTS的模拟次数，论文中是1600，我做训练时使用1200
--batch_size 指定训练数据达到多少时开始训练，默认512
--search_threads 指定执行MCTS时的线程个数，默认16
--processor 指定是使用cpu还是gpu，默认是cpu
--num_gpus 指定gpu的个数，默认是1
--res_block_nums 指定残差块的层数，论文中是19或39层，我默认是7
下棋专用：
--ai_count 指定ai的个数，1是人机对战，2是看两个ai下棋
--ai_function 指定ai的下棋方法，是思考（mcts，会慢），还是直觉（net，下棋快）
--play_playout 指定ai进行MCTS的模拟次数
--delay和--end_delay默认就好，两个ai下棋太快，就不知道俩ai怎么下的了：）
--human_color 指定人类棋手的颜色，w是先手，b是后手
训练命令举例：
python main.py --mode train --train_playout 1200 --batch_size 512 --search_threads 16 --processor gpu --num_gpus 2 --res_block_nums 7
下棋命令举例：
python main.py --mode play --ai_count 1 --ai_function mcts --play_playout 1200 --human_color w

IP属地:广西

8楼2018-04-07 16:46

收起回复

不明觉厉！

IP属地:山东

来自Android客户端10楼2018-04-07 17:02

不明觉厉(⊙o⊙)

IP属地:广东

来自Android客户端11楼2018-04-07 18:34

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频！

贴吧热议榜

16回复贴，共1页

<返回象棋吧

发表回复

发贴请遵守贴吧协议及“七条底线”贴吧投诉

内容:

使用签名档查看全部

发表

保存至快速回贴

日	一	二	三	四	五	六

在知乎上看到一篇文章 AlphaZero实践——中国象棋

登录百度账号

扫二维码下载贴吧客户端