从国象那边来,懂一些程序设计。围棋纯纯外行。
NNUE算法大家可能有一些了解,简略的说就是在传统的Min-Max & Alpha-Beta搜索算法中,用一个浅层的快速神经网络来代替人工估价函数。
从我的浅薄视点看来围棋NNUE完全有实现的潜力,围棋规则天生就是一个可以增量更新的棋盘(可快速更新)。用现存的强软(比如KataGO)给出的局面胜率与自对弈结果加权平均后作为标签进行监督学习。
想请教一下吧友们的看法,这样的思路是否是可行的呢?
NNUE算法大家可能有一些了解,简略的说就是在传统的Min-Max & Alpha-Beta搜索算法中,用一个浅层的快速神经网络来代替人工估价函数。
从我的浅薄视点看来围棋NNUE完全有实现的潜力,围棋规则天生就是一个可以增量更新的棋盘(可快速更新)。用现存的强软(比如KataGO)给出的局面胜率与自对弈结果加权平均后作为标签进行监督学习。
想请教一下吧友们的看法,这样的思路是否是可行的呢?