勤勤恳恳的阳傻通过大师的指点终于习得了蒙特卡洛树搜索算法,这个算法诀窍就是通过模拟大量的随机均匀落子来寻找出胜率高的位置。所以说蒙特卡洛树搜索算法也可以看做是一个策略提升算法,它将随机落子算法这一简单的策略通过大量的模拟进行提升。
在前两次的文章中,我们分别介绍了如何用python写一个蒙特卡洛树搜索算法以及如何用python写一个五子棋游戏。这一次的文章是对前两篇的代码进行了整理。
在terminal中运行下面的命令就可以下载到前两次的全部代码:
下载完代码之后运行:
就可以玩一个三子棋游戏,玩家一是阳傻,玩家二就是你自己。
现在阳傻的蒙特卡洛算法只是对随机均匀落子策略进行提升,所以现在聪明的元宝还是能够轻松的击败阳傻的。
但假如我们能使用一个神经网络来代替随机均匀落子策略呢(这就是AlphaGo算法)?敬请期待明天神经网络教程与后天AlphaGo教程吧。
领取专属 10元无门槛券
私享最新 技术干货