well): "井"为两侧都有方块(或墙壁)填充的空列;
消除行数 (Lines cleared): 当前方块下落后可以消除的行数;
评估函数即为9组特征与其权重的线性组合, 即
score = w_...变异
最后, 在新一代模型中随机选择出20%的个体, 在其参数上添加50%的高斯噪声, 以引入新的随机性....但"确定性"使得我们可以对这10000种局面进行分段处理, 对每个分段选择最适合的模型来保证不死/高分策略.
确定了这种方式后, 原本的问题就变成了两个子问题:
如何分段?...如何保证分段之间, 模型之间的顺利衔接?
4.1 如何分段
均匀分配最简单直接: 比如均匀分割成200个段, 每个模型处理50个方块的掉落摆放....但是这个分段大小的参数其实并不容易选择, 因为针对某个特定的模型, 其可以有效处理的方块个数是不确定的.