我知道,size
是输出向量的维度,如果是size=400
,它会比size=100
更好地捕捉内容。
但是,我不明白,size
代表什么?这是否意味着Doc2Vec将从一个单词中查找多远,以预测下一个单词?或者这是什么意思?
非常感谢,
发布于 2016-07-29 02:42:26
size
是创建的向量中的维数。因此size=100
意味着每个文档(实际上是document-tag)从训练中接收一个100维向量。
维度越多并不总是越好:它们意味着更慢的训练和更大的模型。如果你正在处理一个小的数据集,太多的维度有过度拟合的风险--阻止模型在数据中表示可概括的模式。
https://stackoverflow.com/questions/37861873
复制相似问题