我正在为推荐API评估Doc2Vec。我找不到一个合适的预先训练过的模型,所以我在语料库上训练了一个模型,大约有8000个小文档。
model = Doc2Vec(vector_size=25,
alpha=0.025,
min_alpha=0.00025,
min_count=1,
dm=1)
然后我在语料库中循环查找每一份文件的类似文件。结果不太好(与TF-国防军相比)。注意,这是在测试不同的时代和矢量大小之后。
i
我正在开发一个应用程序,使用wit作为一种服务。现在,我很难训练它。在我的应用程序中,我有三个意图:
打电话
到文本
发送图片
下面是我的培训示例:
Call this number 072839485 and text this number 0623744758 and send picture to this number 0834952849.
Call this number 072839485, 0834952849 and 0623744758
在我的第一次训练中,我用所有三个意图标记了这句话,072839485为phone_number (角色to_cal