我想知道是否有可能提供一些在H2O DeepWater R版本中使用word2vec和cnn进行文本分类的r示例代码?关于mexnetR或h2o deep water r的文档非常少
我已经使用h2o r版本包训练了我的word2vec word embedding词汇表和文档单词向量矩阵。我想知道是否有任何示例代码可以将查找表和原始文本组合到使用mxnetR (自定义迭代器) CNN分类模型中,或者使用h2o r直接构建CNN。
我之所以这样问,是因为如果我一次将所有数据转换为数组格式,那么我的机器将没有足够的内存来支持它。
我正在尝试训练一个用于对象分类的CNN。因此,除了图像之外,我还想输入一些文本特征。
我在这里找到了一个这样做的例子
作者构建了两个模型,一个用于图像识别的CNN模型和一个用于文本识别的普通ANN模型。最后,他将它们合并在一起,并应用softmax激活。因此,他的管道如下所示:
merged = Merge([cnn_model, text_model], mode='concat')
### final_model takes the combined models and adds a sofmax classifier to it
final_model = Seque
我使用这个脚本来获取数组中文本区域中的每一行:
//trim off excess whitespace off the whole
$text = trim(get_field('backlinks'));
//explode all separate lines into an array
$textAr = explode("\n", $text);
//trim all lines contained in the array.
$textAr = array_filter($textAr, 'trim');
//loop thro