我是调查微软翻译文本API。我了解到它有两种类型的翻译器模型,更新的深层神经网络模型DNN和传统的统计机器翻译( SMT )。
我还找到了下面的说明,
Microsoft Translator supports 60 languages for text translation through the Microsoft Translator API.
然而,我无法找到DNN模型所涵盖的可能语言。DNN模型涵盖60种语言吗?请告诉我。
我正在用Pytorch编写序列神经网络的序列。在official Pytorch seq2seq tutorial中,有一个注意力解码器的代码,我不能理解/认为可能包含错误。 它通过连接输出和此时的隐藏状态来计算每个时间步的注意力权重,然后乘以一个矩阵,得到一个大小等于输出序列长度的向量。注意,这些注意力权重不依赖于编码器序列(在代码中命名为encoder_outputs ),我认为它应该依赖于编码器序列。 此外,the paper cited in the tutorial还列出了三种不同的得分函数,可用于计算注意力权重(本文的3.1节)。这些函数都不是简单地连接和乘以一个矩阵。 因此,在
我想知道编码器的隐藏状态对于注意力网络有多有用。当我研究一个注意力模型的结构时,我发现一个模型通常是这样的:
x: Input.
h: Encoder's hidden state which feeds forward to the next encoder's hidden state.
s: Decoder's hidden state which has a weighted sum of all the encoder's hidden states as input and feeds forward to the next decoder'
我已经使用tensorflow设计了一个转换器模型。该模型的目标是生成一个文本序列,理想情况下是一个问题,然后是一个给定输入句子的答案。
我有一些数据点(大约15k ),其格式如下
SOURCE SENTENCE: <@>A man in the distance is walking past a brick wall painted with words and graffiti.<#>where<%>wall<?>brick
TARGET SENTENCE: <^>where is the man walking ?<~&
我目前正在尝试用C++编写一个扮演炸弹人的人工智能,我想用CNTK将其实现为神经网络(强化学习)。该工具包有很多教程和示例,甚至有一个用于强化学习,但它是用python编写的,我不知道。
有没有使用CNTK教授强化学习的实用C++示例或教程?
我最关心的第一个问题是如何使用CNTK C++ api创建模型。
我做了神经网络,它是pre-trained for 180 days of data.
It filters the fraud data of credit cards everyday and 1-days new data is comming in.
我还想在过滤之后,
我想重新训练我的人工智能模型,但我只想使用新的1天数据(因为训练神经网络真的很费时)。
我的人工智能模型是0(非欺诈)/1(欺诈)分类模型。我想用1/181改变我的神经网络.因为数据量只是一天
我该如何训练神经网络?如果我只使用了一天的数据,运行了许多时代(时间),它将过度适合.通过早停,似乎一天的数据列车不是.足够.