开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

如何在tensorflow中使用波束搜索解码器中的调度采样。

在TensorFlow中使用波束搜索解码器中的调度采样，可以通过以下步骤实现：

首先，确保已经安装了TensorFlow库，并导入所需的模块：import tensorflow as tf from tensorflow.python.ops import rnn
定义波束搜索解码器的参数，包括波束宽度（beam width）、最大解码步数（max decoding steps）等：beam_width = 5 max_decoding_steps = 10
创建解码器的输入数据，包括编码器输出（encoder output）、编码器状态（encoder state）等：encoder_output = ... encoder_state = ...
定义解码器的单个时间步的解码函数，用于生成下一个时间步的解码结果：def decode_fn(inputs, state): # 定义解码器的逻辑，例如使用循环神经网络（RNN）进行解码 ... return logits, new_state
使用tf.contrib.seq2seq.BeamSearchDecoder创建波束搜索解码器，并指定解码函数、解码器的初始状态等参数：decoder = tf.contrib.seq2seq.BeamSearchDecoder( cell=decoder_cell, embedding=embedding, start_tokens=start_tokens, end_token=end_token, initial_state=decoder_initial_state, beam_width=beam_width, output_layer=output_layer, length_penalty_weight=0.0 )
调用解码器的dynamic_decode方法进行解码，得到解码结果：outputs, _, _ = tf.contrib.seq2seq.dynamic_decode( decoder=decoder, maximum_iterations=max_decoding_steps )

以上是在TensorFlow中使用波束搜索解码器中的调度采样的基本步骤。具体实现时，需要根据具体的模型架构和数据情况进行适当的调整和扩展。关于TensorFlow的更多详细信息和示例代码，可以参考腾讯云的TensorFlow产品介绍。

相关搜索:使用tensorflow概率中的证据从贝叶斯网络中采样使用tensorflow概率从分布中采样时，张量是不可消除的错误(在colab上)使用TensorFlow和tf.data.Dataset对文件夹中的图像序列进行采样如何在discord.py中使用cogs中的调度库？Tensorflow使用:编解码器无法解码位置XX中的字节XX :无效的继续字节如何在使用Fusejs的搜索中忽略某些术语？如何在Quartz.net中通过DI使用添加的调度器使用Keras /Tensorflow使用文本摘要的注意力模型解释LSTM编解码器中的model.fit 如何在tensorflow中使用map_fn中的稀疏张量如何在一维阵列中仅使用Tensorflow中的最大/平均池层？如何在awk脚本中使用搜索模式中的变量如何在SQL中的SELECT请求中使用重复搜索如何在API控制器中创建带参数的GET方法(如排序查询或搜索查询)？如何在Algolia的即时搜索中实现使用每个用户的firebase uid进行搜索？如何在不使用SciPy的情况下从截断高斯分布中采样？如何使用python和openpyxl在excel中搜索特定的列名(而不是A、B等)，如名称、标记？如何在使用selenium搜索网页中的文本时忽略？如何在TensorFlow 2.0中使用Dataset.window()方法创建的窗口？如何在Conv Layer中使用dropout来删除tensorflow中的激活映射？如何在使用CIFAR-10训练的模型中测试我的新图像？(使用tensorflow)

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

如何实现自然语言处理的集束搜索解码器

自然语言处理任务（例如字幕生成和机器翻译）涉及生成单词序列。

08

如何为神经机器翻译配置一个编码器 - 解码器模型

循环神经网络（RNN，Recurrent Neural Networks）中的编码器 - 解码器（Encoder-Decoder）架构在标准机器翻译基准上取得了相当先进的成果，这一架构目前正被工业级翻译服务作为核心来使用。

09

Transformers 4.37 中文文档（十五）

无论您选择哪个框架，您都可以使用 GenerationConfig 类实例对生成方法进行参数化。请参考此类以获取完整的生成参数列表，这些参数控制生成方法的行为。

01

Transformers 4.37 中文文档（九十九）

QuestionAnsweringPipeline 要求用户提供多个参数（即问题和上下文），以映射到内部的 SquadExample。

01

Beam Search、GREEDY DECODER、SAMPLING DECODER等解码器工作原理可视化

与翻译模型类似，我们的图像字幕模型通过输入图像张量和特殊的句首标记（即<start>）来启动字幕生成过程。这个模型生成了我们单词的概率分布（实际上是logits）。橙色方框显示解码算法的选择，帮助我们选择使用哪个单词。然后，选择的单词和图像再次传递给模型，直到我们满足停止条件，即我们获得特殊的句子结束标记（即<STOP>）作为下一个单词，或者我们超过了预先定义的步骤数。一个步骤是将图像和单词的张量传递给字幕生成器模型，并使用解码算法选择单词。

01

谷歌输入法背后的机器智能

很多人每天花费大量时间使用移动设备键盘：撰写电子邮件，发短信，参与社交媒体等。然而，移动键盘仍然在处理速度方面处于劣势。用户平均在移动设备上的打字速度比在物理键盘上慢35％。为了改变这一点，最近谷歌团队为Gboard for Android提供了许多改进，致力于创建一个智能机制的键盘，能够为用户以任何选择的语言提供建议和纠正错误，从而实现更快更高质量的输入。事实上，移动键盘将触摸输入转换为文本的方式类似于语音识别系统将语音输入转换为文本的方式，雷锋网了解到，该团队将利用语音识别的经验来实现触摸输入

07

学界 | 谷歌输入法背后的机器智能：思你所思，想你所想！

很多人每天花费大量时间使用移动设备键盘：撰写电子邮件，发短信，参与社交媒体等。然而，移动键盘仍然在处理速度方面处于劣势。用户平均在移动设备上的打字速度比在物理键盘上慢35％。为了改变这一点，最近谷歌团队为Gboard for Android提供了许多改进，致力于创建一个智能机制的键盘，能够为用户以任何选择的语言提供建议和纠正错误，从而实现更快更高质量的输入。事实上，移动键盘将触摸输入转换为文本的方式类似于语音识别系统将语音输入转换为文本的方式，雷锋网了解到，该团队将利用语音识别的经验来实现触摸输入

07

Attention-lvcsr、Residual LSTM…你都掌握了吗？一文总结语音识别必备经典模型（三）

机器之心专栏本专栏由机器之心SOTA！模型资源站出品，每周日于机器之心公众号持续更新。本专栏将逐一盘点自然语言处理、计算机视觉等领域下的常见任务，并对在这些任务上取得过 SOTA 的经典模型逐一详解。前往 SOTA！模型资源站（sota.jiqizhixin.com）即可获取本文中包含的模型实现代码、预训练模型及 API 等资源。本文将分 3 期进行连载，共介绍 17 个在语音识别任务上曾取得 SOTA 的经典模型。第 1 期：NNLM、RNNLM、LSTM-RNNLM、Bi-lstm、Bi-RN

03

ML Mastery 博客文章翻译 20220116 更新

Machine Learning Mastery 机器学习算法教程机器学习算法之旅利用隔离森林和核密度估计的异常检测机器学习中的装袋和随机森林集成算法从零开始实现机器学习算法的好处更好的朴素贝叶斯：从朴素贝叶斯算法中收益最大的 12 个技巧机器学习的提升和 AdaBoost 选择机器学习算法：Microsoft Azure 的经验教训机器学习的分类和回归树什么是机器学习中的混淆矩阵如何使用 Python 从零开始创建算法测试工具通过创建机器学习算法的目标列表来获得控制权机器学习中算法

03

学界 | 反超GPU：微软提出在CPU上高效解码的神经机器翻译模型

选自arXiv 机器之心编译参与：黄玉胜、李泽南在最近一次机器学习热潮中，GPU 一直是承担神经网络模型训练和处理的主要计算设备，大多数模型都是针对 GPU 进行优化的。最近，微软研究院的 Jacob Devlin 等人发展了另一条路线，他们在神经机器翻译任务中选择 CPU 作为解码的主要计算芯片，并实现了超过 GPU 效能的结果。这或许能为我们优化模型性能带来新的思路。论文：Sharp Models on Dull Hardware: Fast and Accurate Neural Machine

04

教程 | 如何为神经机器翻译配置编码器-解码器模型？

选自machinelearningmastery 作者：Jason Brownlee 机器之心编译参与：Panda 神经机器翻译已经成为了当前表现最好的机器翻译方法，这在很大程度上得益于编码器-解码器架构的应用。Jason Brownlee 近日发表文章对论文《Massive Exploration of Neural Machine Translation Architectures》的研究成果进行了介绍，给出了为神经机器翻译配置编码器-解码器模型的方法和一些实用的建议。编码器-解码器架构的循环神经

05

斯坦福NLP课程 | 第8讲 - 机器翻译、seq2seq与注意力机制

教程地址：http://www.showmeai.tech/tutorials/36

07

教程 | 如何使用贪婪搜索和束搜索解码算法进行自然语言处理

选自MachineLearningMastery 作者：Jason Brownlee 机器之心编译参与：程耀彤、路雪本文介绍了贪婪搜索解码算法和束搜索解码算法的定义及其 Python 实现。自然语言处理任务如图像描述生成和机器翻译，涉及生成一系列的单词。通常，针对这些问题开发的模型的工作方式是生成在输出词汇表上的概率分布，并通过解码算法对概率分布进行采样以生成可能性最大的单词序列。在本教程中，你将学习可用于文本生成问题的贪婪搜索和束搜索解码算法。完成本教程，你将了解：文本生成问题中的解码问题；贪

05

重磅 | 小米首次公开发表论文：基于注意力机制的端对端语音识别（附论文翻译）

文/CSDN周翔今年 3 月，雷军在两会的媒体沟通会上表示，“去年年初，小米设立了探索实验室，不久将有重磅级的人工智能产品发布。” 昨日（7 月 26 日）下午，传闻已久小米人工智能产品——小米 AI 音箱终于现身。在发布会上，王川特意提到了小米脑王刚博士带领的 NLP 团队，也就是说小米已经用上了自己的 NLP 技术。但是语音识别方面，小米 AI 音箱仍然采用了第三方的技术。不过，AI科技大本营发现，就在几天前，小米在 arXiv 上首次提交了一篇端对端的语音识别论文。这篇论文实际上是西工大计算机

06

深度学习算法(第25期)----机器翻译中的编码解码器网络

深度学习算法(第24期)----自然语言处理(NLP)中的Word Embedding 前几期我们一起学习了RNN的很多相关知识，今天我们一起用这些知识，学习下机器翻译中的编码解码网络.

01

tf.nn

atrous_conv2d_transpose(): atrous_conv2d的转置。

01

Seq2Seq模型

前言：此文翻译自TensorFlow tutorial： Sequence-to-Sequence Models 本文的尽量在做到意思正确的情况下，做到不尬翻。但第一次尝试翻译，另加上英语水平有

利用神经网络进行序列到序列转换的学习

深度神经网络是在困难的学习任务中取得卓越性能的强大模型。尽管拥有大量的标记训练集，DNN就能很好地工作，但是它们并不能用于将序列映射到序列。在本文中，我们提出了一种通用的端到端序列学习方法，它对序列结构作出最小的假设。我们的方法使用多层长短期记忆网络(LSTM)将输入序列映射到一个固定维度的向量，然后使用另一个深层LSTM从向量中解码目标序列。我们的主要结果是，在WMT 14数据集的英法翻译任务中，LSTM的翻译在整个测试集中获得了34.8分的BLEU分数，而LSTM的BLEU分数在词汇外的单词上被扣分。此外，LSTM人在长句上没有困难。相比之下，基于短语的SMT在同一数据集上的BLEU得分为33.3。当我们使用LSTM对上述系统产生的1000个假设进行重新排序时，它的BLEU分数增加到36.5，这接近于之前在这项任务中的最佳结果。LSTM还学会了对词序敏感、并且对主动语态和被动语态相对不变的有意义的短语和句子表达。最后，我们发现颠倒所有源句(而不是目标句)中单词的顺序显著提高了LSTM的表现，因为这样做在源句和目标句之间引入了许多短期依赖性，使得优化问题变得更容易。

02

【TensorFlow 谷歌神经机器翻译】从零开始打造属于你的翻译系统

【新智元导读】谷歌今天公布了一个用 TensorFlow 构建神经机器翻译（NMT）系统的教程，全面解释 seq2seq 模型，并演示如何从零开始构建 NMT 翻译模型。这个教程从 NMT 的背景知识讲起，详细讲解如何构建并训练一个 NMT 模型，并提供代码，绝对有用。机器翻译——自动在两种语言之间进行翻译的任务——是机器学习中最活跃的研究领域之一。在多种机器翻译方法中，序列到序列（“seq2seq”）模型最近取得了巨大的成功，并已经成为大多数商业翻译系统的事实上的标准，例如谷歌翻译。这是由于 seq2s

04

6.7k Star量的vLLM出论文了，让每个人都能轻松快速低成本地部署LLM服务

今年六月，来自加州大学伯克利分校等机构的一个研究团队开源了 vLLM（目前已有 6700 多个 star），其使用了一种新设计的注意力算法 PagedAttention，可让服务提供商轻松、快速且低成本地发布 LLM 服务。

03

谷歌大脑Quoc发布Primer，从操作原语搜索高效Transformer变体

目前自然语言处理领域发展的红利都来自于大型的、基于Transformer的语言模型，但这些语言模型的训练成本、推理成本都高到劝退平民炼金术师。

02

谷歌开放GNMT教程：如何使用TensorFlow构建自己的神经机器翻译系统

选自谷歌机器之心编译参与：机器之心编辑部近日，谷歌官方在 Github 开放了一份神经机器翻译教程，该教程从基本概念实现开始，首先搭建了一个简单的NMT模型，随后更进一步引进注意力机制和多层 LSTM 加强系统的性能，最后谷歌根据 GNMT 提供了更进一步改进的技巧和细节，这些技巧能令该NMT系统达到极其高的精度。机器之心对该教程进行简要的描述，跟详细和精确的内容请查看项目原网站。 GitHub 链接：https://github.com/tensorflow/nmt 机器翻译，即跨语言间的自动翻译，

06

Transformers 4.37 中文文档（六）

视觉问答（VQA）是根据图像回答开放式问题的任务。支持此任务的模型的输入通常是图像和问题的组合，输出是用自然语言表达的答案。

01

深度学习：7种范例教程分享

来源商业新知网，原标题：MIT高赞深度学习教程：一文看懂CNN、RNN等7种范例（TensorFlow教程）

03

Seq2Seq、SeqGAN、Transformer…你都掌握了吗？一文总结文本生成必备经典模型（一）

机器之心专栏本专栏由机器之心SOTA！模型资源站出品，每周日于机器之心公众号持续更新。本专栏将逐一盘点自然语言处理、计算机视觉等领域下的常见任务，并对在这些任务上取得过 SOTA 的经典模型逐一详解。前往 SOTA！模型资源站（sota.jiqizhixin.com）即可获取本文中包含的模型实现代码、预训练模型及 API 等资源。本文将分 2 期进行连载，共介绍 10 个在文本生成任务上曾取得 SOTA 的经典模型。第 1 期：Seq2Seq（RNN）、Seq2Seq（LSTM）、Seq2Seq+

01

SpineNet: 通过NAS发现目标检测新架构

机器暴力美学大佬Quoc V. Le 组的最新CVPR 2020 paper， "SpineNet: A Novel Architecture for Object Detection Discovered with Neural Architecture Search" 解读。核心思想是通过搜索特征图尺度重排，解决传统骨干网络尺度持续缩小导致的信息丢失问题。

02

《机器学习实战：基于Scikit-Learn、Keras和TensorFlow》第16章使用RNN和注意力机制进行自然语言处理

自然语言处理的常用方法是循环神经网络。所以接下来会从 character RNN 开始（预测句子中出现的下一个角色），继续介绍RNN，这可以让我们生成一些原生文本，在过程中，我们会学习如何在长序列上创建TensorFlow Dataset。先使用的是无状态RNN（每次迭代中学习文本中的随机部分），然后创建一个有状态RNN（保留训练迭代之间的隐藏态，可以从断点继续，用这种方法学习长规律）。然后，我们会搭建一个RNN，来做情感分析（例如，读取影评，提取评价者对电影的感情），这次是将句子当做词的序列来处理。然后会介绍用RNN如何搭建编码器-解码器架构，来做神经网络机器翻译（NMT）。我们会使用TensorFlow Addons项目中的 seq2seq API 。

02

Nature neuroscience：利用encoder-decoder模型实现皮层活动到文本的机器翻译

距离首次从人脑中解码语言至今已有十年之久，但解码语言的准确性和速度仍然远远低于自然语言。本研究展示了一种通过解码皮层脑电获得高准确率、高自然程度语言的方法。根据机器翻译的最新进展，我们训练了一个递归神经网络，将每个句子长度下诱发的神经活动序列编码为一个抽象的表达，然后逐字逐句地将这个抽象表达解码成一个英语句子。对每个参与者来说，数据包括一系列句子（由30-50个句子多次重复而来）以及约250个置于大脑皮层的电极记录到的同步信号。对这些句子的解码正确率最高可以达到97%。最后，本研究利用迁移学习的方法改进对有限数据的解码，即利用多名参与者的数据训练特定的网络层。本研究发表在Nature neuroscience杂志。

01

Tacotron2、GST、Glow-TTS、Flow-TTS…你都掌握了吗？一文总结语音合成必备经典模型（二）

机器之心专栏本专栏由机器之心SOTA！模型资源站出品，每周日于机器之心公众号持续更新。本专栏将逐一盘点自然语言处理、计算机视觉等领域下的常见任务，并对在这些任务上取得过 SOTA 的经典模型逐一详解。前往 SOTA！模型资源站（sota.jiqizhixin.com）即可获取本文中包含的模型实现代码、预训练模型及 API 等资源。本文将分 2 期进行连载，共介绍 19 个在语音合成任务上曾取得 SOTA 的经典模型。第 1 期：BLSTM-RNN、WaveNet、SampleRNN、Char2Wav

02

全离线，无延迟！谷歌手机更新语音识别系统，模型大小仅80M

识别延迟一直是设备端语音识别技术需要解决的重大问题，谷歌手机今天更新了手机端的语音识别技术——Gboard，重磅推出了一款端到端、全神经、基于设备的语音识别器，支持Gboard中的语音输入。通过谷歌最新的（RNN-T）技术训练的模型，该模型精度超过CTC，并且只有80M，可直接在设备上运行。

03

GPU解码提升40倍，英伟达推进边缘设备部署语音识别，代码已开源

这篇论文提出了一种经过优化的加权式有限状态变换器（WFST/ weighted finite-state transducer）解码器，能够使用图像处理单元（GPU）实现对音频数据的在线流处理和离线批处理。这种解码器能高效利用内存、输入/输出带宽，并为最大化并行使用了一种全新的维特比（Viterbi）实现。内存节省让该解码器能比之前处理更大的图，同时还能支持更多数量的连续流。对 lattice 段进行 GPU 预处理能让中间 lattice 结果在流推理期间返回给请求者。

01

RNNsearch、Multi-task、attention-model...你都掌握了吗？一文总结机器翻译必备经典模型（一）

机器之心专栏本专栏由机器之心SOTA！模型资源站出品，每周日于机器之心公众号持续更新。本专栏将逐一盘点自然语言处理、计算机视觉等领域下的常见任务，并对在这些任务上取得过 SOTA 的经典模型逐一详解。前往 SOTA！模型资源站（sota.jiqizhixin.com）即可获取本文中包含的模型实现代码、预训练模型及 API 等资源。本文将分 3 期进行连载，共介绍 18 个在机器翻译任务上曾取得 SOTA 的经典模型。第 1 期：RNNsearch、Multi-task、attention-mode

02

使用Burpsuite扩展Hackvertor绕过WAF并解密XOR

最近，我一直在忙于开发自己的一个Burp扩展Hackvertor。这是一个具有基于标签转换功能的编码器，相比起Burp内置的解码器它的功能要强大的多。通过标签的转换编码，可以让你轻松的将编码后的内容传递给下一个外部标签，从而执行多级编码操作。

01

秒杀千亿级模型！微软 | 提出代码扩散预训练模型：CODEFUSION，参数仅有75M

扩散模型(Diffusion Models)在图像生成方面表现出了卓越的性能。今天给大家分享的这篇文章，微软研究人员将扩散模型(Diffusion Models)应用到了代码生成领域，提出了CODEFUSION架构，实验结果表明CODEFUSION-75M效果超过了ChatGPT、StarCoder、GPT-3等众多百亿、千亿级参数的模型。

04

深度学习教程 | Seq2Seq序列模型和注意力机制

本系列为吴恩达老师《深度学习专项课程(Deep Learning Specialization)》学习与总结整理所得，对应的课程视频可以在这里查看。

05

seq2seq模型

在⾃然语⾔处理的很多应⽤中，输⼊和输出都可以是不定⻓序列。以机器翻译为例，输⼊可以是⼀段不定⻓的英语⽂本序列，输出可以是⼀段不定⻓的法语⽂本序列，例如：

01

学界 | 新型实时形义分割网络ShuffleSeg：可用于嵌入式设备

选自arXiv 作者：Mostafa Gamal等机器之心编译参与：Panda 表现优良的卷积神经网络往往需要大量计算，这在移动和嵌入式设备以及实时应用上是一个很不利的因素。近日，开罗大学和阿尔伯塔大学的研究者提出了一种能实现实时形义分割的框架 ShuffleSeg。这种方法能在保证分割准确度的同时显著降低对计算资源的需求。机器之心在本文中对该项目进行了简要编译介绍，相关研究的 TensorFlow 代码已发布在 GitHub 上。论文地址：https://arxiv.org/abs/1803.038

08

动态 | Facebook 开源首个全卷积语音识别工具包 wav2letter++

AI 科技评论按：近日，Facebook 人工智能研究院 ( FAIR ) 宣布开源首个全卷积语音识别工具包 wav2letter++。系统基于全卷积方法进行语音识别，训练语音识别端到端神经网络的速度是其他框架的 2 倍多。他们在博客中对此次开源进行了详细介绍。

01

消灭「幻觉」！谷歌全新ASPIRE方法让LLM给自己打分，效果碾压10x体量模型

威斯康星麦迪逊大学和谷歌的研究人员最近开发了一个名为ASPIRE的系统，可以让大模型对自己的输出给出评分。

01

学界 | 谷歌联合英伟达重磅论文：实现语音到文本的跨语言转录

选自arxiv 机器之心编译参与：吴攀、李亚洲、蒋思源机器翻译一直是人工智能研究领域的重头戏，自去年谷歌推出了神经机器翻译（GNMT）服务以来，相关技术的研发并没有止步不前，在多语言翻译和 zero-shot 翻译上也取得了引人注目的进展。近日，谷歌大脑和英伟达联合发布的一篇论文《序列到序列模型可以直接转录外语语音（Sequence-to-Sequence Models Can Directly Transcribe Foreign Speech）》将机器翻译这方面的研究又向前推进了一步，实现了从一种语

09

降低幻觉！谷歌 | 提出ASPIRE方法，支持LLM自行打分，性能超10倍体量模型

大模型的「幻觉」问题马上要有解了？威斯康星麦迪逊大学和谷歌的研究人员最近开发了一个名为ASPIRE的系统，可以让大模型对自己的输出给出评分。

01

AV1：下一代视频标准—约束定向增强滤波器

https://hacks.mozilla.org/2018/06/av1-next-generation-video-the-constrained-directional-enhancement-filter/

02

Transformers 4.37 中文文档（七十七）

SeamlessM4T-v2 模型是由 Meta AI 的 Seamless Communication 团队在Seamless: Multilingual Expressive and Streaming Speech Translation中提出的。

01

Transformers 4.37 中文文档（七十六）

MMS 模型是由 Vineel Pratap、Andros Tjandra、Bowen Shi、Paden Tomasello、Arun Babu、Sayani Kundu、Ali Elkahky、Zhaoheng Ni、Apoorv Vyas、Maryam Fazel-Zarandi、Alexei Baevski、Yossi Adi、Xiaohui Zhang、Wei-Ning Hsu、Alexis Conneau、Michael Auli 在将语音技术扩展到 1000 多种语言中提出的。

01

PPASR语音识别（进阶级）

本项目将分三个阶段分支，分别是入门级、进阶级和最终级分支，当前为进阶级，随着级别的提升，识别准确率也随之提升，也更适合实际项目使用，敬请关注！

02

LLM（大语言模型）解码时是怎么生成文本的？

源码地址：transformers/configuration_utils.py at v4.28.1 · huggingface/transformers (github.com)

03

教程 | 如何使用TensorFlow和自编码器模型生成手写数字

选自Medium 机器之心编译参与：Nurhachu Null、蒋思源本文详细介绍了如何使用 TensorFlow 实现变分自编码器（VAE）模型，并通过简单的手写数字生成案例一步步引导读者实现这一强大的生成模型。全部 VAE 代码：https://github.com/FelixMohr/Deep-learning-with-Python/blob/master/VAE.ipynb 自编码器是一种能够用来学习对输入数据高效编码的神经网络。若给定一些输入，神经网络首先会使用一系列的变换来将数据映射到低

神经机器翻译的编码 - 解码架构有了新进展，具体要怎么配置？

用于循环神经网络的编码 - 解码架构，在标准机器翻译基准上取得了最新的成果，并被用于工业翻译服务的核心。该模型很简单，但是考虑到训练所需的大量数据，以及调整模型中无数的设计方案，想要获得最佳的性能是非常困难的。值得庆幸的是，研究科学家已经使用谷歌规模的硬件为我们做了这项工作，并提供了一套启发式的方法，来配置神经机器翻译的编码 - 解码模型和预测一般的序列。在这篇文章中，您将会获得，在神经机器翻译和其他自然语言处理任务中，如何最好地配置编码 - 解码循环神经网络的各种细节。阅读完这篇文章后，你将知道

04

自回归解码加速64倍，谷歌提出图像合成新模型MaskGIT

来源：机器之心本文约2200字，建议阅读5分钟一种使用双向 transformer 解码器的新型图像合成模型 MaskGIT，在性能和速度上都获得了大幅改进。来自谷歌研究院的研究者提出了一种使用双向 transformer 解码器的新型图像合成模型 MaskGIT，在性能和速度上都获得了大幅改进。‍ 生成式 transformer 在合成高保真和高分辨率图像方面得到了快速普及。但迄今为止最好的生成式 transformer 模型仍是将图像视为一系列 token，并按照光栅扫描顺序（即逐行）解码图像。然而这

02

教你用TensorFlow和自编码器模型生成手写数字（附代码）

来源：机器之心本文长度为1876字，建议阅读4分钟本文介绍了如何使用 TensorFlow 实现变分自编码器（VAE）模型，并通过简单的手写数字生成案例一步步引导读者实现这一强大的生成模型。自编码器是一种能够用来学习对输入数据高效编码的神经网络。若给定一些输入，神经网络首先会使用一系列的变换来将数据映射到低维空间，这部分神经网络就被称为编码器。然后，网络会使用被编码的低维数据去尝试重建输入，这部分网络称之为解码器。我们可以使用编码器将数据压缩为神经网络可以理解的类型。然而自编码器很少用做这个目的

08

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭