首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    2018年MLAI重大进展有哪些?LeCun推荐了这篇回答

    而且,ACM Recsys上获得最佳论文奖的论文,也探讨了如何在嵌入中包含因果关系的问题。 讨论也不仅仅限于学界,大众媒体《大西洋月刊》也发表文章指出,这是对现有人工智能方法的“挑战”。...而且,我们也看到了这些方法被整合到通用的NLP框架中的速度变得非常快了,比如AllenNLP或Zalando的FLAIR。 关于NLP领域的总结,还有一篇文章,推荐给你阅读: 不只有BERT!...虽然在生产的过程中使用Pytorch仍旧不太理想,但在可行性、文档和教育方面,Pytorch已经超过了TensorFlow。...英伟达在《Training Deep Learning with Synthetic Data》论文中提出了一些新的想法。 ?...amp/?

    49230

    254页PPT!这是一份写给NLP研究者的编程指南

    比如上图中如果写 training loop 的部分,已经有人写好了。我们只要看懂后,直接拿来用就行,没有必要从头开始自己写所有部分。 ? 上面提到的一些内容,都是可以找到现成框架来套用的。...关于 AllenNLP 库的一些介绍,这里就不花时间讨论了,感兴趣的可以看 slide 中 p141~p205 的部分。下面直接进入分享的部分。...业界 | 艾伦 AI 研究院发布 AllenNLP:基于 PyTorch 的 NLP 工具包 教程 | 利用 AllenNLP,百行 Python 代码训练情感分类器 分享研究 ?...至于 Python 的包管理系统,AllenNLP 采用了 ANACONDA。 ? Docker 是不错,但不适合做本地开发,这样的话,使用一些本地的包管理系统反而更方便。 最后做个总结。 ?...快速开发原型(要安全) 写安全的产品代码(要快) 好的流程有利于做出好的研究 使用正确的抽象 查看 AllenNLP(广告) 这次分享的 slide 看了几遍,很多地方看得自己脸上发热,不写测试什么的说到了痛处

    70940

    教程 | 利用AllenNLP,百行Python代码训练情感分类器

    选自realworldnlpbook 作者:Masato Hagiwara 机器之心编译 参与:Geek AI、路 本文介绍了如何利用 AllenNLP使用不到一百行代码训练情感分类器。...本文将向大家介绍如何使用 AllenNLP 一步一步构建自己的情感分类器。...由于 AllenNLP 会在后台处理好底层事务,提供训练框架,所以整个脚本只有不到 100 行 Python 代码,你可以很容易地使用其它神经网络架构进行实验。...你会注意到这个脚本和 AllenNLP 的词性标注教程非常相似——在 AllenNLP 中很容易在只进行少量修改的情况下使用不同的模型对不同的任务进行实验。...我们在这里使用 LSTM-RNN 作为编码器(如有需要,可参阅文档 https://allenai.github.io/allennlp-docs/api/allennlp.modules.seq2vec_encoders.html

    1.4K10

    9个技巧让你的PyTorch模型训练变得飞快!

    **任何使用Pytorch进行深度学习模型研究的人,研究人员、博士生、学者等,我们在这里谈论的模型可能需要你花费几天的训练,甚至是几周或几个月。...# ask lightning to use gpu 0 for training trainer = Trainer(gpus=[0]) trainer.fit(model) 在GPU上进行训练时,...opt_level='O2') # when doing .backward, let amp do it so it can scale the loss with amp.scale_loss(loss...trainer = Trainer(amp_level='O2', use_amp=False) trainer.fit(model) 8. 移动到多个GPUs中 现在,事情变得非常有趣了。...现在,需要关注在使用大的batch size的时候如何在多个GPUs上分布并最小化延迟(比如,我可能会尝试着在多个gpu上使用8000 +的有效batch size)。

    1.2K51

    【NLP】EMNLP 2019 参会小结及最佳论文解读

    特别是,我们将集中讨论这种离散性如何在神经网络的输入空间,潜在空间和输出空间中发挥作用。 在每个部分都提供相关的例子解释,讨论机器学习技术以及NLP的相关应用。...摘要: “探针”(Probes)是一类监督模型,用于从表示(ELMo)中预测属性(词性),它们在一系列语言任务中取得了很高的准确性。...控制任务为词汇表中的每个单词类型定义随机行为(随机输出)。无论上下文如何,每个单词标记都被分配其类型的输出。...我们描述了收集和交叉检查翻译质量的过程,并使用几种学习设置报告了基准性能:完全监督、弱监督、半监督和完全无监督。...使用AllenNLP Interpret为NER生成的解释。该模型为一个输入(顶部)预测三个标签,我们分别解释每个标签。

    1.1K20

    AI领域为何缺乏突破?前Quora工程VP:Hinton没有说到点子上

    实际上,即使最通俗的媒体也把因果关系描述为现有 AI 技术的「挑战」,甚至 ACM Recommender Systems Conference 的最佳论文就在讲如何在嵌入中纳入因果关系(《Causal...NLP 的大量进展受到使用语言模型这一思路的启发,ULMFiT 使大家了解到语言模型的力量(参见:NLP 领域的 ImageNet 时代到来:词嵌入「已死」,语言模型当立)。...除了语言模型以外,还有很多有趣进展, Facebook 的多语言嵌入系统。我们看到这些方法很快被整合到更通用的 NLP 框架, AllenNLP 或 Zalando 的 FLAIR 框架。...英伟达在其论文《Training Deep Networks with Synthetic Data: Bridging the Reality Gap by Domain Randomization》...尽管这份研究是高度经验性的,使用的也是已知的方法,但它打开了发现新方法的大门,证明公认的最佳方法实际上并不是最佳的。

    39720

    『 DSSM』A Multi-View Deep Learning Approach for Cross Domain User Modeling in Recommendation Systems

    clicked URLs:只保留主域名,www.linkdin.com News features news article clicks: title( tri-gram) top-level category...MV-DNN优势 和DSSM相比,其query和doc的feature是一样长的维度,使用同样的预处理,限制了feature。...而跨域信息feature往往不同,而且n-gram方法并不适用,所以MV-DNN结合其类别特征(电影和app类别,地理位置等)。...pair-wise training过程,user-item pairs。 降维方法 top features 对于user features,选取top-k最频繁的features。...Reduce the Number of Training Examples 每个用户在每个域都有大量的日志数据,将每个用户在每个域只选取一个user-item对,具体为用户特征-用户在此域喜欢的所有item

    1.6K50
    领券