Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >在R中使用text2vec预测下一个单词

在R中使用text2vec预测下一个单词
EN

Stack Overflow用户
提问于 2016-04-21 21:06:40
回答 3查看 2.4K关注 0票数 4

我正在R中建立一个语言模型,根据前面的单词来预测句子中的下一个单词。目前,我的模型是一个简单的ngram模型,带有Kneser-Ney平滑。它通过在训练集中找到具有最大概率(频率)的ngram来预测下一个单词,其中平滑提供了一种插入低阶ngram的方法,这在高阶ngram具有低频率并且可能不提供可靠预测的情况下是有利的。虽然这种方法工作得相当好,但在n元语法无法捕捉到上下文的情况下,它就失败了。例如,“外面温暖晴朗,让我们去……”和“外面很冷,正在下雨,让我们去……”会提出同样的预测,因为最后一个n元语法(假设是n<5)中没有捕捉到天气的上下文。

我正在研究更高级的方法,我发现了text2vec包,它允许将单词映射到向量空间,在向量空间中,具有相似含义的单词用相似(接近)的向量表示。我有一种感觉,这种表示可以对下一个单词预测有所帮助,但我不知道如何准确地定义训练任务。我的问题是,text2vec是否是用于下一个单词预测的合适工具,如果是,那么可以用于这项任务的合适的预测算法是什么?

EN

回答 3

Stack Overflow用户

发布于 2016-04-27 11:22:00

你可以试试char-rnnword-rnn (谷歌一点)。有关字符级模型R/mxnet的实现,请看一下mxnet examples。也许可以使用text2vec GloVe嵌入将此代码扩展到词级模型。

如果您将取得任何成功,请让我们知道(我指的是text2vec或/和mxnet开发人员)。我将成为R社区的一个非常有趣的案例。我想执行这样的模型/实验,但仍然没有时间。

票数 6
EN

Stack Overflow用户

发布于 2017-08-11 23:05:32

有一个实现的解决方案,作为使用单词嵌入的完整示例。事实上,Makarenkov等人的论文。(2017) named Models with pre- training ( GloVe ) Word embeddings提供了使用递归神经网络和预训练的GloVe单词嵌入来训练语言模型的逐步实现。

在论文中,作者提供了运行de代码的说明: 1.下载预先训练好的GloVe向量。2.获取用于训练模型的文本。3.打开并调整main函数内部的LM_RNN_GloVe.py文件参数。4.运行以下方法:(a) tokenize_file_to_vectors(glove_vectors_file_name,file_2_tokenize_name,tokenized_file_name) (b) run_experiment(tokenized_file_name)

Python中的代码在这里是https://github.com/vicmak/ProofSeer

我还发现@Dmitriy Selivanov最近使用它的text2vec包发布了一个不错的、友好的教程,它可以从R的角度解决这个问题。(如果他能进一步评论,那就太好了)。

票数 2
EN

Stack Overflow用户

发布于 2016-04-21 22:29:17

您的直觉是正确的,单词嵌入向量可以通过合并长距离依赖关系来改进语言模型。您正在寻找的算法称为RNNLM (递归神经网络语言模型)。http://www.rnnlm.org/

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/36780491

复制
相关文章
数据导入与预处理-拓展-pandas可视化
关于pandas的可视化的用法还有很多,这里不再拓展,但还是建议使用matplotlib,seaborn等库完成绘图。
用户2225445
2022/11/12
3.2K0
数据导入与预处理-拓展-pandas可视化
如何在折线图上添加动画效果?
要在 Chart.js 的折线图上添加动画效果,可以使用 Chart.js 提供的配置选项来实现。以下是一个示例,展示了如何在折线图上添加简单的动画效果:
王小婷
2023/09/09
5180
Echarts堆叠折线图ajax获取数据展示
先看效果图,效果图如下。 html <div class="row" > <div id="main"></div> </div> js // ajax加载数据 $.ajax({ url :
王小婷
2019/03/08
1.5K0
Echarts堆叠折线图ajax获取数据展示
图表解析系列之柱状图
是一种以长方形的长度为变量的统计图表。长条图用来比较两个或以上的价值(不同时间或者不同条件),只有一个变量,通常利用于较小的数据集分析。长条图亦可横向排列。——维基百科
Data探险实验室
2023/02/23
2.7K0
图表解析系列之柱状图
手把手教你用plotly绘制excel中常见的16种图表(上)
最近不是在学习plotly嘛,为了方便理解,我们这里取excel绘图中常见的16种图表为例,分两期演示这些基础图表怎么用plotly进行绘制!
可以叫我才哥
2021/08/05
4.1K0
安卓MPAndroidChart绘制多层级的堆叠条形图
这次是在上一篇的基础上增加的,所以导包这些啥的就跳过了研究了一下代码,发现主要的区别就在于增加data的时候,第二个参数传递的是一个数组,然后就变成了堆叠条形图。
SingYi
2022/07/14
1.3K0
安卓MPAndroidChart绘制多层级的堆叠条形图
了解绘制条形图和折线图的细节
考虑到公众号后台数不胜数的提问其实并不是生物学知识或者数据处理知识的困惑,仅仅是绘图小技巧以及数据转换的困难。所以我们一再强调系统性掌握编程知识的重要性,在这个打基础方面我让实习生“身先士卒”,起码每个人在每个编程语言上面都需要看至少五本书而且每本书都需要看五遍以上,并且详细的记录笔记。
生信技能树
2022/06/08
7.2K0
了解绘制条形图和折线图的细节
原来使用 Pandas 绘制图表也这么惊艳
Pandas 是一种非常流行的数据分析工具,同时它还为数据可视化提供了很好的选择。
周萝卜
2022/09/28
4.7K0
Origin绘图之条形图上加曲线拟合图
有时,写论文时,我们要做一些描述性统计,经常用到条形图来表示我们的数据,同时在条形图上可以加入曲线拟合的情况。如下图所示:
全栈程序员站长
2022/08/29
1.4K0
Origin绘图之条形图上加曲线拟合图
玩转数据地图系列之——地图上的迷你条形图
最近忙的厉害,产量下降的有点严重,感谢各位还没取关的小伙伴儿。 一周前更新了一篇数据地图上的气泡散点图的内容,不知怎地,这段时间就是跟地图死磕上了,今天还是数据地图,不过是在数据地图上呈现条形图、柱形图。 之前的一篇因为有现成的作图包支持,geom_scatterpie函数不用花费太大力气就解决了数据地图上的气泡散点图问题。 可是到目前为止我还没有发现支持对应坐标位置的条形图、柱形图,这一篇是参考了知乎上大神提供的思路。 加载包: library(maptools) library(ggplot2) lib
数据小磨坊
2018/04/11
2.6K1
玩转数据地图系列之——地图上的迷你条形图
5个快速而简单的数据可视化方法和Python代码
数据可视化是数据科学家工作的重要组成部分。在项目的早期阶段,你通常会进行探索性数据分析(EDA),以获得对数据的一些见解。创建可视化确实有助于使事情更清晰和更容易理解,特别是对于更大的、高维的数据集。在项目接近尾声时,以一种清晰、简洁和引人注目的方式展示最终结果是非常重要的,这样你的受众(通常是非技术客户)就更加容易理解。
AI算法与图像处理
2019/05/22
2.2K0
数据可视化设计指南
数据可视化是一种将密集复杂数据信息以视觉图形的形式呈现。设计出来的视觉效果简化了数据,让用户分析研究比较数据变得容易以及可以更好地向领导或者团队讲述“故事”——可以帮助用户更好地做出决策。
Banber可视化云平台
2021/07/06
6.3K0
数据可视化设计指南
Python中最常用的 14 种数据可视化类型的概念与代码
收集数据后,需要对其进行解释和分析,以深入了解数据所蕴含的深意。而这个含义可以是关于模式、趋势或变量之间的关系。
数据STUDIO
2022/02/24
9.8K0
Python中最常用的 14 种数据可视化类型的概念与代码
【MATLAB】进阶绘图 ( Bar 条形图 | bar 函数 | bar3 函数 | Bar 条形图样式 | 堆叠条形图 | 水平条形图 | barh 函数 )
bar 函数参考文档 : https://ww2.mathworks.cn/help/matlab/ref/bar.html
韩曙亮
2023/03/29
6.2K0
【MATLAB】进阶绘图 ( Bar 条形图 | bar 函数 | bar3 函数 | Bar 条形图样式 | 堆叠条形图 | 水平条形图 | barh 函数 )
可视化图表样式使用大全
Severino Ribecca 是一位平面设计师,也是数据可视化的爱好者,他在自己的网站上收录了 60 种可视化图表样式以及它们分别适用于什么样的场景,并且推荐了相应的制作工具。
代码医生工作室
2020/02/20
9.7K0
60 种常用可视化图表,该怎么用?
数据可视化的爱好者Severino Ribecca,他在自己的网站上收录了 60 种可视化图表样式以及它们分别适用于什么样的场景,并且推荐了相应的制作工具。
Python研究者
2022/05/21
9.3K0
60 种常用可视化图表,该怎么用?
常用60类图表使用场景、制作工具推荐!
数据可视化的爱好者Severino Ribecca,他在自己的网站上收录了 60 种可视化图表样式以及它们分别适用于什么样的场景,并且推荐了相应的制作工具。
用户8949263
2022/05/23
9.2K0
常用60类图表使用场景、制作工具推荐!
双坐标分别绘制条形图和折线图
生信技能树jimmy
2023/09/26
3350
双坐标分别绘制条形图和折线图
52个数据可视化图表鉴赏
一、数据可视化,是关于数据视觉表现形式的科学技术研究。其中,这种数据的视觉表现形式被定义为,一种以某种概要形式抽提出来的信息,包括相应信息单位的各种属性和变量。它是一个处于不断演变之中的概念,其边界在不断地扩大。主要指的是技术上较为高级的技术方法,而这些技术方法允许利用图形、图像处理、计算机视觉以及用户界面,通过表达、建模以及对立体、表面、属性以及动画的显示,对数据加以可视化解释。与立体建模之类的特殊技术方法相比,数据可视化所涵盖的技术方法要广泛得多。
数据STUDIO
2022/02/24
6.1K0
52个数据可视化图表鉴赏
Pandas绘图功能
可视化是用来探索性数据分析最强大的工具之一。Pandas库包含基本的绘图功能,可以让你创建各种绘图。Pandas中的绘图是在matplotlib之上构建的,如果你很熟悉matplotlib你会惊奇地发现他们的绘图风格是一样的。
用户3577892
2020/11/12
1.8K0

相似问题

tableau中组合堆叠条形图/累计折线图上的合计

13

堆叠条形图上的数据标签

11

堆叠条形图上的条件圆角

28

SSRS堆叠条形图标签位置

20

PowerBI:在组合的堆叠条形图和折线图上设置总计的格式

27
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档