腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用预训练的手套向量
、
我使用的是
Python
2.764位,我想在spacy.By中使用预先训练好的维基百科
语料
库的词向量,默认在glove.can的普通
爬虫
语料
库上训练,任何人都可以提供相同的代码片段。
浏览 0
提问于2017-04-27
得票数 0
1
回答
internet上的通用子字符串
、
、
、
有没有办法找出互联网上所有文档(更重要的是html)中出现的最常见的不是英文单词的子串(统计上有意义的样本也会很好),有没有可能得到一些近似,例如"corp“可能是一个候选单词,因为它不是一个完整的英文单词,但" the”不可能是候选单词,因为它们本身就是完整的英文单词。
浏览 1
提问于2014-04-23
得票数 1
1
回答
是否有一个无处不在的网络
爬虫
可以生成一个良好的特定于语言的数据集来训练一个转换器?
、
、
似乎有很多值得注意的人工智能工具正在接受由网络
爬虫
生成的数据集的培训,而不是人工编辑的、人工编译的
语料
库(Facebook Translate,GPT-3)。有没有任何无处不在的网络
爬虫
,它做的基本相同的事情,但有一个参数的“语言寻求”?换句话说,用X语言生成一个网络爬行数据集?
浏览 0
提问于2021-11-18
得票数 0
1
回答
无法从NLTK下载文件
、
我正在尝试运行以下代码:nltk.download()Exceptionin Tkinter callback File "C:\
Python
27\lib\lib-tk\Tkinter.py", line1410, in __call__ File "C:\<
浏览 0
提问于2015-10-01
得票数 0
2
回答
从TripAdvisor抓取数据的任何建议
、
、
我们目前正在研究一个NLP项目,需要一个从tripadvisor.com中提取的
语料
库。我们期望输出为两种类型:注释和该评论的评级。我的问题是: 是否有任何完整的工具就是为了这个目的?我的意思是为tripadvisor.com编写的程序?该
语料
库将用于大学研究的情感分析,我们需要尽快抓取它。
浏览 6
提问于2013-01-16
得票数 3
1
回答
在NLTK使用英国国家
语料
库
、
、
我是NLTK ()和
python
的新手。我希望使用NLTK
python
库,但使用BNC作为
语料
库。我不相信这个
语料
库是通过NLTK数据下载发布的。是否有方法导入BNC
语料
库供NLTK使用。此外,在BNC网站上,我可以下载
语料
库()。\\Users\\jason\\Documents\\NetBeansProjects\\DemoCollocations\\src\\Corpora\\bnc\\A\\A0\\A00.xml'bnc_r
浏览 6
提问于2017-04-19
得票数 5
回答已采纳
2
回答
NLTK标签荷兰句
、
我从NLTK开始,想标记一个荷兰句子,但我在指定
语料
库时遇到了困难。pos_tagfrom nltk.corpus import alpino 给予, ('is
浏览 2
提问于2016-10-24
得票数 3
回答已采纳
1
回答
用压缩库估计英语句子的信息复杂性?
、
、
、
,在同一种语言的大型文本
语料
库上进行“预训练”(称之为“
语料
库”),然后将不同的句子附加到文本
语料
库中。也就是说,我可以定义一个句子的复杂性度量,它需要多少字节才能压缩整个
语料
库,而整个
语料
库则需要一个不同的句子。(额外字节越少,该句子就越可预测或“预期”,因此复杂度就越低)。这有意义吗?问题在于如何找到合适的库来让我这样做,最好是从
python
那里。我可以把句子加到一个大
语料
库中,并要求压缩库来压缩整个
语料
库,但如果可能的话,我宁愿在
语料</
浏览 1
提问于2016-10-14
得票数 1
回答已采纳
1
回答
如何构建
python
NLTK的翻译
语料
库?
、
、
、
我一直在使用
Python
的NTLK进行通用语言解析,最近我想创建一个专门用于翻译的
语料
库。我无法理解NTLK用于翻译的
语料
库选项和结构。 有很多,但是我找不到任何关于创建翻译风格
语料
库的细节。通过浏览
语料
库参考,我了解到有各种各样的风格和类型,但是我似乎找不到任何特定的翻译
语料
库示例或文档。
浏览 50
提问于2018-08-10
得票数 4
回答已采纳
7
回答
NLTK和Stopword失败#调试器
、
、
、
我正试着开始一个情感分析的项目,我将使用停止词的方法。我做了一些研究,我发现nltk有秒词,但是当我执行命令时,会出现一个错误。from nltk.corpus import stopwords但是当我按回车时LookupError
浏览 14
提问于2014-11-01
得票数 66
回答已采纳
2
回答
在Mac Os上的nltk
语料
库定位
、
、
、
我试图定位nltk
语料
库数据的存储位置。我进行了一些挖掘,发现它们位于我的机器上: /Library/Frameworks/
Python
.framework/Versions/2.7/lib/
python
2.7/site-packages/nltk/init.pyc,但是当我进入nltk目录时,我发现了一个
语料
库文件夹,但里面并没有什么类似于
语料
库的东西。
浏览 9
提问于2016-03-22
得票数 0
回答已采纳
1
回答
弹性豆杆不运行的克隆约伯
、
、
、
、
我在一个弹力豆茎应用程序上有一个抓取器,我可以像这样运行SSH: 我想帮我安排一个任务来处理这个问题。Cron won't r
浏览 0
提问于2015-04-13
得票数 0
1
回答
用于计算机视觉的
Python
中的LDA
、
、
、
我也希望使用
Python
来做同样的事情。我在
Python
for LDA for image dataset中找不到任何库/包,包似乎只适用于文本
语料
库。请在
Python
中为图像
语料
库推荐任何软件包,或简要列出执行图像LDA所需的步骤。
浏览 6
提问于2017-03-07
得票数 0
1
回答
为给定的带有标签的项目集创建相似度矩阵的最佳方法
、
、
我们的数据格式如下: '1': ['Lathi Charge', 'NIT', 'Nirmal Singh'] '3': ['Hrithik Roshan', 'mohenjo daro', 'release date'], '4': ['NIT', 'Placements
浏览 0
提问于2016-08-26
得票数 1
1
回答
在NLTK中读取自定义创建的
语料
库时UnicodeDecodeError
、
、
我用nltk模块制作了自定义的句子极性检测
语料
库。以下是
语料
库的等级:-极地-非极性下面是我如何在我的源代码中导入这个
语料
库: polarity = LazyCorpusLoader(在创建
语料
库时,我也需要在utf-8中解码吗?
浏览 3
提问于2016-09-16
得票数 0
回答已采纳
1
回答
如何在
Python
中使用统一动词索引?
、
、
我知道nltk包含VerbNet
语料
库,然而,将其中的信息与其他3个有用的来源相结合。有没有办法在
Python
中使用这个
语料
库?
浏览 1
提问于2016-10-08
得票数 1
3
回答
如何从Pubmed下载全文?
、
、
、
、
我正在做一个需要与Genia
语料
库一起工作的项目。根据文献,Genia
语料
库是通过搜索Medline/Pubmed上的“转录因子”、“血细胞”和“人”这三个术语提取的。我想从Pubmed的Genia
语料
库中提取全文文章(这是免费的)。我尝试了许多方法,但我无法找到下载全文的方法,或XML或Pdf格式。或者我已经可以使用的脚本或网页
爬虫
了吗?
浏览 7
提问于2016-06-14
得票数 0
回答已采纳
1
回答
Heroku部署错误-Nltk无法下载
、
、
、
、
我将我的项目部署在Heroku上,使用heroku/
python
作为Buildpack,然后使用github链接来学习更多的图像作为Buildpack。它不适用于任何一个构建包。请帮帮我
浏览 1
提问于2018-01-18
得票数 1
1
回答
如何将文件添加或上载到nltk
语料
库?
、
我是NLTK和
Python
的新手。我如何添加或上传我们自己的文件到nltk
语料
库?例如,我如何将我自己的.TXT文件上传到ieer
语料
库?有可能吗?谢谢。
浏览 4
提问于2012-07-13
得票数 0
1
回答
我应该使用什么NLP度量来比较不同文档中某些术语的重要性/中心性?
、
、
、
例如:假设我有两个包含司法意见的
语料
库。
语料
库A包含法院裁定制造商对疏忽制造产品负责的意见。
语料
库B包含具有相似事实但得出不同结果的观点。有什么方法可以让我说,某些术语对
语料
库A中的案例比
语料
库B中的案例更“重要”或“核心”?我知道还有更多(例如,来自图论),但我不确定从哪里开始,而且背景有限。
浏览 2
提问于2019-02-11
得票数 2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python爬虫入门3 爬虫必备Python知识
Python爬虫
python爬虫
Python 爬虫(六)
Python 爬虫(四)
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券