腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用预训练的手套向量
、
我使用的是
Python
2.764位,我想在spacy.By中使用预先训练好的维基百科
语料
库的词向量,默认在glove.can的普通
爬虫
语料
库上训练,任何人都可以提供相同的代码片段。
浏览 0
提问于2017-04-27
得票数 0
1
回答
internet上的通用子字符串
、
、
、
有没有办法找出互联网上所有文档(更重要的是html)中出现的最常见的不是英文单词的子串(统计上有意义的样本也会很好),有没有可能得到一些近似,例如"corp“可能是一个候选单词,因为它不是一个完整的英文单词,但" the”不可能是候选单词,因为它们本身就是完整的英文单词。
浏览 1
提问于2014-04-23
得票数 1
1
回答
是否有一个无处不在的网络
爬虫
可以生成一个良好的特定于语言的数据集来训练一个转换器?
、
、
似乎有很多值得注意的人工智能工具正在接受由网络
爬虫
生成的数据集的培训,而不是人工编辑的、人工编译的
语料
库(Facebook Translate,GPT-3)。有没有任何无处不在的网络
爬虫
,它做的基本相同的事情,但有一个参数的“语言寻求”?换句话说,用X语言生成一个网络爬行数据集?
浏览 0
提问于2021-11-18
得票数 0
1
回答
无法从NLTK下载文件
、
我正在尝试运行以下代码:nltk.download()Exceptionin Tkinter callback File "C:\
Python
27\lib\lib-tk\Tkinter.py", line1410, in __call__ File "C:\<
浏览 0
提问于2015-10-01
得票数 0
2
回答
从TripAdvisor抓取数据的任何建议
、
、
我们目前正在研究一个NLP项目,需要一个从tripadvisor.com中提取的
语料
库。我们期望输出为两种类型:注释和该评论的评级。我的问题是: 是否有任何完整的工具就是为了这个目的?我的意思是为tripadvisor.com编写的程序?该
语料
库将用于大学研究的情感分析,我们需要尽快抓取它。
浏览 6
提问于2013-01-16
得票数 3
1
回答
在NLTK使用英国国家
语料
库
、
、
我是NLTK ()和
python
的新手。我希望使用NLTK
python
库,但使用BNC作为
语料
库。我不相信这个
语料
库是通过NLTK数据下载发布的。是否有方法导入BNC
语料
库供NLTK使用。此外,在BNC网站上,我可以下载
语料
库()。\\Users\\jason\\Documents\\NetBeansProjects\\DemoCollocations\\src\\Corpora\\bnc\\A\\A0\\A00.xml'bnc_r
浏览 6
提问于2017-04-19
得票数 5
回答已采纳
2
回答
NLTK标签荷兰句
、
我从NLTK开始,想标记一个荷兰句子,但我在指定
语料
库时遇到了困难。pos_tagfrom nltk.corpus import alpino 给予, ('is
浏览 2
提问于2016-10-24
得票数 3
回答已采纳
1
回答
用压缩库估计英语句子的信息复杂性?
、
、
、
,在同一种语言的大型文本
语料
库上进行“预训练”(称之为“
语料
库”),然后将不同的句子附加到文本
语料
库中。也就是说,我可以定义一个句子的复杂性度量,它需要多少字节才能压缩整个
语料
库,而整个
语料
库则需要一个不同的句子。(额外字节越少,该句子就越可预测或“预期”,因此复杂度就越低)。这有意义吗?问题在于如何找到合适的库来让我这样做,最好是从
python
那里。我可以把句子加到一个大
语料
库中,并要求压缩库来压缩整个
语料
库,但如果可能的话,我宁愿在
语料</
浏览 1
提问于2016-10-14
得票数 1
回答已采纳
1
回答
如何构建
python
NLTK的翻译
语料
库?
、
、
、
我一直在使用
Python
的NTLK进行通用语言解析,最近我想创建一个专门用于翻译的
语料
库。我无法理解NTLK用于翻译的
语料
库选项和结构。 有很多,但是我找不到任何关于创建翻译风格
语料
库的细节。通过浏览
语料
库参考,我了解到有各种各样的风格和类型,但是我似乎找不到任何特定的翻译
语料
库示例或文档。
浏览 50
提问于2018-08-10
得票数 4
回答已采纳
7
回答
NLTK和Stopword失败#调试器
、
、
、
我正试着开始一个情感分析的项目,我将使用停止词的方法。我做了一些研究,我发现nltk有秒词,但是当我执行命令时,会出现一个错误。from nltk.corpus import stopwords但是当我按回车时LookupError
浏览 14
提问于2014-11-01
得票数 66
回答已采纳
2
回答
在Mac Os上的nltk
语料
库定位
、
、
、
我试图定位nltk
语料
库数据的存储位置。我进行了一些挖掘,发现它们位于我的机器上: /Library/Frameworks/
Python
.framework/Versions/2.7/lib/
python
2.7/site-packages/nltk/init.pyc,但是当我进入nltk目录时,我发现了一个
语料
库文件夹,但里面并没有什么类似于
语料
库的东西。
浏览 9
提问于2016-03-22
得票数 0
回答已采纳
1
回答
弹性豆杆不运行的克隆约伯
、
、
、
、
我在一个弹力豆茎应用程序上有一个抓取器,我可以像这样运行SSH: 我想帮我安排一个任务来处理这个问题。Cron won't r
浏览 0
提问于2015-04-13
得票数 0
1
回答
用于计算机视觉的
Python
中的LDA
、
、
、
我也希望使用
Python
来做同样的事情。我在
Python
for LDA for image dataset中找不到任何库/包,包似乎只适用于文本
语料
库。请在
Python
中为图像
语料
库推荐任何软件包,或简要列出执行图像LDA所需的步骤。
浏览 6
提问于2017-03-07
得票数 0
1
回答
为给定的带有标签的项目集创建相似度矩阵的最佳方法
、
、
我们的数据格式如下: '1': ['Lathi Charge', 'NIT', 'Nirmal Singh'] '3': ['Hrithik Roshan', 'mohenjo daro', 'release date'], '4': ['NIT', 'Placements
浏览 0
提问于2016-08-26
得票数 1
1
回答
在NLTK中读取自定义创建的
语料
库时UnicodeDecodeError
、
、
我用nltk模块制作了自定义的句子极性检测
语料
库。以下是
语料
库的等级:-极地-非极性下面是我如何在我的源代码中导入这个
语料
库: polarity = LazyCorpusLoader(在创建
语料
库时,我也需要在utf-8中解码吗?
浏览 3
提问于2016-09-16
得票数 0
回答已采纳
1
回答
如何在
Python
中使用统一动词索引?
、
、
我知道nltk包含VerbNet
语料
库,然而,将其中的信息与其他3个有用的来源相结合。有没有办法在
Python
中使用这个
语料
库?
浏览 1
提问于2016-10-08
得票数 1
3
回答
如何从Pubmed下载全文?
、
、
、
、
我正在做一个需要与Genia
语料
库一起工作的项目。根据文献,Genia
语料
库是通过搜索Medline/Pubmed上的“转录因子”、“血细胞”和“人”这三个术语提取的。我想从Pubmed的Genia
语料
库中提取全文文章(这是免费的)。我尝试了许多方法,但我无法找到下载全文的方法,或XML或Pdf格式。或者我已经可以使用的脚本或网页
爬虫
了吗?
浏览 7
提问于2016-06-14
得票数 0
回答已采纳
1
回答
Heroku部署错误-Nltk无法下载
、
、
、
、
我将我的项目部署在Heroku上,使用heroku/
python
作为Buildpack,然后使用github链接来学习更多的图像作为Buildpack。它不适用于任何一个构建包。请帮帮我
浏览 1
提问于2018-01-18
得票数 1
1
回答
如何将文件添加或上载到nltk
语料
库?
、
我是NLTK和
Python
的新手。我如何添加或上传我们自己的文件到nltk
语料
库?例如,我如何将我自己的.TXT文件上传到ieer
语料
库?有可能吗?谢谢。
浏览 4
提问于2012-07-13
得票数 0
1
回答
我应该使用什么NLP度量来比较不同文档中某些术语的重要性/中心性?
、
、
、
例如:假设我有两个包含司法意见的
语料
库。
语料
库A包含法院裁定制造商对疏忽制造产品负责的意见。
语料
库B包含具有相似事实但得出不同结果的观点。有什么方法可以让我说,某些术语对
语料
库A中的案例比
语料
库B中的案例更“重要”或“核心”?我知道还有更多(例如,来自图论),但我不确定从哪里开始,而且背景有限。
浏览 2
提问于2019-02-11
得票数 2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python爬虫入门3 爬虫必备Python知识
Python爬虫
python爬虫
Python 爬虫(五)
Python 爬虫(四)
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券