腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
如何
检查
句子
的
第一个
单词
是否
为
专有名词
?
、
我想从一个大型语料库中删除所有的
专有名词
。由于体积很大,我走了一条捷径,删除了所有以大写字母开头
的
单词
。对于每个
句子
的
第一个
单词
,我还想
检查
它
是否
是
专有名词
。如果不使用标记器,我
如何
做到这一点。一种选择是使用常见
专有名词
列表进行筛选。有没有更好
的
方法,我在哪里可以得到这样
的
列表?谢谢。 我试过NLTK pos_tag和Standford NER。
浏览 44
提问于2019-02-13
得票数 4
1
回答
在字符串中查找
专有名词
、
我感兴趣
的
是在字符串中寻找
专有名词
,但如果它们是
句子
中
的
第一个
单词
或者
单词
是字符串中
的
第一个
单词
,我就不感兴趣了。例如,我希望匹配
单词
Lipsum和Adipiscing,而不是"Lorem“,因为它是
第一个
单词
,而不是"Consectetur”,因为它是
句子
中
的
第一个
单词
。
浏览 1
提问于2011-11-17
得票数 1
回答已采纳
1
回答
IBM Watson speech to text结果
是否
仅为小写?
、
、
看起来语音到文本
的
转录结果完全是小写
的
吗?
是否
有启用区分大小写输出
的
选项?我使用
的
是java api。 致以最好
的
问候,大卫c。
浏览 3
提问于2020-11-03
得票数 0
3
回答
如果string是代词,则返回true
的
函数
、
我正在尝试构建一个函数,如果给定
的
字符串作为参数是代词,则该函数返回true。如果你知道有什么更好
的
方法来判断某事是代词,请告诉我。但是,为了
检查
第一个
字母
是否
为
大写/大写字母,我
如何
检查
。 我知道string[0]会给我
第一个
字母,但我要将它与什么进行比较,以
检查
它
是否
为
字
浏览 0
提问于2013-06-06
得票数 0
回答已采纳
2
回答
pyenchant:
检查
给定
的
单词
是否
是名词(但不是
专有名词
)以及拼写
是否
正确
python pyenchant库(以及pyenchant)允许
检查
单词
是否
拼写正确enchant.Dict("en_US").check("house") 美国
的
字典是从哪里来
的
它
是否
也包含
专有名词
,如Microsoft或John?
是否
可以
检查
给定
的
单词
是否
是名词(但不是
专有名词
)以及拼写<
浏览 22
提问于2017-05-24
得票数 1
8
回答
如何
在字符串中找到
专有名词
?
我试图在用户提交
的
3-4句段落中识别
专有名词
。我不介意这个功能有一些缺陷,因为我有一个版主团队来验证几乎所有的事情。 我想我可以用空格把字
浏览 7
提问于2010-09-22
得票数 2
回答已采纳
2
回答
[CLS] [SEP]令牌在伯特中
的
向量值是多少?
、
在BERT中,他们用特殊
的
标记来代替分隔符和
句子
的
开头。在embedding_matrix中有什么对应
的
值。它们是零矢量吗? 我想用类似的方法来代替
专有名词
,比如名字,建筑物,地点。我该怎么做才能掩盖同样
的
事实?
浏览 0
提问于2019-02-27
得票数 6
回答已采纳
1
回答
正则表达式查找不是
句子
中
第一个
单词
的
专有名词
或短语
、
我发现了几个与此相关
的
问题,但似乎没有一个能回答这个问题。我正在尝试构建一个Regex,它将允许我在一组文本中识别
专有名词
。我将
专有名词
定义
为
:以大写字母开头
的
一个或一组
单词
,长度超过1个数字(不包括I,A等),并且不是新
句子
的
第一个
单词
。“星期四,苏珊·道住在假日酒店。我希望返回以下内容现在,[A-Z]{1,1}[a-z]*([\
浏览 4
提问于2013-10-31
得票数 5
2
回答
如何
删除使用python不显示模式
的
胡言乱语?
、
、
not w in stops]使用上面的代码,我可以在删除标点符号、停止词等之后提取
单词
,但是我无法删除本质上是胡言乱语
的
单词
。这些是我在清理urls之后得到
的
许多
单词
中
的
一些。regex或其他函数
的
特定模式。有人能提出删除这些词语
的
方法吗?谢谢!
浏览 3
提问于2016-10-03
得票数 2
回答已采纳
5
回答
如何
使用PHP或JavaScript从字符串中提取
专有名词
?
如何
使用PHP或JavaScript从字符串中提取
专有名词
/数字值?示例中有一个字符串,如我想将"Xyz“和"53”分别识别为
专有名词
和数字。
浏览 0
提问于2009-06-26
得票数 1
回答已采纳
4
回答
用WordNet检测
专有名词
?
、
、
给定一个
单词
,有没有办法检测它
是否
是
专有名词
?看起来同义词集有相当粗糙
的
词法类别。 为了澄清,这些
单词
没有上下文-它们只是单独呈现。如果一个词可以作为普通名词使用,那么它是可以接受
的
。所以"mark“很好,因为虽然它可能是某人
的
名字,但它也可以指一个点。然而,“非洲”并非如此。
浏览 3
提问于2009-12-28
得票数 13
2
回答
用StanfordNLP解析命令句有没有可能得到更好
的
结果?
、
、
我想找出
句子
结构中
的
模式。因此,我尝试将解析树作为预处理。由于这个答案来自2016年,我希望有另一个选择来获得更好
的
结果。只有小写,
句
浏览 5
提问于2019-07-08
得票数 1
2
回答
在加密之前,将一条消息混合成两种语言,有什么好处吗?
、
、
例如,设想一条信息是日语和英语
单词
的
混合;日语
为
unicode,英语
为
ASCII。日语在
单词
之间不使用空格。将原始信息作为两种语言(尤其是西方和非西方语言)
的
混合物来编写会不会增加解密
的
难度?
浏览 0
提问于2016-06-22
得票数 1
回答已采纳
5
回答
如何
大写
第一个
字母和小写其余,同时保持大写字大写,如果它是完全大写- java。
、
、
、
、
getSentenceCaseText()**例如字符串"First SenTence. secOND语句. tHIRD语句“ 这是我
的
代码,上面的作业。我可以大写<
浏览 5
提问于2021-01-25
得票数 1
回答已采纳
1
回答
对
单词
集合进行不区分大小写匹配
的
Cypher查询
、
、
在语言学习者
的
数据库中,我有标签为User
的
节点和标签为Word
的
节点。
专有名词
的
单词
(如"English")以大写首字母存储;其他
单词
(如" an ")全部以小写存储。我想创建一个包含用户和
句子
的
查询,并在数据库中创建用户和
句子
中
的
单词
之间
的
关系。但是,
单词
匹配必须不区分大小写,以说明
句子</em
浏览 0
提问于2016-03-01
得票数 0
2
回答
如何
使用JAVA从没有外部资源
的
推文中删除(或检测)非英语标签
、
如何
删除带有hashtag (#xxx)、urls (@xxxx)和提及(@xxx)
的
推文中
的
非英文标签?我在这里找到了这个: content.replaceAll("\W",“"):,但它并没有真正
的
帮助。我知道有很多像microsoft one这样
的
语言检测工具和其他复杂
的
方法,但是我想要一些正则表达式,或者我可以在JAVA中使用
的
方法,而不需要外部资源(比如字典)。这是一个推文
的
例子:“哦!RT @missLOVEl
浏览 0
提问于2012-07-11
得票数 0
回答已采纳
4
回答
检查
字符串
的
语法- C#
、
、
、
我试图找出
如何
在C#中分析
句子
的
语法。在我
的
例子中,我有一个语法,每个
句子
都必须遵循。语法如下所示: 现在,我想
检查
一下测试语句
是否
与我
的
语法匹配。 狗不是猫。在这个例
浏览 5
提问于2017-09-01
得票数 1
回答已采纳
4
回答
给定一组巨大
的
街道名称,测试文本中
是否
包含其中一个街道名称
的
最有效
的
方法是什么?
、
我有一个有趣
的
问题需要帮助。我目前正在研究我
的
程序
的
一个特性,并且无意中发现了这个问题。 我试图通过以下步骤来解决这个问题: 测试散列
浏览 2
提问于2012-06-11
得票数 1
回答已采纳
2
回答
检查
一串
单词
是否
为
句子
、
、
、
、
我有一个文本文件,我必须从其中删除所有没有任何意义
的
语句,或者换句话说,我必须
检查
语句
是否
是一个
句子
。1. John is a heart patient.
句子
1,2,ad3有一定
的
意义,但
句子
4没有任何意义
浏览 0
提问于2018-07-30
得票数 2
2
回答
斯坦福NLP - VP对NP
我有一个例子,斯坦福NLP
为
这个
句子
输出了一个奇怪
的
解析树: (ROOT (NP (JJ Clean))正如您所看到
的
,它将
单词
Clean标记为依赖于动词desk
的
形容词,整个短语被标记为Noun Phrase,而我
的
期望是Clean被标记为动词,而相位则被标记为Verb PhraseJJ$-NN
的
组合对我来说根本没有意义。有人遇到
浏览 4
提问于2016-03-08
得票数 3
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
外贸开发信发送前,如何彻底检查自己的邮件是否有误
Python自然语言处理:使用SpaCycle库进行标记化、词干提取和词形还原
数电票如何冲红?怎样检查收到的数电发票是否被红冲?
Google解释Pixel手机录音程序背后的语音转文本技术
文章太长不想看?ML 文本自动摘要了解一下
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券