腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
在
标点符号
附近
过滤
停止词
、
、
我试图
过滤
掉我的文本中的断句,比如:问题是,text.split不过,我后来在sent_tokenize(clean)中使用了sent_tokenize(clean),所以我不想完全去掉
标点符号
。我认为有可能改变
标点符号</em
浏览 5
提问于2015-03-03
得票数 1
回答已采纳
2
回答
正则表达式-捕获标点和缩写
、
、
我不熟悉正则表达式,我正在尝试编写一个函数来将字符串分解为缩写和
标点符号
。 例如:I'm feeling sad today.到目前为止,我只能用([a-zA-Z])\w*
过滤
字母,我不确定如何
过滤
以包括
标点符号
。
浏览 2
提问于2015-11-02
得票数 1
1
回答
字符串已被拆分,使用
标点符号
作为分隔符;如何重新组合并将
标点符号
放回原处?
、
、
、
我正在使用Trie数据结构实现一个亵渎
过滤
器。每句脏话都被添加到Trie中。当我有一个字符串要删除亵渎时,我会使用
标点符号
来分解字符串,并用Trie检查每个单词。如果发现我用asterisks.Then替换,我将字符串内爆,问题是,我如何跟踪
标点符号
?换句话说,我如何确保生成的字符串有
标点符号
?
浏览 1
提问于2011-05-27
得票数 0
回答已采纳
2
回答
在C中
过滤
标点符号
的最快方法
、
我需要在C中快速
过滤
UTF-8字符串中的
标点符号
。这些字符串可能很长,而且数量非常多。return mystring;正如您所看到的,它会遍历每个
标点符号
的字符串。有没有一个简单的库函数可以有效地为所有
标点符号
完成这项工作?
浏览 1
提问于2010-11-19
得票数 4
回答已采纳
1
回答
从字典中删除所需值的代码
、
、
、
然后,我创建了一个新的字典,然后使用HTML解析器取消对所有内容的转义,然后使用translate()方法从文本中删除所有
标点符号
。 最后,我只想保留大于长度= 3的单词。
浏览 0
提问于2013-08-09
得票数 1
回答已采纳
1
回答
对Name.Surname的判读
、
我正在尝试
过滤
用户登录名,但是一直在收集垃圾。用户名和姓氏以大写字母开头。我用的是grep GNU 2.10。[A-Z].*[.].*or /blahblah或Albert.Ohara blah
浏览 2
提问于2016-09-16
得票数 2
回答已采纳
2
回答
R:考虑
标点符号
来进行分词
、
、
我使用NGramTokenizer()进行1~3克的分段,但似乎不考虑
标点符号
,并删除
标点符号
。(如:氧化剂氨基、氧化剂氨基酸、颗粒氧化剂等)。是否有任何分段方法来保持
标点符号
(我认为我可以使用POS标记
过滤
字符串,其中包含
标点符号
后,分段工作)。 或者有其他方法可以考虑
标点符号
来做分词?对我来说会更完美。
浏览 3
提问于2017-09-21
得票数 2
回答已采纳
1
回答
如何减少
过滤
文章数据集的时间?
、
、
、
、
我正在尝试
过滤
我的数据集,其中包含近50K篇文章。从每一篇文章中,我想
过滤
掉停止词和
标点符号
。但这一过程需要很长时间。我已经
过滤
了数据集,花了6个小时。现在,我有另一个数据集要
过滤
,其中包含300 K文章。def sentence_to_wordlist(sentence
浏览 1
提问于2019-06-22
得票数 1
回答已采纳
2
回答
如何从python中的阿拉伯字符串中删除英语文本?
、
、
我有一个带有英文文本和
标点符号
的阿拉伯字符串。我需要
过滤
阿拉伯文本,我尝试删除
标点符号
和英语单词使用刺。然而,我失去了阿拉伯词之间的间隔。我哪里错了?not in string.printable, n)وزارةالداخليةلاتتوفرلدينامعلوماترسميةعنسعوديينموقوفينفيليبيا 我可以删除
标点符号
和英语文本
浏览 0
提问于2015-04-02
得票数 6
回答已采纳
1
回答
有没有办法在Python中找到句子中第二长的单词?
、
、
、
我陷入了这样的想法:如何获得句子中第二长的单词?我将在我的代码中使用它作为出口路径,其中最长的单词可能无法通过测试。有什么想法吗?提前谢谢。
浏览 0
提问于2010-08-30
得票数 1
回答已采纳
1
回答
是否可以从索引中解析
标点符号
敏感的搜索?
我有一个搜索应用程序,其中,由于文件的性质,用户经常包括(相关的)
标点符号
在他们的搜索词。这常常导致结果估计与实际的、
过滤
的结果计数有很大的不同。在这种情况下,我从来不想运行
标点符号
不敏感的搜索,因此,将ML配置为将
标点符号
作为“单词字符”来构建其术语列表将使估计值与实际匹配更加接近。我还没有找到任何方法来配置ML以这样构建通用索引(我假设会有一个“快速
标点符号
敏感搜索”选项);我甚至尝试创建一个带有
标点符号
敏感的排序规则的单词词典,希望ML能够利用它来提示如何配置它的术语列表生成,在一
浏览 1
提问于2013-07-22
得票数 1
回答已采纳
3
回答
什么是Rails插件,或者Ruby,可以自动修复英语语法?
、
、
、
、
语法
过滤
器是做什么的?增加
标点符号
(例如句子末尾的句号) 在
标点符号
后添加一个空格(例如,Hi,Cat将变成Hi,Cat
浏览 6
提问于2011-03-08
得票数 6
回答已采纳
1
回答
替换
过滤
器-如何传递要替换的字符串的变量?
、
、
我目前正在做一个symfony 6项目,并尝试将一个变量传递到Twig的替换
过滤
器中。不过,这对我不起作用。{“(”
标点符号
“预期值为":")的意外标记”
标点符号
“。 有人能告诉我我做错了什么,或者如何将一个变量传递给
过滤
器函数“替换”吗?
浏览 5
提问于2022-08-25
得票数 -1
回答已采纳
2
回答
带嵌套的Elasticsearch -如何在搜索时忽略
标点符号
、
、
我的文档包含
标点符号
,我希望保留这些
标点符号
,以便它们在检索时正确显示,但是我不希望这种
标点符号
影响任何搜索结果,不管查询中是否提供了
标点符号
。-我怀疑我可能需要使用char_filter ,但从NEST项目源代码看,我无法看到如何使用自己指定的映射添加自己的自定义char_filter,它似乎只允许我指定Elasticsearch已经知道的
过滤
器(扩展只允许指定要使用的现有
过滤
器的名称)。
浏览 8
提问于2014-02-27
得票数 1
回答已采纳
1
回答
globalKeyboardHook返回意外字符C#,VS2013 Win7
、
对于多种语言,我需要所有的字母表(没有数字)和
标点符号
(句号逗号+=_‘;等等)。我不希望控制字符被包括在内。为了
过滤
我需要的密钥,我使用了char.Isletter \\ char.isPunctuation。令我惊讶的是,我发现使用keyboardGlobalHook时,char.IsPunctuation 不返回标准
标点符号
(句号、逗号等等)。返回的keyCodes和keyValues似乎与钩子不同。92 '\':95 '_': 123 '{
浏览 2
提问于2016-06-03
得票数 0
4
回答
从字符串中
过滤
掉UTF-8标点和符号
、
、
从字符串中
过滤
出所有UTF-8
标点符号
和✀✁✂✃✄✅✆✇✈等符号的最好和最有效的方法是什么?简单地
过滤
掉a-z、A-Z和0-9之外的所有字符是不可行的,因为我想保留其他语言(ą,ę等)中的字母。
浏览 4
提问于2013-05-14
得票数 4
回答已采纳
2
回答
使用筛选器进行搜索,但忽略
标点符号
、
、
我为下面的一个离子项目写了一个搜索
过滤
器。它工作得很好,但事实上它没有忽略
标点符号
。 因此,如果我正在搜索的项目有一个逗号,而我错过了逗号,我将找不到它。有没有办法让
过滤
器忽略逗号,甚至其他
标点符号
?
浏览 8
提问于2015-07-03
得票数 0
回答已采纳
1
回答
删除单引号,同时保留撇号Python,NLTK
、
、
我正在努力的部分是从文本中删除不相关的
标点符号
。
浏览 2
提问于2014-03-12
得票数 1
回答已采纳
3
回答
使用空格标记器时删除逗号
当然,我希望删除标准令牌程序自动删除的
标点符号
。 我需要使用空格标记器,主要是因为我不希望连字符被分割。
浏览 4
提问于2014-02-23
得票数 5
2
回答
在keras令牌程序中包括
标点符号
、
有什么方法可以将
标点符号
包括在keras记号器中吗?从…至 Index-tomorrow, Index-will,...
浏览 2
提问于2018-03-02
得票数 3
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
【标点符号】《人民日报》九张图教你标点符号的新用法
matlab书写规范及标点符号运用
表情包时代,你还在正确使用标点符号吗?
从标点符号到表情包,媒介是如何改造信息的?
协同过滤?教你用Python实现协同过滤
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券