腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
4
回答
分词
算法
、
、
、
是什么
算法
-似乎在域名停车页面上使用-需要一堆没有空间的单词(例如“好奇心”),并或多或少地正确地将其分解为组成单词(例如“好奇心的胡萝卜”)?
浏览 3
提问于2009-08-04
得票数 1
3
回答
谁知道使用动态规划进行
分词
的示例
算法
?
、
、
、
如果你在谷歌上搜索
分词
,确实没有非常好的描述,我只是试图完全理解动态编程
算法
将字符串分割成单个单词的过程。有没有人知道哪里有
分词
问题的很好的描述,或者有人能描述它?
分词
基本上就是取一个字符串,然后决定在哪里把它拆分成单词,如果你不知道的话,使用动态编程,它会考虑一些子问题。使用递归很容易做到这一点,但我在网上找不到任何地方,甚至连迭代
算法
的描述都找不到,所以如果有人有任何例子或能给出一个
算法
,那就太好了。 谢谢你的帮助。
浏览 3
提问于2009-11-23
得票数 2
1
回答
句子
分词
算法
我需要一个
算法
来检测句子记忆中的不正确答案。迷惑了?让我来给你展示。我需要背诵下列句子:这个
算法
会告诉我我漏掉了3分,因为不正确的一面还有3个单词。它错过了“快”和“快”的互换。如果你真的找到了
算法
,还会给你几个测试:(我的答案)
浏览 0
提问于2015-09-25
得票数 4
回答已采纳
3
回答
最有效的
分词
算法
?
、
我一直在寻找一种有效的
分词
算法
,但没有太多成功。例如,给定单词hello,我希望获得该单词的所有可能的分区:{h,e,l,l,o},{h,e,l,lo},{h,e,llo},...,{hello}。我发现的每一件事都谈到了
分词
,这不是我的意思。 提前谢谢你!
浏览 8
提问于2011-03-19
得票数 2
回答已采纳
1
回答
MATLAB中的
分词
算法
、
、
、
代码:%imshow(img); %figure;dbw_img = imdilate(bin_img, strel('l
浏览 4
提问于2016-09-12
得票数 0
0
回答
sphinx的搜索过程
分词
匹配问题?
、
最近在研究sphinx的搜索
算法
,一直未搞懂sphinx搜过过程的
分词
匹配到输出搜索的结果的这一过程的问题,还望有大佬可以解答或给出一些相关的资料的的提示,感谢!
浏览 58
提问于2022-03-20
1
回答
分词
算法
的复杂性
、
、
我的Q类似于过去中关于堆栈溢出的问题。public static boolean recursiveWordBreak2(String s, int start) { if (s.isEmpty() || start >= s.length()) { r
浏览 3
提问于2016-10-17
得票数 0
回答已采纳
1
回答
ntlk:如何获得词的变化
、
、
我有一个单词列表,将近5000个英语单词,每个单词我都需要这些屈折的形式:动词:不定式,现在简单,现在简单第三人称,过去简单,现在
分词
(形式),过去
分词
副词如何通过
python
从ntlk中的给定单词(例如帮助)中提取这些信息?
浏览 1
提问于2016-05-05
得票数 2
回答已采纳
1
回答
前缀、词干和词尾
分词
算法
、
、
我遇到了一个问题,我需要将输入字符串拆分成可能的Prefix、Stem和Suffix。Prefix = 0-4个字符Suffix = 0-6个字符。你知道我怎样才能做到这一点吗?编辑1: public static List<string> GetMatches(string inputTextArabic) // store matc
浏览 1
提问于2012-06-25
得票数 0
回答已采纳
1
回答
如何使Lucene 5.5.0 StandardAnalyzer与Lucene 2.9.0 StandardAnalyzer对齐?
、
、
在Lucene5.x和2.x之间,StandardAnalyzer的默认行为是不同的,例如使用如下代码的that's H&M:analyzer.tokenStream("text", new StringReader(chunkText));
浏览 0
提问于2018-02-06
得票数 0
1
回答
从混淆的字符串中识别正确的单词(随机位置中的意外空格)
、
、
我得到的问题是:我可能收到来自其他系统的字符串,并且字符串中可能有一些不必要的空格,例如:"effec da te",它应该是“生效日期”,那么是否有可能有一个通用
算法
来删除这种不正确的空格?
浏览 12
提问于2018-08-10
得票数 2
回答已采纳
1
回答
需要在NLTK和
Python
中设置分类语料库阅读器,语料库文本在一个文件中,每行一个文本
、
、
、
、
我越来越熟悉雅各布·珀金斯的书"
Python
text Processing with NLTK2.0 Cookbook“中的NLTK和文本分类。我的文件中的每一行(一段文本-领域标题、描述、关键字的组合),都是特征提取的主题:
分词
化等,以使其成为机器学习
算法
的实例。 我有两个这样的文件,其中包含所有正面和负面的内容。
浏览 1
提问于2014-12-18
得票数 3
2
回答
将名字和姓氏识别为一个实体
、
、
我想知道是否有一个很好的已知
算法
,可以在文本中确定一个实体的名字和姓氏。Last week John Wayne went to Europe.我想要一个
分词
器,给出:"Last","Week",John Wayne",“John”," to ","Europe“。 任何帮助都是非常感谢的。
浏览 1
提问于2014-06-11
得票数 1
1
回答
使用NLTK为中文运行StanfordPOSTagger时的意外格式
、
、
、
、
我安装了
Python
3.6.0,NLTK3.2.4,并下载了Stanford标签3.8.0。#!/usr/bin/env
python
3 print(st.tag('这 是 斯坦福 中文
分词
器 测试'.split()))[('
浏览 6
提问于2017-08-07
得票数 2
回答已采纳
1
回答
手写
分词
、
、
、
、
现在我需要在这张线图像中进行
分词
。上述
算法
工作良好,但缩小了图像的大小。它影响了单词的大小。我需要一些帮助,在不减少图像大小(高度或宽度)的情况下进行
分词
。
浏览 7
提问于2022-09-09
得票数 -5
2
回答
为任意对象创建哈希?
我一直在使用pickle.dumps来为任意的
Python
对象创建一个散列,但是,我发现dict/set订单没有规范化,因此结果是不可靠的。在SO和上都有 ,但是我似乎找不到使用相同的等式基础的散列
算法
(__getstate__/__dict__结果)。我理解滚动自己的基本要求,但显然我更喜欢使用经过测试的东西。为了澄清,我正在寻找与
Python
的 (或)返回的值不同的东西。我想要的基本上是对任意对象的校验和,这些对象可能是或者可能是不可理解的。此值应根据对象的状态而变化。(我使用"
浏览 5
提问于2013-04-22
得票数 7
回答已采纳
1
回答
python
中的逐个
分词
(
分词
术语a term en
python
)
hello all,需要定义一个函数,该函数可以按术语矩阵或在最坏的情况下,在列表数组之间划分,以便在第三个矩阵中得到结果,
浏览 2
提问于2009-11-23
得票数 3
回答已采纳
5
回答
如何避免重复加载大文件?
、
、
、
、
我正在尝试从
python
中调用一个Java程序(斯坦福中文
分词
程序)。Java程序需要加载一个大的(100M)字典文件(帮助
分词
的单词列表),这需要12+秒。我想知道是否有可能加快加载过程,更重要的是,当我需要多次调用
python
脚本时,如何避免重复加载它?
浏览 4
提问于2012-01-28
得票数 4
回答已采纳
1
回答
分词
算法
的空间复杂度
、
、
、
解决的一种方法是使用数组进行回忆录。但是,我认为应该更接近O(N^2),因为在每个递归级别上,我们都执行一个子字符串操作s[start:end]。这个准确吗? def wordBreak(self, s: str, wordDict: List[str]) -> bool: def wordBreakMemo(s: str, word_dict: FrozenSet[str], start: int): if start == len(s):
浏览 5
提问于2022-03-26
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
算法-分词技术
Python实现jieba分词
Python R 分词处理
死磕Python(5):结巴分词
Python算法
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
即时通信 IM
活动推荐
运营活动
广告
关闭
领券