腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何
计算
文本
中
每对
句子
之间
的
距离
?
、
我正在
计算
句子
之间
的
距离
,现在我有了一个有几个
句子
的
文本
。我不知道
如何
写for循环来生成每对
句子
之间
的
距离
。def similarity(sent): for a,b in sent: feature_sim[a,b] = pylev.
levenshtein
浏览 0
提问于2019-01-02
得票数 0
回答已采纳
3
回答
在python
中
对相似的单词进行分组
的
最佳方式是什么?
、
、
、
我发现这个与这个主题相关,并尝试在我
的
单词数组
中
实现亲和力传播算法,但我发现输出非常差。import scipy.linalg as linimport matplotlib.pyplot asThe output is for i in unique_labels:下面是我得到
的</e
浏览 0
提问于2015-10-01
得票数 0
1
回答
如何
计算
文本
中
句子
之间
的
Levenshtein
距离
、
我想
计算
一个文档
中
句子
之间
的
Levenshtein
距离
。我找到了一个代码,可以
计算
字符级别的
距离
,但我希望它是单词级别的。def
levenshtein
_distance(a, b): return 0 a, bprevious_row = current_row print (previou
浏览 13
提问于2018-12-27
得票数 0
4
回答
VBA
中
的
Levenshtein
距离
、
、
我有excel表与数据,我想得到他们
之间
的
Levenshtein
距离
。我已经尝试导出为
文本
,从脚本(php)
中
读取,运行
Levenshtein
(
计算
Levenshtein
距离
),将其保存到excel
中
。但是我正在寻找一种在VBA
中
编程
计算
Levenshtein
距离
的
方法。我该怎么做呢?
浏览 2
提问于2010-11-22
得票数 58
回答已采纳
2
回答
python NLP
的
相似性检验
、
如果我有两列,两列都是从不同
的
资源
中
检索
的
,但是使用相同
的
标识符,我需要检查它们是否相似,但是可能只有拼写上
的
不同,或者它们完全不同。
浏览 5
提问于2022-07-04
得票数 0
回答已采纳
2
回答
两个向量
之间
的
Damerau-
Levenshtein
距离
、
、
、
两个字符串"abc“和"acb”
之间
的
Damerau-
Levenshtein
距离
将是1,因为它涉及"b“和"c”
之间
的
一个转置。"dl")现在假设我有以下两个字符向量:B = c("apple", "citrus", "banana&q
浏览 5
提问于2021-03-31
得票数 1
1
回答
Postgres选择具有百分比匹配
的
行,并按百分比进行排序。
、
我在postgres数据库里有一张
句子
表。表名为sentences,存储每一行
句子
的
列称为sentence。我
如何
将这些
句子
与给定
的
句子
进行比较,并返回其中60%
的
单词(甚至更好
的
词根)匹配
的
句子
,然后根据匹配
的
质量对结果进行排序?理想情况下,90%
的
比赛将在70%
的
比赛之前进行,而50%
的
比赛根本不会出现。 理想情况下,它也会
浏览 2
提问于2015-07-04
得票数 2
回答已采纳
2
回答
如何
使跨数百万条记录
的
文本
搜索和相似度
计算
在python中高效
、
、
、
、
我必须将表1
中
的
每个项目与表2
中
的
每个描述匹配,才能找到最大
的
相似性匹配。因此,基本上,对于两百万项
中
的
每一项,我必须扫描另一张表,以找到最佳匹配。这就意味着200万*200万次
计算
!我
如何
在python中高效地完成这个任务呢?就目前情况而言,
计算
将需要数年时间。现在,我遵循
的
方法是regex搜索,将每个项目名称分割成列表
中
的
单词,然后检查单词是否包含在descr
浏览 1
提问于2016-07-01
得票数 2
3
回答
NLP算法
计算
最大5-6字
句子
间
的
相似度
、
、
我正在寻找一个相对简单
的
NLP algo,这将帮助我评估两个
句子
之间
的
相似性。这些
句子
通常在1-5个单词
之间
,大约.上下文:一种假设是,他们创建一个带有拼写错误
的
类别,而不是删除,
浏览 0
提问于2022-04-01
得票数 1
1
回答
R-
计算
列表
的
成对正交相似度
、
我需要
计算
给定语料库
中
单词
之间
的
拼写相似度(edit/
Levenshtein
距离
)。R包vwr似乎能够
计算
出:其中在两个单词列表
的
匹配单词
之间
成对地
计算
Levenshtein
距离
。我想知道是否有一种方法可以
计算
给定单词列表中所有可能
的
单词组合
之间
的
浏览 1
提问于2017-12-07
得票数 0
1
回答
如何
使用Python识别连续
句子
中
的
主题转换?
、
、
、
、
我想检测连续
句子
之间
的
主题转换。例如,我有一个段落(这可能是几十个
句子
的
集合,有时没有过渡词)如下:在这里,我想自动地将其分成以下几个子解释: 据我所知,这不是
句子
浏览 0
提问于2020-04-28
得票数 0
回答已采纳
1
回答
使用
levenshtein
距离
的
两个整体
文本
相似度
、
、
我有两个
文本
文件想比较一下。我所做
的
是: 我测量了一个文件
中
的
每个
句子
和第二个文件
中
的
每个
句子
之间
的
距离
。我想
计算
这两个
文本
文件
之间
的
平均相似度,但是我很难传递任何有意义
的
值--显然算术平均值(归一化
的
所有
距离
之和除以比较
浏览 1
提问于2013-03-25
得票数 6
1
回答
高效地查找与简单通配符字符串最匹配
的
现有字符串
、
、
、
如果用户输入DEF1245,则需要进行一些
计算
。我认为
Levenshtein
距离
在这里是一个很好
的
候选者,因为它将告诉我(在本例
中
),需要更改两个字母来复制最接近
的
字符串。如果存在标识符DEF12**,这将不是问题,因为两者
的
距离
相同,但这是可以
的
,因为至少我知道这两个选项都是有效
的
匹配。问题是,我可能会对数据库
中
可能存在
的
数千个字符串运行此比较,这可能存在严重
的
浏览 1
提问于2015-02-04
得票数 0
2
回答
如何
将
Levenshtein
距离
应用于一组目标字符串?
、
、
我读过
Levenshtein
距离
和Damerau-
Levenshtein
距离
,它基本上返回源字符串和目标字符串
之间
的
距离
,即将源字符串转换为目标字符串所需
的
更改数。但是,
如何
将此算法应用于一组目标字符串?对于属于TARGET
的
每个字符串,我
计算
出SOURCE
中
每个字符串
的
距离
。我们可以说,第一行表示语音识别器检测到<e
浏览 4
提问于2012-04-30
得票数 3
回答已采纳
2
回答
PHP查看有多少个字符相等
、
、
我有一个由逗号分隔
的
值组成
的
字符串。不用说,这可以用$strings = explode(',',$fullstring);来完成。 如果你明白我
的
意思。当然,字符串也可以包含空格、撇号、数值。(使用if(in_array(strtolower($userValue),array_map(
浏览 1
提问于2013-06-09
得票数 2
回答已采纳
2
回答
接近挑战
的
代码:起始
、
这是这个挑战
的
续集:接近质询
的
代码:整数之和
计算
两个字符串
之间
的
Levenshtein
距离
就像上次
的
挑战一样,你在这次挑战
中
的
分数是代码和上面引号
之间
的
Levenshtein
距离
。您
的
程序将接受两
浏览 0
提问于2015-07-23
得票数 16
1
回答
从英语
文本
中
找出重复或相似的
句子
我想要一个工具,接受输入
文本
,并返回哪些
句子
是重复
的
,非常相似(例如,信息
距离
,如在
Levenshtein
距离
)。例如,如果两个
句子
包含超过80 %
的
相同单词(模糊),那么就找到它们。我发现最好
的
方法是:用换行符替换所有的点(句号)。然后用排序对文件进行排序并输出它。它有效,但只适用于精确
的
句子
。
浏览 0
提问于2022-09-25
得票数 1
1
回答
Levenshtein
距离
与最大公共子序列相关吗?
、
、
、
我没有证据,但我有直觉,假设s1是需要转换为s2
的
字符串,那么我们可以在s1
中
保留最大
的
公共子序列,编辑
距离
是我们需要替换/删除/插入
的
元素
的
数量。For example : s1 = "adjsjvnejnv"这里LCS是"djne“,现在我们需要删除"djne”右侧
的
3个元素字符串"jnv“,我们可以在s1
中<
浏览 7
提问于2020-05-06
得票数 3
3
回答
在你
的
源头
、
、
、
两个字符串
之间
的
Levenshtein
编辑
距离
是将一个单词转换为另一个单词
的
最少可能
的
插入、删除或替换数。在这种情况下,每次插入、删除和替换
的
成本为1。例如,roll和rolling
之间
的
距离
为3,因为删除成本为1,我们需要删除3个字符。toll与tall
之间
的
距离
为1,因为替换成本为1. 从原
Levenshtein
案中被窃。您
的</em
浏览 0
提问于2017-08-08
得票数 11
3
回答
在查询结果中保留MySQL函数
的
结果(在哪里使用)
、
我
的
数据库中有一个MySQL函数,它
计算
两个字符串
之间
的
levenshtein
距离
。levenstein("str1","str2"), returns INTSELECT * FROM my_table WHERE
levenshtein
('John
浏览 4
提问于2015-12-13
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何用 word2vec 计算两个句子之间的相似度?
用线性规划去计算句子之间的相似度
如何在Excel中让文本公式计算的方法
Excel工作表中如何计算文本算式
每日一模块:Levenshtein
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券