腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
python
中
具有
if
条件
的
fuzzywuzzy
匹配
、
、
我有两组数据,我需要使用
fuzzywuzzy
或任何其他选项来查找相似的
匹配
,SLNo|产品名称|品牌我试过下面的代码from
fuzzywuzzy
import process, fuzz Bl.to_csv("oput2503-
浏览 3
提问于2020-03-12
得票数 0
2
回答
对多值字典嵌套列表
中
的
所有值运行查询。
、
、
、
、
与每个唯一键相关联
的
所有值都存储在列表
中
。包,以便针对多值字典
中
嵌套
的
所有值搜索目标字符串,并根据
fuzzywuzzy
的
内置编辑距离公式返回前5位
匹配
。= process.extract(query, choices, limit=5) 然后,我将运行一个进程,获取最接近
的
匹配
值(
具有
最高模糊比分数
的
值),并识别与最接近
匹配
值相关联
的
键。在这个例子
中</e
浏览 1
提问于2016-02-03
得票数 2
回答已采纳
2
回答
PySpark抛出ImportError,但模块实际上存在并运行良好
、
、
、
、
我试图crossJoin两个表并创建一个
具有
模糊
匹配
比
的
列(因此我需要导入
fuzzywuzzy
)。以下是代码:def fuzzy_ratio(x,y): res = fuzz.token_set_ratioat org.apache.spark.api.
python
.PythonRunner$$anon$1.read(PythonRDD.sc
浏览 0
提问于2017-07-11
得票数 3
回答已采纳
2
回答
python
从列表
中
打印行
的
最高模糊比
、
我有一个list,由组成,有些行.I想要打印行
匹配
词'good‘,
具有
最高
的
模糊比。问题:只打印单词而不是列表
中
的
行from
fuzzywuzzy
import fuzzprint(max(c, key=lambda a: fuzz.ratio(a, &
浏览 2
提问于2014-08-16
得票数 0
1
回答
按正则表达式或模糊
匹配
合并Dataframe
、
、
、
、
但是,ID和ID2并不完全
匹配
。相反,ID是ID2
的
前8位(有时可以是前6位,也可以是1或2位不同)。 我知道我可以预处理ID2,只保留前8位数字.然而,我不能处理所有的情况。我想知道是否有一种更先进
的
方法,通过正则表达式合并模糊
匹配
?比方说,如果前六位数
匹配
,那么合并?
浏览 3
提问于2016-08-03
得票数 3
回答已采纳
1
回答
使用
fuzzywuzzy
和
python
3.6根据评分对字符串进行适当
匹配
、
、
、
、
我正在尝试使用
python
应用程序
中
的
模糊逻辑库
fuzzywuzzy
来
匹配
字符串。我发现,即使在得分相等之后,
fuzzywuzzy
也没有给出适当
的
结果,它在第一个位置列出了错误
的
结果。=True)[('Patrick Walsh', 75), ('Jonathan Walsh', 75), ('John Welsh', 62)] 可以看到,字符串是jwalsh,
浏览 0
提问于2017-08-02
得票数 0
1
回答
python
fuzzywuzzy
匹配
指数
的
获取
、
、
我使用
Python
fuzzywuzzy
在一个句子列表
中
查找
匹配
: return process.extract(needle, bookSentences, scorer=fuzz.token_sort_ratio, limit=3)for match in matches: for index i
浏览 3
提问于2015-12-02
得票数 4
回答已采纳
2
回答
如何从给定
的
列表
中
获取
匹配
的
文本,该列表被提供给模糊
的
wuzzy partial_ratio()?
、
、
我只想知道列表
中
的
哪些文本与给定
的
字符串100%部分
匹配
。from
fuzzywuzzy
import fuzz s_list= ["Hai all", "Hello world", "Thank you"] fuzz.partial_ratio因为"Hello“与"Hello world”有部分
匹配
,但是我如何获得"Hello World“作为输
浏览 18
提问于2020-10-07
得票数 1
回答已采纳
2
回答
如何在
python
中使用
fuzzywuzzy
获取最大
匹配
字符串
、
我正在尝试通过使用
python
中
的
fuzzywuzzy
库来
匹配
字符串,以便在字符串
中
获得最大可能
的
匹配
。import pandas as pdfrom
fuzzywuzzy
import fuzz input_row =
浏览 6
提问于2018-12-28
得票数 1
1
回答
如何不精确
匹配
2个csv文件
、
、
、
我有两个csv文件,dictionary.csv和file.csv,我想检查dictionary.csv
中
的
单词是否存在于file.csv
中
。dictionary.csv
中
的
一些行包含超过2个单词,我想知道是否有方法可以做到这一点, 如果行中有3个单词,并且行
中
至少有2/3个单词与file.csv
匹配
,则返回1,否则返回0 如果行中有2个单词,并且行
中
至少有1/2个单词与file.csv
匹配
,则返回1,否则返回0
浏览 13
提问于2019-10-12
得票数 0
2
回答
对2只大熊猫数据进行模糊
匹配
、
、
我有两个不同行号
的
数据格式,其中包含了有关球员
的
信息。第一个有我需要
的
所有名字。'Team': ['A', 'C', 'E', 'C', 'B', 'D', 'B', 'A', 'D']})df2 = pd.Da
浏览 9
提问于2022-05-18
得票数 0
回答已采纳
1
回答
使用
fuzzywuzzy
进行字符串
匹配
-是使用Levenshtein距离还是使用Ratcliff/Obershelp模式
匹配
算法?
、
、
是一个非常流行
的
字符串
匹配
库。根据文库
的
,提到它使用Levenshtein距离来计算序列之间
的
差异。但是关闭后,我发现它实际上使用了difflib库
中
的
SequenceMatcher函数。根据,此函数使用Ratcliff/Obershelp模式
匹配
算法。 根据定义,是将一个字符串转换为另一个字符串所需
的
最小编辑次数,计算
匹配
字符
的
倍数除以两个字符串
中
的
字符总数。一个比较两
浏览 1
提问于2018-12-31
得票数 5
1
回答
Python
创建一个用于NLP分析
的
自定义字典
、
、
、
我对
Python
相当陌生。我想要创建一个自定义字典,以便将混乱
的
公司名称
的
长列表(1Mil+行)合并为干净
的
名称。我能用这个包吗? 例如:我有下面的交易数据和商人
的
名字。我想创建一个自定义字典,这样我就可以把商人
的
名字分类为干净
的
了。
浏览 0
提问于2018-03-23
得票数 1
1
回答
当句子之间没有
匹配
的
单词时,
fuzzywuzzy
是如何工作
的
?
、
、
、
我正在使用
fuzzywuzzy
匹配
来查找句子之间
的
相似性。当我比较这两句话时-‘用户尝试登录’和‘接受标准’它给我打了42分。有没有人能帮我解释一下,当没有
匹配
的
单词时,我们是如何得到42分
的
?
浏览 3
提问于2021-03-23
得票数 0
1
回答
使用EVE
Python
进行请求和响应
、
、
我正在尝试将EVE api与
python
3结合使用。这是我第一次尝试使用API。因此,我想要做
的
和取得
的
成就如下:adam.barbar@example.com是我参加
的
考试。现在,我已经编写了将字符串ada
浏览 1
提问于2017-07-17
得票数 1
回答已采纳
1
回答
当使用TypeError和Pandas进行字符串
匹配
时
、
、
、
在
Python
3
中
使用
FuzzyWuzzy
库时,我遇到了一个错误,我也在使用Pandas库处理CSV文件。我
的
目标是获取CorporationName
中
的
每个字符串,并将其与CorporationName2
中
的
所有字符串进行比较。然后,我希望
FuzzyWuzzy
从CorporationName2返回5个最相关
的
字符串(即该名称
的
可能变体)。这只是一个庞大
的
字符串
匹配</em
浏览 0
提问于2016-04-15
得票数 0
回答已采纳
2
回答
Fuzzywuzzy
导入错误奇怪
、
、
我已经通过pip将
fuzzywuzzy
安装到一个虚拟环境
fuzzywuzzy
==0.3.1
中
。在
python
解释器(通过ipython)
中
,我执行以下操作from
fuzzywuzzy
import process a = "my name/Users/InNov8/Projects/datamine/denv/bin/
py
浏览 2
提问于2014-08-30
得票数 1
1
回答
熊猫数据
中
包含名称
的
dfs
匹配
、
、
、
我有两个有名字列表
的
数据集。1 dataset还有另一个没有的额外名称,而另一个则有重复名称。我
的
目标是创建第三个数据格式,列出所有的差异,并排除
匹配
。我认为这些额外
的
名字和绰号是在抛出一些东西。
浏览 5
提问于2021-07-09
得票数 0
回答已采纳
2
回答
在nltk
中
是否有一个内置
的
方法来查找与给定单词非常
匹配
的
单词/短语?
、
、
、
我使用
的
语音识别软件
的
效果并不理想。matches = { ...我正在翻遍所有的单词以找到
匹配
的
词。我不介意假阳性,因为应用程序只接受一组有限
的
关键字。但是,手动为每个单词输入新单词是很繁琐
的
。而且,每次我说话
的
时候,语音识别
浏览 4
提问于2016-04-14
得票数 2
回答已采纳
1
回答
多值
python
的
字符串比较
、
、
第一个(A)是一张装备清单,上面有复杂
的
名称。第二个是更广泛
的
设备类别(B)
的
列表--我必须将第一个列表分组为使用字符串比较。我知道这并不完美。对于列表A
中
的
每个实体,我想为列表B
中
的
每个实体建立levenshtein距离。B列表
中
得分最高
的
记录将是我将指定数据点
的
组。我在
python
中非常生疏--我正在使用
FuzzyWuzzy
来获取两个字符串值之间
的
距离。但是,
浏览 2
提问于2017-10-05
得票数 5
回答已采纳
点击加载更多
相关
资讯
FuzzyWuzzy,文本匹配的完美利器,太智能了!
Excel中vlookup多条件匹配的2种方法
Python中的条件语句if else
Python中编写条件分支代码的技巧
模糊字符串匹配:FuzzyWuzzy
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
即时通信 IM
活动推荐
运营活动
广告
关闭
领券