腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
模糊
匹配
地址
、
、
、
我正忙着从两个数据集中编写一个
模糊
匹配
地址
的简单算法。我正在计算两个
地址
之间的levenshtein距离,然后将精确
匹配
或最短
匹配
添加到
匹配
数组中。然而,这是非常缓慢的,因为在最坏的情况下,它必须比较每个旧
地址
和每个新
地址
。CLASSIFICATION_SUBURB]] = $closest; $cnt++;print_r(count($matches)); 请注意,标准化函数只是尝试通过删除不相关的信
浏览 6
提问于2016-04-14
得票数 0
2
回答
地址
匹配
的层次
模糊
匹配
策略
、
、
、
、
我正在R中构建一个
地址
匹配
模块,在该模块中,我希望使用R找到inAddress列表与所有
地址
dbAddress的数据库之间的
匹配
。假设
地址
包含要
匹配
的street number, street name, postal code, city。我想考虑一些
匹配
规则,例如: 将两个<
浏览 4
提问于2017-10-27
得票数 2
1
回答
C#中的
模糊
检索
、
、
、
我有一个包含记录的数据库,其中一些属性形成了一个
地址
。我有一个按
地址
搜索的c# web应用程序,但我需要的不仅仅是通配符来检索
匹配
。有没有办法从web应用程序中实现
模糊
/粗糙搜索?
浏览 2
提问于2014-11-12
得票数 1
1
回答
Python
库以一致和相同的方式编码相似的人名
、
我正在寻找一个函数(来自
Python
库或类似的函数),该函数以名称作为输入,并生成一个共享数量变量/该名称拼写错误的编码,即nameEncoder我看过各种
模糊
匹配
工具,但似乎都集中在比较值对上。我想将此作为数据预处理步骤来完成,这样以后的联接/聚合/还原就不需要使用
模糊
匹配
了。 我意识到这里会有歧义,就像
模糊
匹配
一样,所以没有什么是完美的。各种SAS工具都有一个名为
匹配
浏览 0
提问于2021-10-20
得票数 0
2
回答
Oracle中的
模糊
文本搜索
、
、
在我的应用程序中,我接受一个
地址
字符串作为输入,并希望检查该
地址
字符串的特定子字符串是否与表中的一个或多个街道名称
匹配
,这样我就可以将该
地址
子字符串标记为街道名称。显然,这应该是一个
模糊
文本
匹配
问题,我查询的子字符串与DB表中的街道名称完全
匹配
的可能性很小。因此,应该有一种
模糊
文本
匹配
方法。但它们似乎用于更复杂的任务,比如在文档中搜索给定字符串的
匹配
项。我只想对表的一列执行此操作。 在这种情况下,您对我有什么建议?
浏览 3
提问于2014-08-12
得票数 15
回答已采纳
1
回答
快速
模糊
地址
匹配
技术
、
、
我使用RapidFuzz来
匹配
来自两个独立数据集的美国
地址
。例如:102号的
匹配
率为86%编辑09/14/21:我是连接
地址
,与城市和州,然后试图
匹配
。编辑09/15/21:我连接了
地址
,它现在有州和城市名称,连同
地址
,然后尝试
模糊
匹配
它
浏览 0
提问于2021-09-13
得票数 1
3
回答
如何计算
模糊
字符串
匹配
中的分数?
、
我想知道计算两个字符串之间
模糊
匹配
分数的数学逻辑和公式。 假设我有两个字符串s1和s2,我想在
python
中使用
模糊
匹配
。我知道像fuzzywuzzy这样的
python
库可以做到这一点。但我想知道
模糊
匹配
方法和比率计算背后的精确数学和逻辑。
浏览 2
提问于2020-10-17
得票数 0
回答已采纳
1
回答
模糊
地址
匹配
R
、
、
下面有示例数据--我有两列,col1是当前
地址
,col2是一个比当前
地址
“更好”的
地址
。我需要看看第二栏比第一栏好多少。("old_addr" , "new_addr"))) ,stringsAsFactors=FALSE)我需要创建第三列,它是一个简单的1/0变量,如果它是近似
匹配
的我需要能够为近似
匹配
指定阈值。 对于我的第一个例子- 742长青露台与742长青露台Apt 3,长度相差6。我需要能够指定长度差6或8
浏览 0
提问于2018-07-25
得票数 6
回答已采纳
1
回答
怎样才能找到最好的
模糊
字符串
匹配
?
、
、
、
、
Python
的支持
模糊
字符串
匹配
。大声歌颂(现在)。 regex.search("(?
浏览 2
提问于2016-04-24
得票数 6
回答已采纳
1
回答
基于关键词的
模糊
匹配
、
、
有没有办法开发一个
模糊
匹配
逻辑(在
Python
语言或R语言中)来从df_1的df_2中查找ID
匹配
应基于
模糊
name
匹配
、精确city
匹配
、state
匹配
和zip
匹配
。如果在city_1中找不到
匹配
项,我会在city_2中查找
匹配
项。如果在state_1中找不到
匹配
项,我会在state_2中查找
匹配
项。df_2也是如此。如果我在NAME_1中找不到
模糊<
浏览 24
提问于2020-09-18
得票数 0
1
回答
Java库进行
模糊
地址
匹配
、
、
我需要在2组
地址
之间实现一些
匹配
。https://www.addy.co.nz/blog/12-tests-for-fuzzy-address-matching 是否有一个专用于
模糊
匹配
地址
的开源库?
浏览 0
提问于2020-11-25
得票数 0
1
回答
如何
匹配
名称列表和电子邮件
地址
列表中的名称和电子邮件
地址
?
、
、
给出几个人名和几封电子邮件(名字的数量不少于电子邮件的数量),我想把名字和电子邮件
匹配
起来。我假设每个名字最多有一封电子邮件是他/她的真实邮件,而每封电子邮件必须是一封真实的电子邮件,其中只有一封。请注意,一个人的电子邮件可能与姓名有些关联,但
匹配
可能非常
模糊
。例如,John可能有以下任何一个电子邮件
地址
。email.com 看来,要执行<
浏览 2
提问于2016-05-18
得票数 1
1
回答
使用
Python
呼呼的
模糊
搜索(排名/得分直接命中高于
模糊
命中)
、
、
、
、
我在使用
模糊
查询时遇到了问题,与
Python
上的直接
匹配
相比,
模糊
查询与
模糊
命中术语的相关性更高。库中是否有可用的现有选项来获得更高的直接
匹配
分数?或者我必须对其进行单独编码(i.e.do直接查询和
模糊
查询,并将文本排序更高...)?谢谢你的建议。
浏览 8
提问于2020-12-13
得票数 0
1
回答
在
Python
中
匹配
数据集中的街道
地址
的最佳方法是什么?
、
、
、
我有一个政府拥有的地块数据集,我试图将街道
地址
与现有的政府机构名单相
匹配
。我使用了
模糊
匹配
,并使用了一个正则表达式,它忽略了大小写和方向之间的区别(例如,北方和N是相同的)。但是,这个程序的
匹配
率很低,因为很多
地址
没有
匹配
。我还应该用什么方法来提高
匹配
率呢?
浏览 0
提问于2020-04-06
得票数 1
1
回答
雪花中的相似搜索
目标:在雪花数据库中实现一个SQL查询,该查询给定一个类似
地址
的字符串(用户输入),对单个字段执行
模糊
/近似搜索,并根据该分数返回具有相似性评分的结果。下面是locations表的示例--请注意,完整的
地址
位于一个字段中,并且可以以不一致的方式呈现。Blvd, Apt 23, Boise ID, 44444-1234 | blue | 用户可能会搜索123 SW Marble Street, Brainerd MA 55555 (完美
匹配
浏览 16
提问于2022-07-18
得票数 0
回答已采纳
2
回答
Clojure CSV
匹配
文件
、
我有2个csv文件,大约22K记录在文件F1中,50K记录在文件F2中,都包含公司名称和
地址
信息。我需要对姓名、
地址
和电话进行
模糊
匹配
。F1中的每个记录都需要与F2中的每个记录进行
模糊
匹配
。我制作了第三个文件R3,它是一个csv,包含
模糊
匹配
规则,从F1到哪个列与F2
匹配
,具有
模糊
公差级别。
浏览 2
提问于2017-09-21
得票数 4
回答已采纳
2
回答
MongoDB是否支持soundex或
模糊
匹配
?
、
、
MongoDB是否支持soundex或
模糊
匹配
?我想找出基本的联系人姓名和
地址
字段的副本。我使用的是官方的C#驱动。谢谢
浏览 0
提问于2011-04-13
得票数 11
回答已采纳
1
回答
当搜索超过一个单词时,在Azure认知搜索中对通用数据使用的最佳文本分析器是什么?
、
、
我所拥有的数据类型是通用的,可以是电子邮件
地址
/名称,这些只是一些例子。 什么是最好的做法,做
模糊
搜索超过一个字,这将给最终用户更少的点击,因为他们给予更多的词?
浏览 18
提问于2022-01-14
得票数 -1
1
回答
MySQL -纽线两边的
模糊
匹配
文本
、
、
我正在处理一个问题,我需要检查一个街道场或精确
匹配
的最低限度,但如果可能的话,
模糊
匹配
。例如,如果我有address 1234 Some Road,它至少应该直接
匹配
换行符的另一边的1234 Some Road。我还想
匹配
999 Somewhere Lane和999 Somewhere Ln。显然,
地址
不会有相同的长度,所以它有一些灵活性,并且不应该超过两行,因为这个网站是在
地址
1和
地址
2的上限上的。这个评论-- https://s
浏览 0
提问于2023-05-18
得票数 0
3
回答
比较两个varchar字段的相似性
我正在尝试编写一段代码,它将比较两个varchar列,其中每个列中
匹配
的字符量被加权并分配一个值,稍后我可以使用这个值来确定它们是否是“
模糊
”
匹配
。
浏览 2
提问于2012-08-29
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
python实现字符串模糊匹配
模糊字符串匹配:FuzzyWuzzy
模糊匹配,Power BI的这个功能太实用了
NLP教程:用Fuzzywuzzy进行字符串模糊匹配
边缘高斯模糊Python实现
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券