腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
Neo4j
使用
JACCARD
或
sorensenDiceSimilarity
或
其他
类似
工具
在
节点
上
查找
字符串
的
相似
度
、
我有一个序列
字符串
'TTCTTGAAGACGAAAGGGCCTCGTGATACGCCTATTTTTATAGGTTAATGTCATGATAATAATGGTTTCT‘ 我有带有标签序列和属性seqFull
的
节点
,该属性包含一个很大
的
DNA
字符串
。想要返回
节点
和
相似
度
得分,其中
相似
度
得分大于输入
在
Neo4J
中
的
大序列中
查找
相似</em
浏览 51
提问于2020-03-26
得票数 0
2
回答
用于Excel模糊查询
的
算法
、
、
、
我正在做两组公司名称
的
匹配工作。我试着用Python编写代码,
使用
Levenstien
的
距离。我遇到了公司缩写
的
问题,以及他们
的
尾随部分,比如Pvt,Ltd。我已经用Excel模糊
查找
运行了相同
的
集合,并获得了良好
的
结果。我有一种方法,我可以看到excel模糊
查找
是如何编码
的
,并
使用
python中
的
相同实现。
浏览 25
提问于2018-09-28
得票数 1
1
回答
如何让py2neo密码查询接受python
的
参数?
、
、
、
总体背景我
的
目标是让函数从csv文件中加载数据,该文件定期更新自己,并根据需要创建新
的
节点
和关系。之后,用户可以输入与文章标题相关
的
搜索词,并
使用
Jaccard
相似
度
方法
查找
与其文章相关
的
关键字。我一直试图按照以下所示
的
功能结构: 我已经分别测试了
neo4j
密码查询,目前我正在尝试让py2
浏览 0
提问于2018-12-23
得票数 0
回答已采纳
1
回答
在建立
相似
图时,是否存在平均
相似
度
分数高
的
问题?
、
、
我正在
Neo4j
中构建一个
相似
图,而gds.nodeSimilarity.stats报告了一个
在
0.60到0.85范围内
的
平均
相似
度
分数,用于我所
使用
的
投影,不管我如何转换这个图。我试过: 只投影边权重大于1
的
关系(删除核心
节点
以增加组件
的
数量)(我
的
图大约是一个主题,核心
节点
将topic)Changing表示为无向图)。我意识到我总是可以将similarityC
浏览 2
提问于2021-11-30
得票数 0
回答已采纳
1
回答
用于识别
相似
日志文件
的
相似
性度量
、
、
、
我想实现一个
相似
度
函数,可以准确地识别
相似
的日志文件。到目前为止,我还无法为我
的
问题找到合适
的
相似
性度量。Total similarity = similarity(day1) + similarity(day2) + similarity(day3) 对于这个问题,我可以
使用
浏览 1
提问于2012-09-20
得票数 1
2
回答
NLP/机器学习文本比较
、
我目前正在开发一个程序,它可以将一个小文本(比如250个字符)与一个
类似
文本
的
集合(大约1000-2000个文本)进行比较。其目的是评估文本A是否与集合中
的
一个
或
多个文本
相似
,如果
类似
,则必须通过ID检索集合中
的
文本。每个文本都有一个唯一
的
ID。我希望输出有两种方式: 选项1:文本A匹配文本B具有90%
的
相似
性,文本C匹配70%
的
相似
性,等等。选项2:文本--具有最高
相似<
浏览 4
提问于2013-08-26
得票数 16
1
回答
LSH宾宁
在
飞
、
、
我想
使用
MinHash LSH将大量文档放入
类似
文档
的
桶中(
Jaccard
相似
性)。我发现一个非常混杂
的
实现是datasketch。
在
了解所有文档
的
MinHash之后,我可以查询与给定文档<e
浏览 2
提问于2019-06-01
得票数 0
回答已采纳
3
回答
Jaccard
相似
与余弦
相似
的应用与区别
Jaccard
相似
度
和余弦
相似
度
是比较项目
相似
性时常用
的
两种度量方法。然而,在哪种情况下哪一种比另一种更可取,我并不十分清楚。有人能帮助澄清这两种测量方法
的
差异(概念
或
原理
的
差异,而不是定义
或
计算)及其更好
的
应用吗?
浏览 0
提问于2015-02-12
得票数 39
回答已采纳
2
回答
如何从语义
上
比较文本
、
假设你有一堆书
的
描述。有什么技术可以使这篇文章相互比较,这样我就可以对具有
相似
主题
的
书籍进行分组。
浏览 2
提问于2012-09-26
得票数 1
回答已采纳
1
回答
具有不同标签
的
两个文本之间
的
关系
我现在对算法
的
概念有一个问题。我想创建一个WYSIWYG编辑器,它与我现有的bbcode编辑器一起
使用
。为此,我为WYSIWYG编辑器
使用
了一个contenteditable设置为true
的
div和一个包含相关bbcode
的
textarea。在此之前,没有问题。我想比较一下这两个文本(一个
使用
<span>这样
的
html标签,另一个
使用
[b]这样
的
bbcode标签),这就是我
在
努力
的
地方。
浏览 0
提问于2018-08-27
得票数 0
2
回答
如何比较(子)网?
、
1)第一个(简单
的
)问题是如何根据访问过
的
城市之间
的
相似
性为给定
的
旅行者找到最
相似
的旅行者列表?,那么对于旅行者A来说,最
相似
的将是旅行者C。因为对于每个旅行者来说,参与城市
的
子网本质
上
是一列直接连接
的
节点
,所以即使没有Cypher,比较也相对容易(不确定是否有一种优雅
的
方法通过Cypher来实现)。2)更复杂
的
比较场景不是通过直接
的
城市,而是它
浏览 1
提问于2013-10-20
得票数 2
1
回答
如何从csv文件中进行超高速批量导入?
我们正在评估图形数据库来存储我们
的
网络通信数据,并将其集中
在
neo4j
和orientdb
上
。是否有与
neo4j
类似
的批处理导入器
工具
或
脚本?我能够
在
25分钟内为with150M导入一个csv文件、
neo4j
关系和18M个
节点
。阅读orientdb站点
上
的
文档,看起来我需要通过修改json文件来
使用
ETL特性来完成导入。没有
其他
更
浏览 6
提问于2015-04-15
得票数 1
回答已采纳
2
回答
泰坦如何
使用
HBase / Cassandra实现固定时间
查找
?
、
、
在
O‘’Reilly
在
第6章中
的
“图形数据库”一书中,它是关于
Neo4j
如何存储一个图形数据库
的
,它说: 要理解为什么本机图形处理比基于重索引
的
图要高效得多,请考虑以下几点。根据实现
的
不同,索引
查找
可以是算法复杂
度
中
的
O(log ),而用于
查找
直接关系
的
O(1)。要遍历由m个步骤组成
的
网络,
在
O(m log n)处,索引方法
的
浏览 8
提问于2014-09-24
得票数 5
回答已采纳
3
回答
图形数据库中搜索查询
的
时间复杂
度
是多少?
、
、
、
、
图形数据库(特别是
Neo4j
)中搜索查询
的
时间复杂
度
是多少?有人能帮我吗?
浏览 7
提问于2017-11-04
得票数 3
2
回答
Neo4j
-我如何决定索引
的
内容?
、
、
假设我已经创建了50K Persons:CREATE (:Person { name: name, joinTimestamp: 1000000 })WHERE random < 0.001 AND p1 <> p2这是可行
的
,但是我想加快第二个查询
的
速度。我假设
Neo4j
会在MERGE
浏览 0
提问于2019-07-15
得票数 0
回答已采纳
2
回答
什么程序/实用程序
在
源代码中
使用
特殊
字符串
"@(#)“?
、
、
在
源代码
的
注释中(尤其是较旧
的
代码),可以
在
标题注释中看到文件名、日期以及这种特殊格式
的
其他
信息:(另请参阅: ) 这很
相似
(或者可能是相关
的
转换为
类似
RCS
的
字符串
"$Id$“($Header$等)。我以为"file“命令行实用程序
或
类似
浏览 0
提问于2009-10-28
得票数 1
回答已采纳
3
回答
我如何计算课文中
的
单词和短语?
、
、
我想要计算一些给定
的
单词
或
短语
在
文本中出现
的
次数,但我想
使用
一些
字符串
相似
性算法。有没有用于文本处理
的
库?例如:找出包含“视频游戏”、
浏览 1
提问于2011-07-28
得票数 2
2
回答
基于项属性
查找
相似
项
、
、
mahout中
的
大多数推荐算法都需要用户项
的
偏好.但是我想为一个给定
的
项目找到
类似
的项目。我
的
系统没有用户输入。也就是说,对于任何电影,这些都可以是属性,可以用来找出
相似
系数。体裁 将来可以对属性列表进行修改,以建立更高效
的
系统。但是,要在mahout数据模型中找到项目的
相似
性,需要每个项目的用户偏好。因为这些电影可以聚集在一起,并在给定项
上
获得集群中最接近
的
项。之后,
在
介绍了基
浏览 6
提问于2015-11-17
得票数 3
1
回答
返回两个
字符串
列之间
的
字符串
相似
性分数- Pandas
、
我正在尝试构建一个基于结果
的
搜索,其中我将有一个具有一行
的
输入数据帧,并且我希望与另一个具有近100万行
的
数据帧进行比较。我正在
使用
一个名为Record Linkage
的
包 但是,我不能处理打字错误。假设我
的
原始数据中有"HSBC“,用户将其键入为"HSBC”,我只想返回“HSBC”结果。
在
比较
字符串
相似
距离和jarowinkler时,我得到了以下结果: from pyjarowinkler import dist
浏览 13
提问于2019-09-25
得票数 2
回答已采纳
1
回答
查找
相似
字符串
的
索引策略
、
、
、
、
我有超过1.9亿个这样
的
散列。我必须选择一个合适
的
索引数据结构,其中
查找
相似
散列
的
最坏情况复杂
度
不是O(n)。散列数据结构将无法工作,因为它将搜索<、=和>(或者它会吗?)。我可以找到汉明距离
或
其他
距离来计算
相似
度
,但在最坏
的
情况下,我将计算1.9亿次。目前我正在BTree上工作,我将根据no对
节点
中
的
所有键进行
浏览 0
提问于2016-07-25
得票数 2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
同学,你都了解关系型数据库,确定不了解一下这种数据库吗?
Python 字符串相似性的几种度量方法
Neo4j的python操作库Neomodel
智能运维系列(八)| 事件指纹库:构建异常案例的“博物馆”
Neo4j 和图数据库起步
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券