首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

如果Janusgraph有大约70G的数据,它大约需要多长时间来重新编制索引

JanusGraph是一个分布式图数据库系统,用于存储和管理大规模的图数据。它基于Apache TinkerPop和Apache Cassandra或Apache HBase构建。重新编制索引是指对现有数据进行重新构建索引,以提高查询效率和性能。

重新编制索引的时间取决于多个因素,包括硬件配置、网络速度、数据分布和索引算法等。由于你没有提供具体的硬件配置和其他细节,无法准确给出时间估计。

然而,一般情况下,重新编制索引的时间可能会比较长。对于大约70GB的数据,可能需要数小时甚至数天的时间来完成重新编制索引的过程。具体时间还取决于你使用的JanusGraph版本、集群规模和负载情况等。

在重新编制索引期间,可能会对系统性能产生一定影响,因此建议在低峰期或者备份数据后再进行该操作。同时,为了提高索引重建的效率,可以考虑增加集群规模、优化硬件配置和调整相关参数。

关于JanusGraph的更多信息和腾讯云的相关产品,你可以参考以下链接:

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

在 Spark 数据导入中一些实践细节

排查 Spark 集群是否存在冲突包。 Spark 启动时使用配置文件和 sst.generator 快乐地导入。 数据校验。 3.2 一些细节 批量导入前推荐先建立索引。...推荐用 int 型节点 ID(可以使用 Snowflake算法 等),如果节点 ID 不是 int 型,这里可以通过在节点/边中加入 policy: "uuid" 设置自动生成 uuid。...如果使用是单独 Spark 集群可能不会出现 Spark 集群冲突包问题,该问题主要是 sst.generator 中存在可能和 Spark 环境内其他包产生冲突,解决方法是 shade 掉这些冲突包...3.3 导入结果 十亿级别节点(属性较少),百亿级别边(向,无属性或带权值),提前建好索引情况下大约消耗 20 小时左右导入全图。...重新修改,提交 PR #2258,通过。经过这次 PR 我也学到了很多。

1.5K20

Windows文件搜索引擎:Everything

您在搜索框输入关键词将会筛选显示文件和文件夹。 "Everything" 索引全部文件需要多长时间? "Everything" 仅索引文件和文件夹名,一般仅需几秒便可建立其数据库。...全新安装 Windows 10 (大约 120,000 个文件) 仅需 1 秒即可索引完成。 索引 1,000,000 个文件将需要大约 1 分钟。 "Everything" 能否搜索文件内容?...不,"Everything" 仅需要使用非常少系统资源。 全新安装 Windows 10 (大约 120,000 个文件) 仅需要大约 14 MB 内存以及不到 9 MB 硬盘空间。...1,000,000 个文件需要大约 75 MB 内存和 45 MB 硬盘空间。 "Everything" 能否监控文件系统变更? 可以,"Everything" 可以监控文件系统变更。...不会,"Everything" 在关闭和重新打开中不会丢失文件系统变更 (甚至系统重启也不会)。 "Everything" 将在启动后更新数据库。 "Everything" 系统要求是什么?

1.4K10
  • JanusGraph配置

    JanusGraph配置文件指定JanusGraph需要使用哪些组件,控制JanusGraph部署各种操作,以及提供许多配置项调整JanusGraph集群性能。...如果需要高级图查询支持(例如全文搜索,地理搜索或范围查询),则必须配置后端索引。有关详细信息,请参见第IV部分“后端索引”。如果需要考虑查询性能,则应启用缓存。...2.1.3 Short Codes 如果之前已配置好JanusGraph集群或者只需要配置后端存储,则JanusGraphFactory可以接受以冒号分隔后端存储名称和主机名或目录字符串这样参数...连接和使用JanusGraph数据两种基本模式: 可以在客户端程序中嵌入JanusGraph调用JanusGraph。...更改离线配置项 更改配置项不会影响正在运行实例,仅适用于新启动实例。 更改GLOBAL_OFFLINE配置项需要重新启动集群,以使更改立即对所有实例生效。

    2.4K40

    系统设计:Twitter搜索服务

    如果我们计划未来五年,我们将需要以下存储: 120GB * 365days * 5years ~= 200TB 如果我们不想在任何时候都超过80%存储空间,我们大约需要250TB总存储空间。...如果我们假设一台现代服务器可以存储多达4TB数据,我们将需要125台这样服务器保存未来五年所需所有数据。 让我们从一个简单设计开始,我们将tweet存储在一个MySQL数据库中。...如果我们想为所有的英语单词和一些著名名词(如人名、城市名等)建立一个索引如果我们假设我们大约30万个英语单词和20万个名词,那么我们索引中总共有50万个单词。...假设每条推文中平均有40个单词,由于我们不会为介词和其他小词(如“the”、“an”、“and”等)编制索引,我们假设每条推文中大约有15个单词需要编制索引。...因此,我们需要存储索引总内存: (1460 * 15) + 2.5MB ~= 21 TB 假设一台高端服务器144GB内存,我们需要152台这样服务器保存索引

    5.2K400

    放弃ElasticSearch,GitHub从零打造搜索引擎!2亿代码仓库怎么搜?

    为了回答这个问题,可以先计算一下用ripgrep对115TB代码进行匹配需要多长时间。...将索引建模为树,并使用差分编码(delta encoding)减少crawling数量并优化索引数据,其中元数据包括文档出现位置列表(哪个path、分支和代码库)以及关于这些对象信息(代码库名称...GitHubingest pipeline每秒可以发布大约12万个文档,因此全部处理完155亿个文档需要大约36个小时;但是增量索引(delta indexing)可以降低所需抓取文档数量50%以上...,使得整个过程可以在大约18小时内重新索引整个语料库。...而索引本身只有25TB,其中不仅包括所有索引(含ngram) ,还包括所有唯一内容压缩副本,这也意味着包括内容在内索引大小大约只有原始数据大小四分之一!

    64420

    JanusGraph之Cache

    Index Cache(索引缓存):缓存索引查询结果,以便随后索引调用可以从内存中提供,而不是调用索引后端和(通常)等待一个或多个网络往返。...如果元素过期,则将在下次访问时从存储后端重新读取数据如果只有一个JanusGraph实例访问存储后端,或者如果此实例是修改图形唯一实例,则可以将缓存过期设置为0,从而禁用缓存过期。...如果有多个JanusGraph实例访问存储后端,则应将时间设置为另一个 JanusGraph实例修改图形和此JanusGraph实例查看数据之间允许最大时间。 3.2....这将导致JanusGraph在下次访问时刷新存储后端顶点数据重新填充缓存。...如果JanusGraph在本地运行或对存储后端运行,以保证修改立即可见,则可以将此值设置为0 Storage Backend Caching(存储后端缓存) 每个存储后端都维护着自己数据缓存层。

    1K10

    【翻译】图解Janusgraph系列-缓存(Janusgraph Caching)

    /](https://liyangyang.blog.csdn.net/) 1 Caching JanusGraph采用多层数据缓存促进快速图形遍历。...如果同一个索引调用在同一个事务中永远不会发生两次,则索引缓存没有区别。 索引高速缓存中每个条目的权重等于,2 + result set size并且高速缓存总权重不会超过事务高速缓存大小一半。...3.1 缓存到期时间 性能和查询行为最重要设置是通过配置缓存过期时间cache.db-cache-time。缓存将保存图形元素最多几毫秒。如果元素到期,则在下次访问时将从存储后端重新读取数据。...如果有多个JanusGraph实例访问存储后端,则应将时间设置为修改图形另一个 JanusGraph实例与查看数据JanusGraph实例之间允许最长时间。...这将导致JanusGraph在下次访问时从存储后端刷新顶点数据重新填充缓存。 但是,当存储后端最终一致时,触发驱逐修改可能尚不可见。

    86420

    图解图库JanusGraph系列-解惑图数据库,你知道什么是图数据库吗?

    ,上述过程我们需要 从接口入参获取小李各种信息 通过小李各种信息去表中查询出对应数据 再根据查出一度用户去表中查询二度用户,那如果要查多度呢,如果想要获取用户其他信息呢,就要join,多表join...而图模型固有的数据索引结构,使得数据查询与分析速度更快。...如果JanusGraph支持高级图查询,就需要JanusGraph指定一个索引后端。 若果要提升JanusGraph查询性能,就必须为JanusGraph指定缓存,指定性能调优选项。...以上提到后端存储系统、索引后端、缓存、调优选项等都可以在JanusGraph配置文件中进行指定。默认情况下配置文件存放在JanusGraph_home/conf目录下。...图实例,通过操作该图实例对图数据库进行操作 总结 本文介绍了,为什么需要数据库,图数据基础理论,市场上存在流行数据库并依照janusgraph数据展开讲解一下图数据库相关知识等。

    2.5K40

    解惑图数据库!你知道什么是图数据库吗?

    而图模型固有的数据索引结构,使得数据查询与分析速度更快。...如果需要双向边,则通过两条相反方向单向边组成。JanusGraph不存在无向边。 Property Key:属性类型,比如“姓名”,“年龄”,“时间”等。...如果JanusGraph支持高级图查询,就需要JanusGraph指定一个索引后端。 若果要提升JanusGraph查询性能,就必须为JanusGraph指定缓存,指定性能调优选项。...以上提到后端存储系统、索引后端、缓存、调优选项等都可以在JanusGraph配置文件中进行指定。默认情况下配置文件存放在JanusGraph_home/conf目录下。...图实例,通过操作该图实例对图数据库进行操作 总结 本文介绍了,为什么需要数据库,图数据基础理论,市场上存在流行数据库并依照janusgraph数据展开讲解一下图数据库相关知识等。

    4.7K270

    百亿级图数据JanusGraph迁移之旅

    社区里面建议是维持 name 索引到顶点id一个 map 存放到内存中,我们没试过,主要感觉两方面问题,第一20亿点需要不少内存,其次因为我们顶点是批量插入,构建这个 map 不是很方便,于是就放弃了这个方案...其实最开始想到就是这个方案,但是这个方案对导入数据有非常严格要求,需要每个顶点一行数据,再把这个顶点关联所有边都关联到这一行,中间用 tab 分隔,第一部分是顶点属性,第二部分是顶点入边,...最痛苦还是这种 bulkLoader 导入方式如果过程中出现问题,失败了,只能将数据清理掉重新导入。...这就导致一个问题,我们是 Spark on Yarn 环境并且集群性能和资源都很好。现在利用不上这部分资源需要重新申请机器再搭建一个 standalone cluster Spark 集群。...4.JanusGraph 查询优化 本来以为经历完漫长数据导入过程,后面会顺利很多,但是现实和期望还是差距。问题是 JanusGraph 在大数据量情况下,查询性能达不到生产要求,查询需要几十秒。

    2.6K50

    JanusGraph数据应用以及知识图谱技术介绍

    微软使用 JanusGraph 构建其推荐系统。 美国国家航空航天局 (NASA) 使用 JanusGraph 构建其知识图谱。 谷歌使用 JanusGraph 进行机器学习和数据挖掘。...参考文档:JanusGraph 架构概览 JanusGraph 架构可以利用分布式技术和横向扩展能力实现高性能数据库操作。专注于紧凑图序列化、丰富数据建模和高效查询执行。...这些存储适配器允许在需要时横向扩展存储层,以处理不断增长数据量。 索引适配器: JanusGraph 支持多个索引适配器,如 Elasticsearch、Apache Solr 等。...数据建模: PostgreSQL 与 MySQL 类似,可以通过建立多个表存储知识图谱知识内容。PostgreSQL 支持更复杂数据类型和索引,使得更为灵活数据建模成为可能。 2....用户可以方便地管理图数据库中不同实例,根据需要进行创建或删除操作。 11. 图元数据管理: JanusGraph提供了图元数据管理功能,用户可以定义图实例数据信息,包括点、边及其属性。

    16610

    【翻译】图解Janusgraph系列-索引详解(Janusgraph Index)

    如果是在同一事务中新增属性key所构成Index将会即刻生效,否则需要运行一个reindex proceudre同步索引数据,直到同步完成,否则索引不可用。...graph,'byNameComposite').call() mgmt.awaitGraphIndexStatus(graph,'byNameAndAgeComposite').call() //对已有数据重新索引...如果该属性Key已经被使用,需要执行reindex procedure保证索引中包含了所有数据,知道该过程执行完毕,否则不能使用。...本身支持排序返回,但排序中要使用property key需要提前被加到mix index中去,如果要排序property key不是index一部分,将会导致整个数据集合加载到内存。...如果数据类型浮点型,必须使用JanusGraphDecimal或Precision数据类型。

    78420

    JanusGraph -- 简介

    数据基本含义是以“图”这种数据结构存储和查询数据,而不是存储图片数据库。数据模型主要是以节点和关系(边)来体现,也可处理键值对。优点是快速解决复杂关系问题。...如果需要双向边,则通过两条相反方向单向边组成。JanusGraph不存在无向边。 Property Key:属性类型,比如“姓名”,“年龄”,“时间”等。...JanusGraph数据持久性、数据索引和客户端访问实现了强大模块化接口。...最小JanusGraph配置只需要指定一下JanusGraph后端存储系统,也就是持久化引擎。 如果JanusGraph支持高级图查询,就需要JanusGraph指定一个索引后端。...以上提到后端存储系统、索引后端、缓存、调优选项等都可以在JanusGraph配置文件中进行指定。默认情况下配置文件存放在JanusGraph_home/conf目录下。

    4.6K10

    Gremlin 图查询概述

    数据库基本概念 图形数据库是 NoSQL 数据一种类型,应用图形理论存储实体之间关系信息。最常见例子,就是社会网络中人与人之间关系。...所以,个人浅见,只有靠新硬件解决问题。更廉价大内存、NVRAM、RDMA高速网络、随机读写更强SSD磁盘、硬件事务支持CPU等。...与 Composite key 不同,Mixed Index 需要配置索引后端,JanusGraph 可以在一次安装中支持多个索引后端。...Vertex-centric index 可以通过使用本地索引结构加速遍历效率。 举例: 下面的查询中,如果对 'battled' 类型边属性 'rating' 建立了属性,则是可以利用上索引。...JanusGraph 缺陷 由上面的存储和查询也可以看到,基于 Hbase属性图下面几个明显缺陷: 顶点属性和边存储在一行中,当点出入度越大时,属性查询耗时将会越大; 更新边某一个属性时,需要先获取整个边数据

    4K10

    图解图库JanusGraph系列-janusgraph数据本地源码编译教程(janusgraph source code compile)

    源码图库-一文搞定janusgraph数据本地源码编译(janusgraph source code compile) 大家好,我是洋仔,JanusGraph图解系列文章,实时更新~ 图数据库文章总目录...本机安装hbase环境,这里我后台存储使用是 hbase,这里为了更好符合正常使用情况,没有用janusgraph自带inmemory存储形式 ps:如果你在其他服务器hbase和es环境...,下面默认使用是本地hbase和es 如果需要配置远程hbase和es注意修改对应ip,修改后如下: gremlin.graph=org.janusgraph.core.JanusGraphFactory...GraphOfTheGodsFactory.load(graph)注释掉,不需要重新load这个测试图!...底层存储使用berkeleyje数据库和es索引后端 我们只需要将上述单测代码中配置文件路径配置文件修改为相同位置下janusgraph-berkeleyje-es.properties即可,将对应配置注释去掉

    50820

    属性图数据JanusGraph初探

    属性图例子如果下图所示。 图形数据库是NoSQL数据一种类型,应用图形理论存储实体之间关系信息。最常见例子,就是社会网络中人与人之间关系。...一旦实现,就可在系统中是Gremlin遍历语言。然而图系统提供者还可以特定TraversalStrategy优化策略,允许系统在执行Gremlin查询时对其进行优化(例如索引查询,步骤重排序)。...如果使图系统具有处理功能(OLAP),则需要实现GraphComputer API,定义了消息或遍历器是如何在工作者(线程或机器)之间进行交互和传递。...此外,JanusGraph依赖hadoop做图统计和批量图操作。JanusGraph数据存储,索引和客户端访问实现了粗粒度模块接口。...为此每导入一个顶点数据都会执行如下逻辑:获取要导入顶点id值,查询图中是否某个顶点bulkLoader.vertex.id值等于id值如果等于,则使用要插入值,更新该图中已存在顶点属性;如果不存在

    3.6K50

    源码图库-一文搞定janusgraph数据本地源码编译(source code compile)

    一 本地安装依赖环境 本机安装hbase环境,这里我后台存储使用是 hbase,这里为了更好符合正常使用情况,没有用janusgraph自带inmemory存储形式 ps:如果你在其他服务器...将下面的代码注释删除掉,并删除JANUSGRAPHCFG字段和对应大括号,下面默认使用是本地hbase和es 如果需要配置远程hbase和es注意修改对应ip,修改后如下: gremlin.graph...下载janusgraph源码到本地编译器 方式一: 使用git的话,可以直接使用git clone从janusgraphgithub仓库clone一份远程代码到本地 janusgraph github...GraphOfTheGodsFactory.load(graph)注释掉,不需要重新load这个测试图!...底层存储使用berkeleyje数据库和es索引后端 我们只需要将上述单测代码中配置文件路径配置文件修改为相同位置下janusgraph-berkeleyje-es.properties即可,将对应配置注释去掉

    1.1K20

    优化表(二)

    如果表从来不打算填充数据,但用于其他目的(如查询联接),则可能需要这样做。...只有在字段已编制索引,字段是索引第一个字段,并且字段和索引具有相同排序规则类型情况下,优化表才能完全确定该字段所有值是否相同。...如果已知未编制索引字段具有在测试100,000条随机选择记录中可能检测不到其他值,则应手动设置选择性和离群值选择性。...在Studio中,可以在“新建属性向导”“属性参数”页上设置CALCSELECTIVITY,也可以在检查器中属性参数列表中设置CALCSELECTIVITY(可能需要收缩并重新展开属性参数列表才能显示...此字段中值是系统定义,不可修改。它们包括以下内容: RowID字段:一个表一个RowID,由系统定义。名称通常是ID,但可以不同系统分配名称。

    1.8K20

    数据库深度探索」图型数据JanusGraph支持知识图谱和图型分析

    我这么说意思是,实现了自己存储引擎、索引、服务器组件、网络协议和查询语言。 另一方面,JanusGraph在这些方面的大部分都依赖于第三方项目。...对于想要在生产环境中部署JanusGraph的人,您有什么建议FH:我已经提到JanusGraph使用几个不同组件创建图形数据库,提供了丰富功能,比如索引和存储引擎。...例如,FoundationDB看起来非常有前途,因为完全专注于实现一个可伸缩存储引擎,提供具有ACID属性事务,而其他层可以添加丰富数据模型或高级索引功能等特性。...如果可能的话,应该使用真实数据完成,并且评估应该包括建模实际用例查询。确实没有其他方法可以确保您模式实际上很好地适合您用例,并且在生产后期更改模式要比进行初始评估花费更多时间。...所以,你可以选择一个你已经了解或感兴趣领域做贡献。 如果有人兴趣为JanusGraph做贡献,但需要一些指导才能开始,那么当然总是可以问我或其他积极贡献者,我们非常乐意帮助。

    2.4K20
    领券