如果Janusgraph有大约70G的数据，它大约需要多长时间来重新编制索引

JanusGraph是一个分布式图数据库系统，用于存储和管理大规模的图数据。它基于Apache TinkerPop和Apache Cassandra或Apache HBase构建。重新编制索引是指对现有数据进行重新构建索引，以提高查询效率和性能。

重新编制索引的时间取决于多个因素，包括硬件配置、网络速度、数据分布和索引算法等。由于你没有提供具体的硬件配置和其他细节，无法准确给出时间估计。

然而，一般情况下，重新编制索引的时间可能会比较长。对于大约70GB的数据，可能需要数小时甚至数天的时间来完成重新编制索引的过程。具体时间还取决于你使用的JanusGraph版本、集群规模和负载情况等。

在重新编制索引期间，可能会对系统性能产生一定影响，因此建议在低峰期或者备份数据后再进行该操作。同时，为了提高索引重建的效率，可以考虑增加集群规模、优化硬件配置和调整相关参数。

关于JanusGraph的更多信息和腾讯云的相关产品，你可以参考以下链接：

JanusGraph官方网站：https://janusgraph.org/
腾讯云图数据库TGraph：https://cloud.tencent.com/product/tgraph
腾讯云数据库TDSQL（支持JanusGraph）：https://cloud.tencent.com/product/tdsql

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

在 Spark 数据导入中的一些实践细节

排查 Spark 集群是否存在冲突的包。 Spark 启动时使用配置文件和 sst.generator 快乐地导入。数据校验。 3.2 一些细节批量导入前推荐先建立索引。...推荐用 int 型节点 ID（可以使用 Snowflake算法等），如果节点的 ID 不是 int 型，这里可以通过在节点/边中加入 policy: "uuid" 来设置自动生成 uuid。...如果使用的是单独的 Spark 集群可能不会出现 Spark 集群有冲突包的问题，该问题主要是 sst.generator 中存在可能和 Spark 环境内的其他包产生冲突，解决方法是 shade 掉这些冲突的包...3.3 导入结果十亿级别节点（属性较少），百亿级别边（有向，无属性或带权值），提前建好索引的情况下大约消耗 20 小时左右导入全图。...重新修改，提交 PR #2258，通过。经过这次 PR 我也学到了很多。

1.5K2 0

Windows文件搜索引擎：Everything

您在搜索框输入的关键词将会筛选显示的文件和文件夹。 "Everything" 索引全部文件需要多长时间？ "Everything" 仅索引文件和文件夹名，一般仅需几秒便可建立其数据库。...全新安装的 Windows 10 (大约 120,000 个文件) 仅需 1 秒即可索引完成。索引 1,000,000 个文件将需要大约 1 分钟。 "Everything" 能否搜索文件内容？...不，"Everything" 仅需要使用非常少的系统资源。全新安装的 Windows 10 (大约 120,000 个文件) 仅需要大约 14 MB 的内存以及不到 9 MB 的硬盘空间。...1,000,000 个文件需要大约 75 MB 的内存和 45 MB 的硬盘空间。 "Everything" 能否监控文件系统变更？可以，"Everything" 可以监控文件系统变更。...不会，"Everything" 在关闭和重新打开中不会丢失文件系统变更 (甚至系统重启也不会)。 "Everything" 将在启动后更新数据库。 "Everything" 的系统要求是什么？

1.4K1 0

JanusGraph配置

JanusGraph配置文件指定来JanusGraph需要使用哪些组件，控制JanusGraph部署的各种操作，以及提供许多的配置项来调整JanusGraph集群的性能。...如果需要高级图查询支持（例如全文搜索，地理搜索或范围查询），则必须配置后端索引。有关详细信息，请参见第IV部分“后端索引”。如果需要考虑查询性能，则应启用缓存。...2.1.3 Short Codes 如果之前已配置好JanusGraph集群或者只需要配置后端存储，则JanusGraphFactory可以接受以冒号分隔的后端存储的名称和主机名或目录的字符串这样的参数...连接和使用JanusGraph数据库有两种基本模式：可以在客户端程序中嵌入JanusGraph来调用JanusGraph。...更改离线配置项更改配置项不会影响正在运行的实例，仅适用于新启动的实例。更改GLOBAL_OFFLINE配置项需要重新启动集群，以使更改立即对所有实例生效。

2.4K4 0

系统设计：Twitter搜索服务

如果我们计划未来五年，我们将需要以下存储： 120GB * 365days * 5years ~= 200TB 如果我们不想在任何时候都超过80%的存储空间，我们大约需要250TB的总存储空间。...如果我们假设一台现代服务器可以存储多达4TB的数据，我们将需要125台这样的服务器来保存未来五年所需的所有数据。让我们从一个简单的设计开始，我们将tweet存储在一个MySQL数据库中。...如果我们想为所有的英语单词和一些著名的名词（如人名、城市名等）建立一个索引，如果我们假设我们有大约30万个英语单词和20万个名词，那么我们的索引中总共有50万个单词。...假设每条推文中平均有40个单词，由于我们不会为介词和其他小词（如“the”、“an”、“and”等）编制索引，我们假设每条推文中大约有15个单词需要编制索引。...因此，我们需要存储索引的总内存： (1460 * 15) + 2.5MB ~= 21 TB 假设一台高端服务器有144GB内存，我们需要152台这样的服务器来保存索引。

5.2K40 0

放弃ElasticSearch，GitHub从零打造搜索引擎！2亿代码仓库怎么搜？

为了回答这个问题，可以先计算一下用ripgrep对115TB的代码进行匹配需要多长时间。...将索引建模为树，并使用差分编码（delta encoding）来减少crawling的数量并优化索引中的元数据，其中元数据包括文档出现的位置列表（哪个path、分支和代码库）以及关于这些对象的信息（代码库名称...GitHub的ingest pipeline每秒可以发布大约12万个文档，因此全部处理完155亿个文档需要大约36个小时；但是增量索引（delta indexing）可以降低所需抓取的文档数量的50%以上...，使得整个过程可以在大约18小时内重新索引整个语料库。...而索引本身只有25TB，其中不仅包括所有索引(含ngram) ，还包括所有唯一内容的压缩副本，这也意味着包括内容在内的总索引大小大约只有原始数据大小的四分之一！

6442 0

JanusGraph之Cache

Index Cache（索引缓存）：缓存索引查询的结果，以便随后的索引调用可以从内存中提供，而不是调用索引后端和（通常）等待一个或多个网络往返。...如果元素过期，则将在下次访问时从存储后端重新读取数据。如果只有一个JanusGraph实例访问存储后端，或者如果此实例是修改图形的唯一实例，则可以将缓存过期设置为0，从而禁用缓存过期。...如果有多个JanusGraph实例访问存储后端，则应将时间设置为另一个 JanusGraph实例修改图形和此JanusGraph实例查看数据之间允许的最大时间。 3.2....这将导致JanusGraph在下次访问时刷新存储后端的顶点数据并重新填充缓存。...如果JanusGraph在本地运行或对存储后端运行，以保证修改立即可见，则可以将此值设置为0 Storage Backend Caching（存储后端缓存）每个存储后端都维护着自己的数据缓存层。

1K1 0

【翻译】图解Janusgraph系列-缓存（Janusgraph Caching）

/](https://liyangyang.blog.csdn.net/) 1 Caching JanusGraph采用多层数据缓存来促进快速图形遍历。...如果同一个索引调用在同一个事务中永远不会发生两次，则索引缓存没有区别。索引高速缓存中的每个条目的权重等于，2 + result set size并且高速缓存的总权重不会超过事务高速缓存大小的一半。...3.1 缓存到期时间性能和查询行为最重要的设置是通过配置的缓存过期时间cache.db-cache-time。缓存将保存图形元素最多几毫秒。如果元素到期，则在下次访问时将从存储后端重新读取数据。...如果有多个JanusGraph实例访问存储后端，则应将时间设置为修改图形的另一个 JanusGraph实例与查看数据的JanusGraph实例之间允许的最长时间。...这将导致JanusGraph在下次访问时从存储后端刷新顶点数据并重新填充缓存。但是，当存储后端最终一致时，触发驱逐的修改可能尚不可见。

8642 0

图解图库JanusGraph系列-解惑图数据库，你知道什么是图数据库吗？

，上述过程我们需要从接口入参获取小李的各种信息通过小李的各种信息去表中查询出对应数据再根据查出的一度用户去表中查询二度用户，那如果要查多度呢，如果想要获取用户的其他信息呢，就要join，多表join...而图模型固有的数据索引结构，使得它的数据查询与分析速度更快。...如果要JanusGraph支持高级的图查询，就需要为JanusGraph指定一个索引后端。若果要提升JanusGraph的查询性能，就必须为JanusGraph指定缓存，指定性能调优的选项。...以上提到的后端存储系统、索引后端、缓存、调优选项等都可以在JanusGraph的配置文件中进行指定。默认情况下它的配置文件存放在JanusGraph_home/conf目录下。...图实例，通过操作该图实例来对图数据库进行操作总结本文介绍了，为什么需要图数据库，图数据库的基础理论，市场上存在的流行的图数据库并依照janusgraph图数据库来展开讲解一下图数据库相关知识等。

2.5K4 0

解惑图数据库！你知道什么是图数据库吗？

而图模型固有的数据索引结构，使得它的数据查询与分析速度更快。...如果需要双向边，则通过两条相反方向的单向边组成。JanusGraph不存在无向边。 Property Key：属性的类型，比如“姓名”，“年龄”，“时间”等。...如果要JanusGraph支持高级的图查询，就需要为JanusGraph指定一个索引后端。若果要提升JanusGraph的查询性能，就必须为JanusGraph指定缓存，指定性能调优的选项。...以上提到的后端存储系统、索引后端、缓存、调优选项等都可以在JanusGraph的配置文件中进行指定。默认情况下它的配置文件存放在JanusGraph_home/conf目录下。...图实例，通过操作该图实例来对图数据库进行操作总结本文介绍了，为什么需要图数据库，图数据库的基础理论，市场上存在的流行的图数据库并依照janusgraph图数据库来展开讲解一下图数据库相关知识等。

4.7K27 0

百亿级图数据JanusGraph迁移之旅

社区里面建议是维持 name 索引到顶点id的一个 map 存放到内存中，我们没试过，主要感觉有两方面问题，第一20亿点的需要不少内存，其次因为我们顶点是批量插入的，构建这个 map 不是很方便，于是就放弃了这个方案...其实最开始想到的就是这个方案，但是这个方案对导入的数据有非常严格的要求，它需要每个顶点一行数据，再把这个顶点关联的所有边都关联到这一行，中间用 tab 分隔，第一部分是顶点的属性，第二部分是顶点的入边，...最痛苦的还是这种 bulkLoader 导入方式如果过程中出现问题，失败了，只能将数据清理掉重新导入。...这就导致一个问题，我们是有 Spark on Yarn 环境的并且集群性能和资源都很好。现在利用不上这部分资源需要重新申请机器再搭建一个 standalone cluster 的 Spark 集群。...4.JanusGraph 查询优化本来以为经历完漫长的数据导入过程，后面会顺利很多，但是现实和期望还是有差距。问题是 JanusGraph 在大数据量情况下，查询性能达不到生产要求，查询需要几十秒。

2.6K5 0

JanusGraph图数据库的应用以及知识图谱技术介绍

微软使用 JanusGraph 来构建其推荐系统。美国国家航空航天局 (NASA) 使用 JanusGraph 来构建其知识图谱。谷歌使用 JanusGraph 来进行机器学习和数据挖掘。...参考文档：JanusGraph 架构概览 JanusGraph 架构可以利用分布式技术和横向扩展能力实现高性能的图数据库操作。它专注于紧凑的图序列化、丰富的图数据建模和高效的查询执行。...这些存储适配器允许在需要时横向扩展存储层，以处理不断增长的数据量。索引适配器： JanusGraph 支持多个索引适配器，如 Elasticsearch、Apache Solr 等。...数据建模： PostgreSQL 与 MySQL 类似，可以通过建立多个表来存储知识图谱的知识内容。PostgreSQL 支持更复杂的数据类型和索引，使得更为灵活的数据建模成为可能。 2....用户可以方便地管理图数据库中的不同实例，根据需要进行创建或删除操作。 11. 图元数据管理： JanusGraph提供了图元数据管理功能，用户可以定义图实例的元数据信息，包括点、边及其属性。

1661 0

【翻译】图解Janusgraph系列-索引详解（Janusgraph Index）

如果是在同一事务中新增的属性key所构成Index将会即刻生效，否则需要运行一个reindex proceudre来同步索引和数据，直到同步完成，否则索引不可用。...graph,'byNameComposite').call() mgmt.awaitGraphIndexStatus(graph,'byNameAndAgeComposite').call() //对已有数据重新索引...如果该属性Key已经被使用，需要执行reindex procedure来保证索引中包含了所有数据，知道该过程执行完毕，否则不能使用。...本身支持排序返回，但排序中要使用的property key需要提前被加到mix index中去，如果要排序的property key不是index的一部分，将会导致整个数据集合加载到内存。...如果数据类型浮点型，必须使用JanusGraph的Decimal或Precision数据类型。

7842 0

JanusGraph -- 简介

图数据库的基本含义是以“图”这种数据结构存储和查询数据，而不是存储图片的数据库。它的数据模型主要是以节点和关系（边）来体现，也可处理键值对。它的优点是快速解决复杂的关系问题。...如果需要双向边，则通过两条相反方向的单向边组成。JanusGraph不存在无向边。 Property Key：属性的类型，比如“姓名”，“年龄”，“时间”等。...JanusGraph为数据持久性、数据索引和客户端访问实现了强大的模块化接口。...最小的JanusGraph配置只需要指定一下JanusGraph的后端存储系统，也就是它的持久化引擎。如果要JanusGraph支持高级的图查询，就需要为JanusGraph指定一个索引后端。...以上提到的后端存储系统、索引后端、缓存、调优选项等都可以在JanusGraph的配置文件中进行指定。默认情况下它的配置文件存放在JanusGraph_home/conf目录下。

4.6K1 0

JanusGraph-配置(第四章)--英文翻译

Configuration JanusGraph数据库集群通常包含一个或多个JanusGraph实例. 运行实例需要提供JanusGraph的配置参数....Part III, “Storage Backends” 列出了全部支持的存储后台, 如何配置参数. 如果需要支持图的高级检索(例如:全文检索, 地理位置检索, 和范围检索) 需要配置索引后台....如果性能是主要考虑方面, 需要打开缓存功能....连接和使用JanusGraph数据库, 有两种方法: 1. 客户端程序提供执行线程, 在客户端程序中调用JanusGraph 2....JanusGraph提供开箱即用的配置, 能够JanusGraph Server快速启动, 这些配置可以被修改, 来调整服务器的性能. 配置JanusGraph Server需要通过.

1.2K1 0

Gremlin 图查询概述

图数据库基本概念图形数据库是 NoSQL 数据库的一种类型，它应用图形理论存储实体之间的关系信息。最常见的例子，就是社会网络中人与人之间的关系。...所以，个人浅见，只有靠新硬件来解决问题。更廉价的大内存、NVRAM、RDMA高速网络、随机读写更强的SSD磁盘、有硬件事务支持的CPU等。...与 Composite key 不同，Mixed Index 需要配置索引后端，JanusGraph 可以在一次安装中支持多个索引后端。...Vertex-centric index 可以通过使用本地索引结构加速遍历效率。举例：下面的查询中，如果对 'battled' 类型的边属性 'rating' 建立了属性，则是可以利用上索引的。...JanusGraph 的缺陷由上面的存储和查询也可以看到，基于 Hbase的属性图有下面几个明显的缺陷：顶点属性和边存储在一行中，当点的出入度越大时，属性查询耗时将会越大；更新边某一个属性时，需要先获取整个边的数据

4K1 0

图解图库JanusGraph系列-janusgraph图数据库的本地源码编译教程（janusgraph source code compile）

源码图库-一文搞定janusgraph图数据库的本地源码编译（janusgraph source code compile）大家好，我是洋仔，JanusGraph图解系列文章，实时更新~ 图数据库文章总目录...本机安装hbase环境，这里我后台存储使用的是 hbase，这里为了更好的符合正常的使用情况，没有用janusgraph自带的inmemory存储形式 ps：如果你在其他服务器有hbase和es环境...，下面默认使用的是本地的hbase和es 如果你需要配置远程的hbase和es注意修改对应的ip，修改后如下： gremlin.graph=org.janusgraph.core.JanusGraphFactory...GraphOfTheGodsFactory.load(graph)注释掉，不需要重新load这个测试图！...底层存储使用berkeleyje数据库和es索引后端我们只需要将上述单测代码中的配置文件路径配置文件修改为相同位置下的janusgraph-berkeleyje-es.properties即可，将对应配置的注释去掉

5082 0

属性图数据库JanusGraph初探

属性图的例子如果下图所示。图形数据库是NoSQL数据库的一种类型，它应用图形理论存储实体之间的关系信息。最常见的例子，就是社会网络中人与人之间的关系。...一旦实现，就可在系统中是有Gremlin遍历语言。然而图系统的提供者还可以特定的TraversalStrategy优化策略，允许系统在执行Gremlin查询时对其进行优化（例如索引查询，步骤重排序）。...如果使图系统具有处理功能（OLAP），则需要实现GraphComputer API，它定义了消息或遍历器是如何在工作者（线程或机器）之间进行交互和传递的。...此外，JanusGraph依赖hadoop来做图的统计和批量图操作。JanusGraph为数据存储，索引和客户端访问实现了粗粒度的模块接口。...为此每导入一个顶点数据都会执行如下逻辑：获取要导入顶点的id值，查询图中是否有某个顶点的bulkLoader.vertex.id值等于id值的，如果等于，则使用要插入的值，更新该图中已存在的顶点属性；如果不存在

3.6K5 0

源码图库-一文搞定janusgraph图数据库的本地源码编译（source code compile）

一本地安装依赖环境本机安装hbase环境，这里我后台存储使用的是 hbase，这里为了更好的符合正常的使用情况，没有用janusgraph自带的inmemory存储形式 ps：如果你在其他服务器有...将下面的代码注释删除掉，并删除JANUSGRAPHCFG字段和对应的大括号，下面默认使用的是本地的hbase和es 如果你需要配置远程的hbase和es注意修改对应的ip，修改后如下： gremlin.graph...下载janusgraph的源码到本地编译器方式一：使用git的话，可以直接使用git clone从janusgraph的github仓库来clone一份远程代码到本地 janusgraph 的 github...GraphOfTheGodsFactory.load(graph)注释掉，不需要重新load这个测试图！...底层存储使用berkeleyje数据库和es索引后端我们只需要将上述单测代码中的配置文件路径配置文件修改为相同位置下的janusgraph-berkeleyje-es.properties即可，将对应配置的注释去掉

1.1K2 0

优化表（二）

如果表从来不打算填充数据，但用于其他目的(如查询联接)，则可能需要这样做。...只有在字段已编制索引，字段是索引的第一个字段，并且字段和索引具有相同的排序规则类型的情况下，优化表才能完全确定该字段的所有值是否相同。...如果已知未编制索引的字段具有在测试100,000条随机选择的记录中可能检测不到的其他值，则应手动设置选择性和离群值选择性。...在Studio中，可以在“新建属性向导”的“属性参数”页上设置CALCSELECTIVITY，也可以在检查器中的属性参数列表中设置CALCSELECTIVITY(可能需要收缩并重新展开属性参数列表才能显示它...此字段中的值是系统定义的，不可修改。它们包括以下内容： RowID字段：一个表有一个RowID，由系统定义。它的名称通常是ID，但可以有不同的系统分配的名称。

1.8K2 0

「数据库深度探索」图型数据库JanusGraph支持知识图谱和图型分析

我这么说的意思是，它实现了自己的存储引擎、索引、服务器组件、网络协议和查询语言。另一方面，JanusGraph在这些方面的大部分都依赖于第三方项目。...对于想要在生产环境中部署JanusGraph的人，您有什么建议FH:我已经提到JanusGraph使用几个不同的组件来创建图形数据库，它提供了丰富的功能，比如索引和存储引擎。...例如，FoundationDB看起来非常有前途，因为它完全专注于实现一个可伸缩的存储引擎，提供具有ACID属性的事务，而其他层可以添加丰富的数据模型或高级索引功能等特性。...如果可能的话，应该使用真实的数据来完成，并且评估应该包括建模实际用例的查询。确实没有其他方法可以确保您的模式实际上很好地适合您的用例，并且在生产后期更改模式要比进行初始评估花费更多的时间。...所以，你可以选择一个你已经了解或感兴趣的领域来做贡献。如果有人有兴趣为JanusGraph做贡献，但需要一些指导才能开始，那么当然总是可以问我或其他积极贡献者，我们非常乐意帮助。

2.4K2 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云