首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

图数据库和知识图谱在微财风控系统中的探索和应用

传统的关系型数据库在这种复杂的关系网络上发挥的效果越发有限,在多维度的查询上很难在合理的时间内返回结果。...二、微财实践过程中遇到的一些问题 前期数据如何制备及入库,实现冷启动 对于图数据库的构建,离线基础数据的导入是前提,在 Hive 中我们存有 4T 左右的数据需要导入, 如此大的数据量,制备成需要的格式数据导入比较困难...解决方案: 针对海量数据制备导入,JanusGraph 提供了 bulk loading 方式导入,但是基于 Hadoop 支持三种导入数据的格式: GryoInputFormat/GraphSONInputFormat...我们选中的是 GraphSON 格式,这种数据格式与 Json 较为类似,方便理解转换,但是也有一定的区别。...GraphSON 格式数据,最后使用 bulk loading 方式导入。

62120

属性图数据库JanusGraph初探

:在多机器集群并行处理图的系统; VertexProgram:通过消息传递进行通信,用逻辑并行的方式在所有点上执行的代码; MapReduce:并行的分析图中所有的点,对结果进行归约的计算。...一旦实现,Gremlin遍历可以在图数据库(OLTP)和图处理器(OLAP)上执行。然而,Gremlin语言是基于图的领域特定语言,根据点和边来解释图。用户也可以创建自己的领域特定语言。...图数据库 JanusGraph是一个可扩展的图数据库,可以把包含数千亿个顶点和边的图存储在多机集群上。...(graph) 使用OneTimeBulkLoader批量导入,导入完成后hbase中又会多出3行数据(json文件中数据已经被到入成功了)。...).get() OneTimeBulkLoader:一次批量导入数据,不会保存源图(此案例是json)中的id,导入数据不会开启事务。

3.6K50
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    【翻译】图解Janusgraph系列-查询谓词和数据类型(Janusgraph Search Predicates and Data Types)

    在 全局图搜索和局部遍历 中支持的所有谓词。...boolean和uuid仅支持neq和eq 2 文本谓词 Text枚举指定用于查询匹配文本或字符串值的搜索操作符。两种类型谓词区别: 文本搜索谓词在文本字符串被标记化后与文本字符串中的单个单词匹配。...### 23.4 查询示例 4 查询示例 以下查询示例演示了教程上的一些谓词: // 1)获取name属性为“hercules”的节点 g.V().has("name", "hercules") /...)支持 可以存储在JanusGraph中的 任何数据类型, 但混合索引(mixed indexes )仅限于以下数据类型。...请注意, 与JanusGraph API不同,GeoJSON将坐标指定为lng lat。 7 集合 如果您使用的是Elasticsearch,则可以对SET和LIST类型的属性进行索引。

    67630

    JanusGraph -- 查询谓词和数据类型(janusgraph Search predicates and data types)

    文章列出了JanusGraph在 全局图搜索和局部遍历 中支持的所有谓词。...两种类型谓词区别: 文本搜索谓词在文本字符串被标记化后与文本字符串中的单个单词匹配。这些谓词不区分大小写。...### 23.4 查询示例 26.4 查询示例 以下查询示例演示了教程上的一些谓词: // 1)获取name属性为“hercules”的节点 g.V().has("name", "hercules...indexes)支持 可以存储在JanusGraph中的 任何数据类型, 但混合索引(mixed indexes )仅限于以下数据类型。...请注意, 与JanusGraph API不同,GeoJSON将坐标指定为lng lat。 26.7 集合 如果您使用的是Elasticsearch,则可以对SET和LIST类型的属性进行索引。

    1.2K21

    百亿级图数据JanusGraph迁移之旅

    为了加快导入的速度我们的插入程序是用Spark 编写的,导入数据存放在 HDFS 集群上。...数据导入过程 接下来就是按需要的格式生成导入数据,这中间有个值得注意的地方就是确保顶点 ID 的唯一性,确保数据没有重复,不然会导入失败。...最痛苦的还是这种 bulkLoader 导入方式如果过程中出现问题,失败了,只能将数据清理掉重新导入。...下列参数就是导入过程中和 Hbase 相关的参数,这些参数都是从一次次失败中提炼总结出来的。...4.JanusGraph 查询优化 本来以为经历完漫长的数据导入过程,后面会顺利很多,但是现实和期望还是有差距。问题是 JanusGraph 在大数据量情况下,查询性能达不到生产要求,查询需要几十秒。

    2.8K50

    360 数科实践:JanusGraph 到 NebulaGraph 迁移

    摘要:在本文中 360 数科的周鹏详细讲解了业务从 JanusGraph 迁移到 Nebula Graph 带来的性能提升,在机器资源不到之前 JanusGraph 配置三分之一的情况下,业务性能提升至少...,并且平均耗时也基本在 500ms 左右就能搞定,性能提升至少 20 倍以上 :) [cat 耗时监控] 就冲上面的这些数据,如果你还在用 JanusGraph,就应该立马把这篇文章转发给你的领导,并立个项开始迁移到...这里有个可分享经验,当时使用 Spark 导入工具采用异步方式导入导致了不少 error,稍微改下导入方式换成同步写入就没问题了。...查询调优 我们现在生产环境 Nebula Graph 用的是 1.0 的版本,生产环境上 ID 生产我们用的是 hash 函数, uuid 导入数据会很慢,后面官方也不会再支持 uuid。...之前在查询 JanusGraph 的 Gremlin 语句上加各种 limit 限制都没能很好的解决这个问题,在 Nebula Graph 有了这个 max_edge_returned_per_vertex

    97550

    在 Spark 数据导入中的一些实践细节

    即使 JanusGraph 在 OLAP 上面非常出色,对 OLTP 也有一定的支持,但是 GraphFrame 等也足以支撑其 OLAP 需求,更何况在 Spark 3.0 会提供 Cypher 支持的情况下...之前在各类调研、部署后,特别是从 JanusGraph 的 OLTP 效率最终测试发现无法满足线上需求之后,我们不再对同一图谱可以同时进行 OLAP 和 OLTP 进行强制性要求,而 Nebula Graph...服务的高可用(即在非人为情况下,图谱可以稳定提供服务)——局部失败服务可用、有快照机制 保证可扩展性——支持线性扩容,由于开源、支持二次开发 综上所述,Nebula Graph 架构上符合实际生产需求...带来的问题就是在批量导入结点时相对较慢。...通过看源码发现 SparkClientGenerator.scala 存在 BUG,读取的是配置文件的位置而非 parquet/json 文件的位置,修复后提了我第一个 PR#2187,有幸通过 后续发现使用

    1.5K20

    图解Janusgraph系列-并发安全:Lock锁机制(本地锁+分布式锁)分析

    下面我们来分析一下JanusGraph的锁机制实现~ 二:JanusGraph锁机制 在JanusGraph中使用的锁机制是:本地锁 + 分布式锁来实现的; 2.1 一致性行为 在JanusGraph...{ DEFAULT, LOCK, FORK } 源码中ConsistencyModifier枚举类主要作用:用于控制JanusGraph在最终一致或其他非事务性后端系统上的一致性行为...抛出到顶层的mutator.commitStorage()处,最终导入失败进行事务回滚等操作 checkSeniority(kc, ls, unexpiredTRs);...支持在数据导入时通过前面一致性行为部分所说的LOCK来开关分布式锁: LOCK:数据导入时开启分布式锁保证分布式一致性 DEFAULT、FORK:数据导入时关闭分布式锁 是否开启分布式锁思考: 在开启分布式锁的情况下...我们在不开启分布式锁定的情况下,可以通过针对于导入的数据的充分探查来减少冲突!

    53620

    2018-11-23 graph图数据库概览,经过一个星期的Demo终于看懂了这篇文章20180818图数据库概览

    2.图数据库组件 一个完善的图数据系统应该至少包括图存储及图处理引擎,数据导入导出,管理运维,查询和计算,商业化产品需要有高可用及容灾备份。...数据导入导出:数据从外界到图存储的导入导出能力,如从外界的json、csv,rdf等数据形式导入到图数据库中,或将图数据库中的数据导出来。...Neo4j在每个节点中存储了每个边的指针,因而遍历时效率相当高。 Neo4j分为社区版和企业版,社区版功能受限,另外其提供可视化的客户端感觉很不错。...Neo4J和OrientDB在插入数据时候都会默认建立索引,索引的不同也造成了其不同操作的性能差异; Neo4J:擅长遍历图及不存在大量关系的节点的图计算 OrientDB:侧重文档数据库,主要还是...SB树索引导致,空间浪费比较大;插入节点与neo4j差不多,但是在插入节点关系即边时无优化;在图论算法上性能高,但遍历性能低。

    3.6K30

    Atlas元数据存储模型分析

    导入导出模块支持元数据快速导入到atlas,以及将atlas检测到的元数据更改以事件方式通知到下游服务。图引擎是atlas的存储和计算推导基础,目前采用janusgraph实现。...在复合类型基础上构建起来的Atlas元数据类型,刻画了业务系统元数据的各个方面。...可以预见,atlas的所有数据最终都会转换成图存储中的顶点vertex、边edge和属性property三种元素。在腾讯内部的元数据系统中,janusgraph以hbase作为落地存储服务。...点切分即每个顶点转化为hbase的一行数据,顶点属性和关联此顶点的所有边均作为hbase的column存储在一行中。janusgraph正是采用了点分存储方式。...下面介绍打通存储链路的最后一环,Atlas元数据类型到Janusgraph存储的映射。 Atlas元数据存储模型 Atlas在图中存储的数据分两大类:类型定义的存储和元数据的存储。

    4.3K30

    【翻译】图解Janusgraph系列-事务详解(Janusgraph Transactions)

    它们可以在BerkeleyDB上进行这样的配置,但在Cassandra或HBase上通常不会这样,因为在这些地方,底层存储系统不提供可序列化的隔离或多行原子写入,并且模拟这些属性的成本会很高。...在TinkerPop的默认事务语义下,随着图形上的第一个操作自动创建事务,并使用commit()或rollback()显式的关闭事务。关闭事务后,与该事务关联的所有图形元素都将过时且不可用。...e.property("time", 99) // 只有上一步刷新过 接下来才可以使用 3 Transaction 失败 提交事务时,JanusGraph将尝试将所有更改保留到存储后端。...因此,交易可能会失败。事实上,在足够大的系统中,事务总会存在失败。...该用户名可能仍然在事务开始时可用,但是在提交事务时,另一个用户可能同时注册了“juno”,并且该事务保持对用户名的锁定,从而导致另一个事务失败。

    86730

    JanusGraph·server端配置启动和远程remote连接·多实例问题

    连接和使用JanusGraph数据库有两种基本模式: 1.嵌入式 补充自己的实验记录 2.当JanusGraph被启动时,JanusGraph打包了一个长期运行的服务器进程(JanusGraph...配置JanusGraph Server是通过位于JanusGraph发行版的./conf/gremlin-server目录中的JanusGraph Server yaml配置文件完成的。...(自动导入的 JanusGraph classes) so that 它们可以在远程提交的脚本中被引用....的路径 Gremlin 在gremlin-server没有启动(gremlin-console自然也无法通过:remote连接)的情况下,gremlin-console也能执行下面的语句 gremlin...] } } 这个配置文件可以配置多个host,用逗号隔开 连接一台host上的多实例,应该使用http类型的janus graph server, 然后直接通过 url +

    2.6K20

    JanusGraph服务

    默认情况下,远程连接是无会话的,这意味着在控制台中发送的每一行都被解释为单个请求。可以使用分号作为分隔符在一行上发送多个语句。或者,你可以通过在创建连接时指定会话来建立具有会话的控制台。...注意:如果您希望能够在每台服务器上使用相同的HMAC令牌,则在所有正在运行的JanusGraph服务器上应该是相同的。...基本上,Gremlin Server yaml文件指向特定的图配置文件,这些文件用于实例化它随后将使用的JanusGraph实例。...为了实例化这些Graph实例,Gremlin Server要求在其classpath上提供JanusGraph的相应库和依赖项。...“JanusGraph插件”将自动导入JanusGraph特定类,以便在脚本中使用。 请注意脚本键和脚本/ janusgraph.groovy的引用。

    2.3K50

    图数据库调研

    各自的特点: Cypher:只能在 Neo4j 上使用,但是社区版的Neo4j 只能跑在单机上,用 Gremlin 和 SPARQL 可以很容易地从某个数据库转到另外一个,但Cypher就不要想了。...年的排行榜,其继任者 JanusGraph 也在快速跟进中; 此外一些国内还有一些图开源项目,如 HugeGraph ,将在后面一部分介绍。...Neo4j创建的图是用顶点和边构建一个有向图,其查询语言cypher已经成为事实上的标准。 Neo4j 分为社区版和企业版,社区版只能工作在单机上,社区版免费 ,企业版收费 。...AWS和微软这两个竞争对手在云数据库的处理方法上截然不同的。...可以 JSON 格式导入、导出文档。 HugeGraph HugeGraph 是一款面向分析型,支持批量操作的图数据库系统,它能够与大数据平台无缝集成,有效解决海量图数据的存储、查询和关联分析需求。

    6.6K30

    图解图库JanusGraph系列-janusgraph图数据库的本地源码编译教程(janusgraph source code compile)

    安装hbase 并 启动 注意:在选择安装hbase的版本时,需要查看自己下载的janusgraph源码的版本支持hbase的什么版本 这里我们选择的是janusgraph-0.5.2版本,支持hbase...输入命令,回车elasticsearch.bat 输入完命令后,当前的黑框中会启动es,最终出现下述: 访问http://localhost:9200/,出现下述json即为成功!...下的这个文件: ps: 这里我用的是自己的绝对路径,其实这个文件是在janusgraph-dist模块下的一个文件,如下图: 将下面的代码注释删除掉,并删除JANUSGRAPHCFG字段和对应的大括号...添加相应依赖 我们在janusgrap-test模块编写自己的单测并运行,因为在janusgraph-test模块中使用的是inmory也就是内存作为存储后端的,没有对应的hbase和es依赖 而我们上述使用的是...注意: 单测中包含GraphOfTheGodsFactory.load(graph)代码,是将janusgraph自带的一个测试图导入到hbase中,供我们测试使用,首次运行单测成功后,我们要把这个语句

    54920

    源码图库-一文搞定janusgraph图数据库的本地源码编译(source code compile)

    安装hbase 并 启动 注意:在选择安装hbase的版本时,需要查看自己下载的janusgraph源码的版本支持hbase的什么版本 这里我们选择的是janusgraph-0.5.2版本,支持hbase...访问http://localhost:9200/,出现下述json即为成功!...下的这个文件: ps: 这里我用的是自己的绝对路径,其实这个文件是在janusgraph-dist模块下的一个文件,如下图: ?...添加相应依赖 我们在janusgrap-test模块编写自己的单测并运行,因为在janusgraph-test模块中使用的是inmory也就是内存作为存储后端的,没有对应的hbase和es依赖 而我们上述使用的是...注意: 单测中包含GraphOfTheGodsFactory.load(graph)代码,是将janusgraph自带的一个测试图导入到hbase中,供我们测试使用,首次运行单测成功后,我们要把这个语句

    1.1K20

    JanusGraph-配置(第四章)--英文翻译

    开启缓存和缓存的配置的详细内容在Chapter 11, JanusGraph Cache. 4.1 配置示例 以下示例展示了如何配置存储后台, 索引和性能组件. 这部分只是参数配置的一小部分....连接和使用JanusGraph数据库, 有两种方法: 1. 客户端程序提供执行线程, 在客户端程序中调用JanusGraph 2....图的定义是在配置文件中提供的, 上边的例子中, 图的配置文件是conf/janusgraph-berkeleyje.properties....插件启用了JanusGraph Gremlin插件, 这个插件能够自动导入JanusGraph的类, 远端提交的脚本可以参考这些类....如下步骤: 集群仅留一个实例 连接到该实例上 确保全部业务都关闭 确保没有新的业务被启动 打开管理API 修改配置参数 调用commit方法, commit方法会自动将实例停止 重启全部实例 查看全部配置参数

    1.2K10

    OPPO 图数据库平台建设及业务落地

    > JanusGraph > ArangoDB > OrientDB Nebula Graph不论是在导入还是在查询性能上都表现优异。...JanusGraph 性能看作 1,Nebula Graph 导入性能要比 JanusGraph 快一个数量级,查询性能是 JanusGraph 的 4-7 倍。...服务是由 nebula-metad 进程提供的,生产环境中,建议在 Nebula Graph 集群中部署3个 nebula-metad 进程。请将这些进程部署在不同的机器上以保证高可用。...4、图数据库平台建设 之前在使用 JanusGraph 的时候,遇到过导入缓慢、查询慢、高并发 OOM(JanusGraph 线程池采用无界队列导致)、FULL GC(业务 Gremlin 语句中包含...而且,Nebula Graph 比 JanusGraph 更稳定。在实践的过程中,也遇到过很多问题,得到了 Nebula Graph 社区非常多的帮助,十分感谢社区的支持!

    88330

    白嫖我常用的 11 个超火的前端必备在线工具,终于有时间上班摸鱼了

    大家好,我是你们的 猫哥,一个不喜欢吃鱼、又不喜欢喵 的超级猫 ~ 前言 猫哥是一个常年混迹在 GitHub 上的猫星人,所以发现了不少好的前端开源项目,在此分享给大家。...公众号:前端GitHub,专注于挖掘 GitHub 上优秀的前端开源项目,收集、整理、推荐业界高品质前端资源合集,优秀的工具、库、好的教程、了解业界更优秀的代码、工具、业界最新的技术,抹平你的前端信息不对称...平时如何发现好的开源项目,可以看看这篇文章:GitHub 上能挖矿的神仙技巧 - 如何发现优秀开源项目 ---- 以下为【前端GitHub】的第 9 期精华内容。...可以参考失败的测试,看看可以采取哪些措施来改进应用。...特性 GitHub gist 导入. 只需要在 url 后面加上 github gist id 就可以导入 定制化. 可定制图片的语法主题,窗口样式等 所见即分享.

    2K20
    领券