首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

初识PB级数据分析利器Prestodb

初始PB级数据分析利器Prestodb 什么是prestodb prestodb整体架构 物理执行计划 什么是prestodb prestodb,是facebook开源的一款sql on hadoop系统...目前在国内,有京东、美团、同城以及滴滴等公司对prestodb有深度使用,在国外,除facebook外,还有uber等公司对prestodb有深度使用,而teradata公司则在维护独立的分支,并将其作为自己的主打的即系查询产品的后台...本文介绍prestodb,先主要介绍presto的架构和查询原理,presto的搭建比较简单,大家可以参考官网的文章进行操作。 prestodb整体架构 ?...如上图所示,prestodb主要由一个coordinator和多个worker组成,coordinaor节点负责和client对接,接收client发送过来的各类请求(DDL和DML)。

2.6K50

医疗在线OLAP场景下基于Apache Hudi 模式演变的改造与应用

on Spark的支持(Spark3以上,用于离线分析场景),Presto(用于在线OLAP场景)及Apache Hive(Hudi的bundle包)的支持,在正式发布版本中(Hudi 0.12.1, PrestoDB...由于Presto分为两个分支(Trino和PrestoDB),其中PrestoDB的正式版本已经支持快照查询模式,而Trino主线还不存在这个功能,所以优先考虑在PrestoDB上实现,我们基于Trino...计划基于Prestodb的Presto-Hudi模块改造,设计自 RFC-44: Hudi Connector for Presto。...PrestoDB对Hudi支持的情况 PrestoDB版本主线分支支持Hudi连接器,本身没有按列位置获取列值的功能,所以没有串列问题,并且支持快照查询模式。...的requestedSchema,改变HudiParquetPageSources的getDescriptors和getColumnIO等方法逻辑的结果 实现为 https://github.com/prestodb

1K10
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Presto 分布式SQL查询引擎及原理分析

    数据源内的 default 库,可切换; Presto 采用 Connector 对接第三方数据源,一个 Connector 便能提供一种新的 catalog Presto中文使用手册:http://prestodb.jd.com...Presto 发行版 Presto 到目前为止 Presto 有两大分支: PrestoDB 和 PrestoSQL。两个发行版都满足基本功能,只是在技术细节有细微差别。...PrestoDB: 根红苗正,有大厂支持; PrestoSQL: Prestodb 之父的原班人马支持,社区更活跃; 在贸易战战火未消退的当下,也有很多企业关注License,两者都是 Apache V2...但是PrestoDB由 Facebook、Twitter等共同成立的基金会控制,PrestoSQL 是由新成立的Presto开源基金会管理,因此 PrestoSQL 也许更能符合国内企业选择。

    4.8K21
    领券