首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Apache Drill 专为Hadoop、NoSQL和云存储设计Schema-free类型SQL引擎

Apache Drill是一款开源数据探索工具,一个分布式SQL查询和分析引擎。它包含了很多专有的设计,来进行高性能分析,支持半结构化数据源(JSON、XML和日志等)和基于应用不断创新数据格式。...在此基础上,Drill不仅支持行业标准 ANSI SQL,做到开箱即用和快速上手,还支持大数据生态集成,如 Apache Hive 和 Apache Hbase 等存储系统,即插即用部署方式。...Apache Drill 关键特性 低延迟SQL查询。 直接对自描述数据进行动态查询而无需提前定义Schema,如 JSON、Parquet、TEXT 和 Hbase等。...)JSON 模型 image.png Drill是世界上第一个也是唯一一个不要求Schema分布式SQL引擎。...,非 “类SQLDrill支持标准SQL语法(SQL 2003)。

1.6K30
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Apache Zeppelin 中 JDBC通用 解释器

    驱动Apache Phoenix 本身是一个JDBC驱动Apache Drill - JDBC驱动Apache Tajo - JDBC驱动 Postgresql - JDBC驱动 Mysql - JDBC...驱动 MariaDB - JDBC驱动程序 Redshift - JDBC驱动 Apache Hive - JDBC驱动 Apache Phoenix 本身是一个JDBC驱动 Apache Drill ...更多属性 您可以在下面指定更多JDBC解释器属性。 物业名称 描述 common.max_result 要显示SQL结果最大数量,以防止浏览器超载。...例如,如果一个连接需要一个schema参数,那么它必须添加如下属性: 名称 值 default.schema SCHEMA_NAME 将JDBC插件绑定到笔记本 要绑定解释器设置页面中创建口译员...Thin client具有较少依赖关系,并通过Phoenix Query Server实例进行连接。

    2.9K70

    大数据那些事(26):Apache Drill之我很土但我毕业了

    作为要做Dremelopensource版,来应对更快更高更强要求MapR又一次发扬了懒土省美德,取了个名字叫Drill。 这个项目很快成了Apache孵化器项目,然后就到顶级了。...Drill是不是Dremel呢?当然不是的。从我能看到关于Drill来介绍以外。Drill有那么几个重要特点。首先是Drill对nested data支持。...关于这种半结构化支持来说,Drill做得看起来是相当不错。在SQL语言使用上也是很简单使用点来引用下一层数据。...Drill对于数据已经包含了Schema类型比如JSON表现,至少从使用性来看,可谓我见过工具里面很好。...但是当这个界限成为自己并不是包含了Schema时候,那就需要额外指定schema或者就只能指望drill把数据给乱parse了。这在CSV文件里面就会显得非常糟糕。

    1.2K80

    SQL SERVER 2022 针对缓存扫描和Query Store 进步,可以考虑进行版本升级

    .看来关注SQL SERVER 的人真是不少,之前我一直错觉,SQL SERVER 关注得人不多了。...这次我们说说SQL SERVER中一直被人诟病问题,缓冲池扫描问题,我们都知道SQL SERVER 是8KB页面,这里除了蹩脚MySQL 是16KB ,其他数据库都是8KB页面,PG默认也是8KB...随着一些业务变大,一些SQL SERVER 本身具有128G 或者更大内存,我见过是最大是768GB内存SQL SERVER 。...另外自SQL SERVER 2016版本中新功能query store,在2022版本中有了更大进步,这项功能可以通过SSMS 来对所有查询消耗进行详细信息统计,这些设计也都是从SQL SERVER...,启动forceing plan 可以按照上方语句设置QS 并在启动QS 后,设置FP,针对你需要进行设置数据库进行设置。

    8710

    大数据文件格式对比 Parquet Avro ORC 特点 格式 优劣势

    基于行(存储数据行):基于行数据库是最适合write-heavy事务性工作负载 支持序列化 快速二进制格式 支持块压缩和可分离 支持schema更新 存储模式头文件数据是自描述 ?...Apache Parquet 源自于google Dremel系统,Parquet相当于Google Dremel中数据存储引擎,而Apache顶级开源项目Drill正是Dremel开源实现。...Apache ORC ORC(OptimizedRC File)存储源自于RC(RecordColumnar File)这种存储格式,RC是一种列式存储引擎,对schema演化(修改schema需要重新生成数据...)支持较差,而ORC是对RC改进,但它仍对schema演化支持较差,主要是在压缩编码,查询性能方面做了优化。...就其本质而言,面向列数据存储针对读取繁重分析工作负载进行了优化,而基于行数据库最适合于大量写入事务性工作负载。

    4.8K21

    开源对决,MapR将Apache Drill引入企业应用

    【编者按】近日,MapR正式将Apache Drill整合进该公司大数据处理平台,并开源了一系列大数据相关工具。...以下为译文 近日,MapR,Apache Drill项目的创建者,已经将该技术初期版本整合到该公司大数据平台。...该公司称这个版本Drill为0.5,以“开发者预览版”方式展示这个SQL查询引擎。 Drill最初公布是在 2012年8月,专注于SQL on Hadoop,当下已经取得了很大进展。...Drill已经得到超过40个以上公司支持和贡献,其中包括Cisco、LinkedIn以及威斯康星大学。当下,开源已经被证实为产品提升有效途径,通过众包方式它可以喜迎大量工程师致力开源。...原文链接:SQL-on-Hadoop tech Apache Drill is ready to use and part of MapR’s distro (编译/仲浩 审校/魏伟)

    1.2K70

    都是 HBase 上 SQL 引擎,Kylin 和 Phoenix 有什么不同?

    与此同时,出现了越来越多大数据技术帮助企业进行大数据分析,例如 Apache Hadoop,Hive,Spark,Presto,Drill,以及今天我们即将介绍 Apache Kylin 和 Apache...了解 Apache Kylin 和 Apache Phoenix 同学都知道,它们都是使用 Apache HBase 做数据存储和查询,那么,同为 HBase 上 SQL 引擎,它们之间有什么不同呢...1、Apache Kylin 1.1 Apache Kylin 介绍 Kylin 是一个分布式大数据分析引擎,提供在 Hadoop 之上 SQL 接口和多维分析能力(OLAP),可以做到在 TB 级数据量上实现亚秒级查询响应...(所依赖第三方类较多)两种;server针对 thin client 而言,为 standalone 模式,是由一台 Java 服务器组成,代表客户端管理 Phoenix 连接,可以进行横向扩展...3.5 性能对比 我们准备测试环境为 CDH 5.15.1,1个 Master,7个  Region Server,每个节点 8 核心 58G 内存,使用 Star Schema Benchmark

    1.7K30

    Apache Calcite项目简介

    什么是Calcite Apache Calcite是一个动态数据管理框架,它具备很多典型数据库管理系统功能,比如SQL解析、SQL校验、SQL查询优化、SQL生成以及数据连接查询等,但是又省略了一些关键功能...目前,使用Calcite作为SQL解析与优化引擎又Hive、Drill、Flink、Phoenix和Storm,Calcite凭借其优秀解析优化能力,会有越来越多数据处理引擎采用Calcite作为...,即验证SQL语句是否符合规范;一种为有状态即通过与元数据结合验证SQLSchema、Field、Function是否存在。...schema = JdbcSchema.create(rootSchema, "hr", dataSource, null, "name"); rootSchema.add("hr", schema...所以Calcite提供了非常丰富可扩展接口,帮助我们实现扩展数据源、扩展针对不同数据源优化规则、扩展SQL查询语法、扩展数据处理引擎等等。

    2.1K31

    Apache Flink Table Api&SQL 介绍与使用

    Apache Flink,Spark,Hadoop包括其他计算框架都趋向于使用SQL方式对数据进行检索。很少再有通过代码方式进行数据操作。数据计算框架使用SQL解释器方式对数据进行检索。...Apache Flink提供了Table API 与SQL方式实现统一流处理与批处理数据计算。...Flink SQL基于Apache Calcite框架实现SQL标准协议。Apache Calcite是Java编写开源SQL解析工具,当前较多项目使用该框架。...如:Hive、Drill、Flink、Phoenix 等。Apache Calcite主要功能有SQL解析、SQL校验、查询优化、SQL生成器、数据连接等。...registerDataSet时,可以看到已经设置了Schema信息,如果不设置Schema信息Apache Flink会默认使用索引位置作为Table字段名称:_1,_2。

    80620

    微软发布同时支持 Windows 和 Linux 平台SQL Server 预览版

    这个公开预览版将是下一版 SQL Server 发布计划组成部分,而新版本将成为首个同时支持 Windows 和 Linux 平台 SQL Server。   ...得益于对 Docker 容器支持,现在甚至连 macOS 用户也能运行新版 SQL Server。...新版 SQL Server 对 R Services 支持将得到改进,并且会包含一些新机器学习和深度神经网络功能。   ...除了 Linux 版 SQL Server 消息之外,微软还在周三宣布, Azure App Service提供了对 Linux 支持。...对 Windows 版 SQL Server 用户来说,微软还在周三发布了 SQL Server 2016 第一个服务包,以及对其可编程性功能做了一些改动:很多 SQL Server 用户——其中包括那些使用免费

    99790

    基于大数据分析系统Hadoop13个开源工具

    因此,各种基于Hadoop工具应运而生,本次为大家分享Hadoop生态系统中最常用13个开源工具,其中包括资源调度、流计算及各种业务针对应用场景。首先,我们看资源管理相关。...,DML支持;5,通过客户端批处理实现有限事务支持;6,紧跟ANSI SQL标准。...Apache Drill 代码托管地址: GitHub 本质上,Apache Drill是Google Dremel开源实现,本质是一个分布式mpp查询层,支持SQL及一些用于NoSQL和...当下Drill还只能算上一个框架,只包含了Drill愿景中初始功能。...Drill目的在于支持更广泛数据源、数据格式及查询语言,可以通过对PB字节数据快速扫描(大约几秒内)完成相关分析,将是一个专为互动分析大型数据集分布式系统。 10.

    1.8K60

    【数据库健康巡检脚本】支持Oracle、MySQL、SQL Server、PG和OS检查

    目前一共包含7个脚本,若脚本扩展名为“.sql”则表示该脚本为sql脚本,若脚本扩展名为“.pl”则表示该脚本为perl脚本。...脚本DB_MSSQL_HC_lhr_v3.2.sqlSQL Server脚本,存在部分DDL和DML操作,执行后会产生SQL Server健康检查html报告。...小麦苗数据库巡检脚本特点 1、可以巡检Oracle、MySQL、SQL Server、PG数据库(后期考虑增加MongoDB) 2、脚本为绿色版、免安装、纯SQL文本 3、跨平台,只要有SQL*Plus...鼠标经过相关连接时会有相应解释,如下图所示: ? 该脚本检查内容较多,所以我对结果进行了过滤,如下: ? ? MySQL数据库 ? ? ? ? SQL Server数据库 ? ? ?...SQL Server数据库 需要使用SQL Server Management Studio (SSMS)或Navicat for SQLServer客户端软件,直接运行脚本,然后将输出结果保存为html

    3K72

    一站式大数据解决方案分析与设计实践:BI无缝整合Apache Kylin

    于是各式各样SQL on Hadoop”技术应运而生,其中以Hive为代表,Impala、Presto、Phoenix、Drill、SparkSQL、FlinkSQL等紧随其后。...Apache Kylin是一个开源、分布式分析型数据仓库,提供Hadoop/Spark/Flink 之上 SQL 查询接口及多维分析(OLAP)能力以支持超大规模数据,通过预计算它能在亚秒内查询巨大表...查询引擎(Query Engine):Rest Server接收查询请求后,解析sql语句,生成执行计划,然后转发查询请求到Hbase中,最后将结果返回给 Rest Server。...API规范,相当于JDBC关系数据库) 附注1: 数据应用,包括智能报告、支持生成SQL或多维分析查询MDX语句组件、托拉拽自助式分析可视化组件等 Mondrian Schema,数据多维分析模型...Mondrian引擎,根据Schema生成标准SQL 目标数据源,包括关系型数据源、非关系型数据源、企业数据仓库 功能架构设计 附注1: 存储引擎,Kylin默认使用分布式、面向列开源数据库Hbase

    92910

    Hadoop上时实类SQL查询系统对比

    以前只用过Hive与impala两个类SQL查询系统,最近又将Hortonworks开源Stinger与ApacheDrill做了些调研。累死累活搞了一天资料,头都大了。...就日常使用来说,标称是支持大部分SQL-92标准(我也不清楚这个标准到底有多少,专业童鞋给点解读呗!!)。根据我 是测试,日常用SQL都没有问题。...不过因为impala使用是C开发,所以impala还是鼓励大家写一个c下面的udf来提高性能。 drill 开源时间跟impala差不多,只不过属于Apache,。...它数据接口都是插件化,理论上支持各种查询语言,SQL自然也不例外,不过目前这个系统还是Apache一个孵化项目,很多功能尚未完成与稳定。但是可以预见,这个系统如果完成是很有影响力。...(图片来源https://cwiki.apache.org/confluence/display/DRILL/High-level+Architecture) Stinger Hortonworks开源一个实时类

    58720
    领券