我能够通过Apache演练连接到Kudu,并且能够很好地列出表。但是,当我不得不从下面的"impala::default.customer“表中获取数据时,我尝试了不同的选项,但没有一种是适合我的。
Kudu中的表是通过Impala-Shell作为外部表创建的。
与库都的初始连接以及列出对象
ubuntu@ubuntu-VirtualBox:~/Downloads/apache-drill-1.19.0/bin$ sudo ./drill-embedded
Apache Drill 1.19.0
"A Drill is a terrible thing to waste.
我正在尝试使用Apache Drill导出一个.csv文件。表示,这是通过以下方式实现的:
use dfs.tmp;
alter session set `store.format`='csv';
create table dfs.tmp.my_output as select * from cp.`employee.json`;
我尝试在Apache Drill web界面中同时运行这个块(由三个命令组成),但得到以下错误。它不知何故不能识别;或不接受多个命令。
我还尝试在没有;的情况下单独运行每一行,但两个命令的更改不会持久存在(并且export命令(第3个命令)默认返回
在kubernetes集群中运行Apache drill时,启动后会抛出此异常:
Starting drillbit, logging to /opt/drill/log/drillbit.out
Exception in thread "main" org.apache.drill.exec.exception.DrillbitStartupException: Could not get canonical hostname.
at org.apache.drill.exec.server.BootStrapContext.getCanonicalHostName(
在apache Drill中从JSON文件的SQL查询创建表时出现解析器错误。
USE dfs.tmp;
CREATE Table myt AS
(SELECT KVGEN(repo)[1] reponame FROM dfs.`f:\DemoData\201901-000000000000.json`
WHERE STRPOS(payload,'ARM') >0)
错误:
Org.apache.drill.common.exceptions.UserRemoteException: PARSE ERROR: Encountered ";" at line
我正在构建一个java应用程序,它从mapR集群中的文件系统(parquet)获取数据。我最初使用的是apache,但是处理非常慢。因此,我决定使用演练jdbc连接方法。
遵循mapR 中的文档
这是我的密码
步骤1;将驱动程序jar放在项目路径中的lib文件夹中,如图所示;
[project directory][1]
[1]: https://i.stack.imgur.com/APsZi.png
step 2;
Imported the jar to my maven pom.xml
<dependency>
<group
I am using apache drill in window 10 having latest version (1.9).
I want to start my drill in distributed mode.我有配置动物园管理员zoo.cfg文件:-
tickTime=2000
initLimit=10
syncLimit=5
dataDir=F:/zookeepertest/data
clientPort=2181
server.1=192.589.XX.01:2888:3888
server.1=192.565.XX.02:2888:3888
并在drill-overri
我们在Apache连接中有一些错误。我们最近升级到了Apache Drill 1.0,相同的应用程序一直工作到Drill 0.8。谨随函附上以下例外情况:
org.apache.drill.exec.rpc.RpcException: Failure connecting to server. Failure of type HANDSHAKE_VALIDATION.
at org.apache.drill.exec.client.DrillClient$FutureHandler.connectionFailed(DrillClient.java:376)
有没有办法从SQL错误中获得更多的细节?
说到与数据相关的错误,钻孔没有给出任何线索,在哪里和如何找到问题。SQL语法和逻辑错误在某种程度上是可以理解的,但假设以下情况:
经典例子
您有~10 of的CSV满是数字(sales.csv):
ArticleId,CategoryId,Price,SupplierPrice,VAT
1234,23,15.19,12.45,0
1235,23,16.19,13.45,0.15
...
[83541670] lines
...
475,34.0,55.0,50,0.15 # This random error cause (CategoryId sh
当我运行时:
SELECT anum as anum, COUNT(*) as callCount, SUM(dur*1) as callDuration, COUNT(distinct bnum) as voiceBnumCount, COUNT(distinct cdrref) as longCallCount
FROM hdfs.`/data/files/{171221}*` as t1 WHERE `t1`.`direction` IN ('up') AND `t1`.`anum_code` IN ('FIRSTANUM')
AND CONCAT(sd
我正在尝试在两个表之间建立连接,一个表具有1,250,910,444条记录,另一个表使用Apache Drill连接385,377,113条记录。但是,在执行2分钟后,它会显示以下错误:
org.apache.drill.common.exceptions.UserRemoteException: RESOURCE ERROR: One or more nodes ran out of memory while executing the query. Failure allocating buffer.
Fragment 1:2 [Error Id: 51b70ce1-29d5-459b-
我已经在ZooKeeper 3.4.9的Hadoop2.7.0集群上安装了ApacheDore0.8.0。在集群中的从机上,演练启动良好。但是在主节点上,它抛出以下错误(在drillbit.out中)
Exception in thread "main" java.lang.NoSuchMethodError: com.fasterxml.jackson.core.JsonFactory.requiresPropertyOrdering()Z
at com.fasterxml.jackson.databind.ObjectMapper.<init>(Obje