我正在雅典娜测试一个大型数据集(1.5TB,5.5b记录),包括拼图和兽人两种格式。我的第一个测试是一个简单的计数查询-SELECT COUNT(*) FROM events_parquet
parquet文件占用一半的时间来运行这个查询作为但我注意到的一件事是,当对拼图文件运行计数时,当扫描字节时,它返回0kb,而对于兽人,它返回78gb。这对于拼图是有意义的,因为计数是在元中,不需要扫描字节。兽人也有一个带有计数<em
虽然大多数文件都可以很好地传输,但是名以_ (下划线)开头的文件则不会。下面是我使用的命令:以及输出的一个例子:
sending incrementalsome files/attrs were not transferred (see previous errors) (code 23) at main.c(1