腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(5877)
视频
沙龙
1
回答
将数据集从文本文件格式转换为"
presto
-
orc
“格式以获得更好的prestoDB性能
如何使用这种"
presto
-
orc
“文件格式?我通常使用hive将数据写入
ORC
/RCFile/Parquet。
浏览 0
提问于2015-11-16
得票数 0
5
回答
Presto
支持的文件格式
Presto
支持哪些文件格式?是否有任何特定的文件格式推荐更好的性能。我很想知道有没有像RCfile这样针对
Presto
进行优化的列式文件格式?
浏览 0
提问于2013-11-13
得票数 6
1
回答
AWS雅典娜区分大小写的
orc
.column.index.access=false?
、
、
、
DECIMAL(10,3), `page` STRING, `login_time` TIMESTAMP) ROW FORMAT SERDE 'org.apache.hadoop.hive.ql.io.
orc
.OrcSerde' STORED AS INPUTFORMAT 'org.apache.hadoop.hive.ql.io.
orc
.OrcInput
浏览 21
提问于2020-04-08
得票数 2
1
回答
配置单元
ORC
上的
Presto
查询错误,无法从双精度类型的
ORC
流中读取SQL类型real
、
、
、
我能够在
presto
中运行query来读取Hive
ORC
(snappy)表中的非浮点列。但是,当我通过
presto
cli选择所有浮点数据类型列时,会给出以下错误消息。任何建议除了在targetHive表中将字段类型更改为double之外,还有什么替代方法
presto
:sample> select * from emp_detail; Query hdfs://ip_addresstablespace/managed/hive/sample.db/emp
浏览 31
提问于2020-01-08
得票数 1
回答已采纳
1
回答
在
Presto
HIVE_CURSOR_ERROR中从表中获取数据时出错
、
、
其中我们使用的是单元目录,表采用
ORC
格式,由350,000,000行组成。在运行查询“选择column1从
ORC
_Table1 where column2=123456789”时,我们将获得HIVE_CURSOR_ERROR。)", "org.apache.hadoop.hive.ql.io.
orc
.OrcInputFormat$OrcRecordReader.next(OrcInputFormat.java:57)", ":329)", "com.facebook.
pr
浏览 1
提问于2014-09-18
得票数 0
回答已采纳
1
回答
Spark Small
ORC
条纹
、
、
、
我们使用Spark来扁平化点击流数据,然后将其以
ORC
+zlib格式写入S3,我尝试过在Spark中更改许多设置,但最终创建的
ORC
文件的条带大小仍然非常小(<2MB)之前,每个文件的大小为20MB,我现在使用coalesce创建大小为250-300MB的文件,但每个文件仍有200个条带,即每个条带小于2MB 通过将hive.exec.
orc
.default.stripe.size那么,有没有关于如何增加创建的
ORC
文件的条带大小的想法?因为小条带的问题是,当我们使用
P
浏览 22
提问于2018-01-14
得票数 1
0
回答
对在配置单元中以
orc
格式创建且数据驻留在s3中的表执行
presto
-cli查询失败
、
、
我设置了一个Amazon EMR实例,它包含1个主和1个核心(m4 Large),具有以下版本详细信息: EMR : 5.5.0
Presto
:
Presto
0.170 Hadoop2.7.3 HDFSHive 2.1.1元存储区 我的Spark应用程序将
ORC
中的数据写到了亚马逊S3。然后,我在配置单元(create external table TABLE ... partition() stored as
ORC
location 's3a"//')中创建了表,并尝
浏览 7
提问于2017-06-15
得票数 1
回答已采纳
1
回答
执行SELECT *时的StageStateMachine NullPointer查询引发错误
、
、
、
EMR机器中运行:Hadoop distribution: Amazon 2.7.3 at com.facebook.
presto
.operator.TableScanOperator.getOutput(TableScanOperator.
浏览 2
提问于2016-11-17
得票数 0
回答已采纳
1
回答
为什么当
presto
服务器在cloudera 6 (CDH6)上时时间戳列值从
presto
_cli更改?
、
、
、
、
我在CDH6集群上创建了一个
orc
文件。在这个
orc
文件的顶部创建了hive表。此表也是从
presto
使用
presto
单元连接器查询的。
Presto
安装在同一个CDH6集群上。当从
presto
_cli v/s hive_cli查询数据时会注意到时间差。单元-orcfiledump和单元查询都将时间戳列值返回为2021-11-08 15:09:50。event_time 2021-11-08 09:39:50.
浏览 6
提问于2021-11-10
得票数 0
2
回答
Presto
查询配置单元表异常:无法列出目录
、
、
我有两台用于
presto
0.160的机器,一台是协调员,另一台是工人。我想查询hive中的表。
presto
> desc hive.default.employee_hive; -------------+---------+---q4s3a, FINISHED, 2 nodes0:00 [4 rows, 268B] [40 rows/s, 2.68KB/s]
presto
浏览 14
提问于2017-07-28
得票数 0
1
回答
在S3中对现有的
ORC
文件使用
Presto
、
、
、
、
我想配置
Presto
在亚马逊网络服务S3中查询
ORC
文件。根据文档,必须配置配置单元元存储区。这个元存储区将收集所有表的模式。由于我有现有的
ORC
文件,有没有办法用应该嵌入到
ORC
文件中的现有表的方案自动填充此元存储? 提前感谢您的帮助!
浏览 20
提问于2021-05-05
得票数 0
1
回答
默认情况下,在搜索普通选择查询[非分区的蜂窝表]时,在表$path中不存在列<Table>
、
在与蜂巢连接的
Presto
上,给出以下错误响应。
Presto
版本:
presto
_0.180 h timest
浏览 2
提问于2021-07-22
得票数 1
1
回答
可能的表格式值
根据,在
Presto
中创建表时 orderkey bigint, totalprice double,orderdate dateWITH (format = '
ORC
') 您可以指定format = 'xxx'。是否有理由不使用“
ORC
”(我认为这是默认的)。
浏览 0
提问于2017-07-26
得票数 0
回答已采纳
1
回答
Presto
失败: com.facebook.
presto
.spi.type.VarcharType
、
我创建了一个包含三列( id、name、position )的表,然后使用spark使用
orc
格式将数据存储到s3中。Query 20180919_151814_00019_33f5d failed: com.facebook.
presto
.spi.type.VarcharType
浏览 1
提问于2018-09-20
得票数 7
回答已采纳
1
回答
中的全文查询在使用“`LIKE`”时是定时的
、
、
获取雅典娜中全文查询的超时错误如下..。有什么方法来优化它吗? create语句:`nesletterid` string,`format` string,`
浏览 1
提问于2020-08-23
得票数 1
回答已采纳
2
回答
对同一表的时间戳在hive-cli和
presto
-cli中有所不同。
、
、
|| 'org.apache.hadoop.hive.ql.io.
orc
.OrcSerde' || 'org.apache.hadoop.hive.ql.io.
orc
.OrcInputFormat' | | OUTPUTFORMAT
浏览 7
提问于2021-07-07
得票数 2
1
回答
记录所有预置查询
、
、
、
如何将提交给
presto
集群的所有查询存储在文件(
ORC
文件)中或可能是其他数据库。目的是保存对预置工作人员执行的所有查询的记录。放置由maven生成的
presto
文件后,我的
presto
停止工作。 我是新来的,也是新来的。如果有人能帮我做这件事就太好了。
浏览 7
提问于2017-11-14
得票数 4
回答已采纳
2
回答
雅典娜(蜂巢/
Presto
)拼花vs
ORC
计数查询
、
、
、
、
我的第一个测试是一个简单的计数查询-SELECT COUNT(*) FROM events_parquet parquet文件占用一半的时间来运行这个查询作为
orc
文件。为什么雅典娜不使用
orc
文件中的元数据来确定计数,而它显然是使用拼图文件来确定计数呢?
浏览 1
提问于2020-05-01
得票数 3
1
回答
如何使用
Presto
编写本地
orc
文件
、
、
如何使用本地文件连接器和
orc
文件格式编写结果CTAS(机箱表as)的文件 CREATE TABLE localfile.default.lineitem_
orc
_parted with( partitioned_by = ARRAY['commityear'], bucket_count
浏览 2
提问于2019-09-24
得票数 0
1
回答
从AWS S3
ORC
格式数据库读取节点中的数据
、
、
、
我的客户拥有AWS s3
ORC
格式的数据库。现在,我必须查询从s3中获取数据。为了做到这一点,我使用了亚马逊雅典娜,但问题是,它的成本价格使用雅典娜。因此,我只想问一问,在节点js、、中是否还有其他方式来查询
ORC
格式。下面是我使用的雅典娜代码。console.log(results); console.log(error);})(); 我一直在谷歌,但没有得到任何教程或博客查询
ORC
请有人指导我如何访问节点js中的S3或
ORC
数据。
浏览 0
提问于2020-07-25
得票数 2
点击加载更多
相关
资讯
Presto源码分析:Coordinator篇
硬刚Presto | Presto原理&调优&面试&实战全面升级版
Presto 0.206 发布,Facebook 开源的大数据查询引擎
Presto在滴滴的探索与实践
Presto 在有赞的实践之路
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券