presto orc - 腾讯云开发者社区

文章/答案/技术大牛

发布

1回答

将数据集从文本文件格式转换为"presto-orc“格式以获得更好的prestoDB性能

如何使用这种"presto-orc“文件格式？我通常使用hive将数据写入ORC/RCFile/Parquet。

浏览 0提问于2015-11-16得票数 0

5回答

Presto支持的文件格式

Presto支持哪些文件格式？是否有任何特定的文件格式推荐更好的性能。我很想知道有没有像RCfile这样针对Presto进行优化的列式文件格式？

浏览 0提问于2013-11-13得票数 6

1回答

AWS雅典娜区分大小写的orc.column.index.access=false？

、、、

DECIMAL(10,3), `page` STRING, `login_time` TIMESTAMP) ROW FORMAT SERDE 'org.apache.hadoop.hive.ql.io.orc.OrcSerde' STORED AS INPUTFORMAT 'org.apache.hadoop.hive.ql.io.orc.OrcInput

浏览 21提问于2020-04-08得票数 2

1回答

配置单元ORC上的Presto查询错误，无法从双精度类型的ORC流中读取SQL类型real

、、、

我能够在presto中运行query来读取Hive ORC(snappy)表中的非浮点列。但是，当我通过presto cli选择所有浮点数据类型列时，会给出以下错误消息。任何建议除了在targetHive表中将字段类型更改为double之外，还有什么替代方法 presto:sample> select * from emp_detail； Query hdfs://ip_addresstablespace/managed/hive/sample.db/emp

浏览 31提问于2020-01-08得票数 1

回答已采纳

1回答

在Presto HIVE_CURSOR_ERROR中从表中获取数据时出错

、、

其中我们使用的是单元目录，表采用ORC格式，由350,000,000行组成。在运行查询“选择column1从ORC_Table1 where column2=123456789”时，我们将获得HIVE_CURSOR_ERROR。)", "org.apache.hadoop.hive.ql.io.orc.OrcInputFormat$OrcRecordReader.next(OrcInputFormat.java:57)", ":329)", "com.facebook.pr

浏览 1提问于2014-09-18得票数 0

回答已采纳

1回答

Spark Small ORC条纹

、、、

我们使用Spark来扁平化点击流数据，然后将其以ORC+zlib格式写入S3，我尝试过在Spark中更改许多设置，但最终创建的ORC文件的条带大小仍然非常小(<2MB)之前，每个文件的大小为20MB，我现在使用coalesce创建大小为250-300MB的文件，但每个文件仍有200个条带，即每个条带小于2MB 通过将hive.exec.orc.default.stripe.size那么，有没有关于如何增加创建的ORC文件的条带大小的想法？因为小条带的问题是，当我们使用P

浏览 22提问于2018-01-14得票数 1

0回答

对在配置单元中以orc格式创建且数据驻留在s3中的表执行presto-cli查询失败

、、

我设置了一个Amazon EMR实例，它包含1个主和1个核心(m4 Large)，具有以下版本详细信息: EMR : 5.5.0 Presto: Presto 0.170 Hadoop2.7.3 HDFSHive 2.1.1元存储区我的Spark应用程序将ORC中的数据写到了亚马逊S3。然后，我在配置单元(create external table TABLE ... partition() stored as ORC location 's3a"//')中创建了表，并尝

浏览 7提问于2017-06-15得票数 1

回答已采纳

1回答

执行SELECT 时的StageStateMachine NullPointer查询引发错误*

、、、

EMR机器中运行：Hadoop distribution: Amazon 2.7.3 at com.facebook.presto.operator.TableScanOperator.getOutput(TableScanOperator.

浏览 2提问于2016-11-17得票数 0

回答已采纳

1回答

为什么当presto服务器在cloudera 6 (CDH6)上时时间戳列值从presto_cli更改？

、、、、

我在CDH6集群上创建了一个orc文件。在这个orc文件的顶部创建了hive表。此表也是从presto使用presto单元连接器查询的。Presto安装在同一个CDH6集群上。当从presto_cli v/s hive_cli查询数据时会注意到时间差。单元-orcfiledump和单元查询都将时间戳列值返回为2021-11-08 15:09:50。event_time 2021-11-08 09:39:50.

浏览 6提问于2021-11-10得票数 0

2回答

Presto查询配置单元表异常:无法列出目录

、、

我有两台用于presto 0.160的机器，一台是协调员，另一台是工人。我想查询hive中的表。presto> desc hive.default.employee_hive; -------------+---------+---q4s3a, FINISHED, 2 nodes0:00 [4 rows, 268B] [40 rows/s, 2.68KB/s] presto

浏览 14提问于2017-07-28得票数 0

1回答

在S3中对现有的ORC文件使用Presto

、、、、

我想配置Presto在亚马逊网络服务S3中查询ORC文件。根据文档，必须配置配置单元元存储区。这个元存储区将收集所有表的模式。由于我有现有的ORC文件，有没有办法用应该嵌入到ORC文件中的现有表的方案自动填充此元存储？提前感谢您的帮助！

浏览 20提问于2021-05-05得票数 0

1回答

默认情况下，在搜索普通选择查询[非分区的蜂窝表]时，在表$path中不存在列<Table>

、

在与蜂巢连接的Presto上，给出以下错误响应。Presto版本: presto_0.180 h timest

浏览 2提问于2021-07-22得票数 1

1回答

可能的表格式值

根据，在Presto中创建表时 orderkey bigint, totalprice double,orderdate dateWITH (format = 'ORC') 您可以指定format = 'xxx'。是否有理由不使用“ORC”(我认为这是默认的)。

浏览 0提问于2017-07-26得票数 0

回答已采纳

1回答

Presto失败: com.facebook.presto.spi.type.VarcharType

、

我创建了一个包含三列( id、name、position )的表，然后使用spark使用orc格式将数据存储到s3中。Query 20180919_151814_00019_33f5d failed: com.facebook.presto.spi.type.VarcharType

浏览 1提问于2018-09-20得票数 7

回答已采纳

1回答

中的全文查询在使用“`LIKE`”时是定时的

、、

获取雅典娜中全文查询的超时错误如下..。有什么方法来优化它吗？ create语句：`nesletterid` string,`format` string,`

浏览 1提问于2020-08-23得票数 1

回答已采纳

2回答

对同一表的时间戳在hive-cli和presto-cli中有所不同。

、、

|| 'org.apache.hadoop.hive.ql.io.orc.OrcSerde' || 'org.apache.hadoop.hive.ql.io.orc.OrcInputFormat' | | OUTPUTFORMAT

浏览 7提问于2021-07-07得票数 2

1回答

记录所有预置查询

、、、

如何将提交给presto集群的所有查询存储在文件(ORC文件)中或可能是其他数据库。目的是保存对预置工作人员执行的所有查询的记录。放置由maven生成的presto文件后，我的presto停止工作。我是新来的，也是新来的。如果有人能帮我做这件事就太好了。

浏览 7提问于2017-11-14得票数 4

回答已采纳

2回答

雅典娜(蜂巢/Presto)拼花vs ORC计数查询

、、、、

我的第一个测试是一个简单的计数查询-SELECT COUNT(*) FROM events_parquet parquet文件占用一半的时间来运行这个查询作为orc文件。为什么雅典娜不使用orc文件中的元数据来确定计数，而它显然是使用拼图文件来确定计数呢？

浏览 1提问于2020-05-01得票数 3

1回答

如何使用Presto编写本地orc文件

、、

如何使用本地文件连接器和orc文件格式编写结果CTAS(机箱表as)的文件 CREATE TABLE localfile.default.lineitem_orc_parted with( partitioned_by = ARRAY['commityear'], bucket_count

浏览 2提问于2019-09-24得票数 0

1回答

从AWS S3 ORC格式数据库读取节点中的数据

、、、

我的客户拥有AWS s3 ORC格式的数据库。现在，我必须查询从s3中获取数据。为了做到这一点，我使用了亚马逊雅典娜，但问题是，它的成本价格使用雅典娜。因此，我只想问一问，在节点js、、中是否还有其他方式来查询ORC格式。下面是我使用的雅典娜代码。console.log(results); console.log(error);})(); 我一直在谷歌，但没有得到任何教程或博客查询ORC请有人指导我如何访问节点js中的S3或ORC数据。

浏览 0提问于2020-07-25得票数 2

点击加载更多

将数据集从文本文件格式转换为"presto-orc“格式以获得更好的prestoDB性能

Presto支持的文件格式

AWS雅典娜区分大小写的orc.column.index.access=false？

配置单元ORC上的Presto查询错误，无法从双精度类型的ORC流中读取SQL类型real

在Presto HIVE_CURSOR_ERROR中从表中获取数据时出错

Spark Small ORC条纹

对在配置单元中以orc格式创建且数据驻留在s3中的表执行presto-cli查询失败

执行SELECT 时的StageStateMachine NullPointer查询引发错误*

为什么当presto服务器在cloudera 6 (CDH6)上时时间戳列值从presto_cli更改？

Presto查询配置单元表异常:无法列出目录

在S3中对现有的ORC文件使用Presto

默认情况下，在搜索普通选择查询[非分区的蜂窝表]时，在表$path中不存在列<Table>

可能的表格式值

Presto失败: com.facebook.presto.spi.type.VarcharType

中的全文查询在使用“`LIKE`”时是定时的

对同一表的时间戳在hive-cli和presto-cli中有所不同。

记录所有预置查询

雅典娜(蜂巢/Presto)拼花vs ORC计数查询

如何使用Presto编写本地orc文件

从AWS S3 ORC格式数据库读取节点中的数据

相关资讯

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐