搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

1回答

Vertica Parquet格式

我使用以下Vertica版本"Vertica Analytic Database v7.1.1-0“，并尝试使用以下查询将数据从Parquet格式文件复制到表中：我使用以下DDL创建了表： CREATE TABLE temp.sessions_parquet格

浏览 2修改于2017-04-07得票数 1

回答已采纳

1回答

NodeJS Parquet写

我正在考虑使用Parquet格式。任何指针都会有帮助。

浏览 4提问于2022-09-14得票数 0

1回答

指定Parquet属性

如何在PySpark中指定块大小和页大小？我到处搜索，但找不到函数调用或导入库的任何文档。

浏览 3提问于2016-07-07得票数 3

回答已采纳

5回答

Avro诉Parquet

我计划在hadoop相关项目中使用hadoop文件格式之一。我理解拼板对于基于列的查询是有效的，对于全扫描或当我们需要所有列数据时，也是有效的！

浏览 1修改于2018-07-30得票数 124

2回答

使用Parquet-tools.jar从Parquet文件中转储特定列

我想使用parquet tools-1.8.1.jar.只转储某个文本文件上的特定列，但无法这样做。我正在尝试下面的命令。请注意，我的列名有正斜杠。parquet-tools-1.8.1.jar dump --column 'dir1/log1/job12121' '/hdfs-path/to/parquet file with space.parquet' > /home/local/pa

浏览 4提问于2016-07-20得票数 2

1回答

<星火Dataframe>.write.parquet(<directory>)和<火花Dataframe>.write.parquet(<file name>.parquet)的区别

SparkSession.builder \ .appName('test') \df = spark.read.parquet('fhvhv_tripdata_2021-01.parquet')df.write.parquet('./tes

浏览 7提问于2022-06-03得票数 0

回答已采纳

1回答

Apache Parquet数据存储引擎？

从链接sql-data-sources-parquet，我看到下面的代码片段存储了数据拼图格式，但根据我的理解，从wiki得到的只是一种格式，而不是一个存储引擎。因此，Parquet将以特定格式将数据存储在HDFS/S3/Cassandra等存储引擎上，不是吗？files, maintaining the schema information // Read in the<e

浏览 21提问于2019-03-18得票数 0

回答已采纳

1回答

蜂箱Parquet表注释

我想补充以下几点意见：(name string comment 'user_name',) ROW FORMAT SERDE 'parquet.hive.serde.ParquetHiveSerDe

浏览 2修改于2018-10-20得票数 0

回答已采纳

1回答

用Python测试Parquet

我试图模拟parquet并断言它是用正确的路径调用的，但是在正确地模拟它时遇到了问题。如何模拟option函数以返回模拟的parquetdef read_from_s3(spark, path):测试import mock class

浏览 0提问于2019-10-03得票数 0

回答已采纳

1回答

Spark & Parquet查询性能

我假设我可以像这样加载完整的数据湖lakeDF.cache

浏览 0修改于2017-03-07得票数 2

2回答

熊猫DataFrame的分类列从一个Parquet文件使用read_parquet？

我正在将大型CSV文件转换为Parquet文件，以便进一步分析。_parquet_kwargs = {"engine": "pyarrow",但是，当我使用from_<e

浏览 0修改于2019-02-17得票数 10

回答已采纳

1回答

pySpark:将Kafka流放入parquet中，并从远程会话读取parquet

df_edge.writeStream\ .option("checkpointLocation", "/tmp/edge/checkusr/src/app/apao-flask-gunicorn/graph_generator.py", line 22, in <module> vertex_df = spark.read.parquet

浏览 36修改于2021-04-29得票数 0

1回答

回归遍历Parquet文件

带有拼花的状态模型看起来很有前途：import pyarrow.parquet as pq def __init__(self, path): try: return self.parquet.

浏览 10提问于2022-04-07得票数 1

1回答

NodeJS -读取Parquet文件

我非常努力地尝试安装node-parquet -> (但可能)--它大部分时间都能工作，但不适合读取数字(数字数据类型)。也尝试过parquetjs，但它只能读取它自己的库创建的拼花文件。

浏览 1提问于2019-04-04得票数 11

1回答

Java中将JSON转换为parquet

我正在尝试将JSON转换为Java中的parquet格式，但我得到了一个异常。$1.visit(TypeUtil.java:27)at org.apache.parquet.schema.TypeUtil$1.visit(TypeUtil.java:31)at

浏览 0修改于2019-08-09得票数 0

1回答

读取gz.parquet文件

你好，我需要从gz.parquet文件中读取数据，但不知道如何读取？？尝试了用黑斑羚，但我得到的结果与没有表结构的parquet-tools cat相同。下面是由twitter、gz.parquet、=>、flume、=>、kafka、=>星火流=> hive/gz.parquet文件创建的数据管道的结果，我有以下的拼花文件。来自_metadata文件的架构如下： [root@quickstart /]# parquet-tools meta hdfs:

浏览 0修改于2021-03-25得票数 1

1回答

Spark 2.0.0 - parquet读取空表

("my.parquet").option("parquet.enable.summary-metadata","true").save("my.parquet") 在中，“在编写拼图文件时，默认情况下不会写入摘要文件要重新启用它，用户必须将“parquet.enable.sum

浏览 11提问于2016-09-09得票数 1

回答已采纳

2回答

Parquet上的火花与蜂巢上的火花(Parquet格式)

我们的用例是一个狭窄的表(15个字段)，但是针对整个数据集(数十亿行)的处理很大。我想知道是什么组合提供了更好的性能：

浏览 0修改于2017-11-10得票数 2

1回答

Apache火花- Parquet* / Snappy压缩错误*

我有一个来自甲骨文表的数据，我试图在本地用Snappy压缩将其写入Parquet格式。 at org.apache.parquet<

浏览 3提问于2017-05-19得票数 4

1回答

连续更新分区Parquet

.mode(SaveMode.Overwrite) .parquet("s3a://some-bucket/stuff") // pick a parent directory to hold the parquets 任何建议都将不胜感激

浏览 3提问于2022-09-14得票数 0

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

Vertica Parquet格式

NodeJS Parquet写

指定Parquet属性

Avro诉Parquet

使用Parquet-tools.jar从Parquet文件中转储特定列

<星火Dataframe>.write.parquet(<directory>)和<火花Dataframe>.write.parquet(<file name>.parquet)的区别

Apache Parquet数据存储引擎？

蜂箱Parquet表注释

用Python测试Parquet

Spark & Parquet查询性能

熊猫DataFrame的分类列从一个Parquet文件使用read_parquet？

pySpark:将Kafka流放入parquet中，并从远程会话读取parquet

回归遍历Parquet文件

NodeJS -读取Parquet文件

Java中将JSON转换为parquet

读取gz.parquet文件

Spark 2.0.0 - parquet读取空表

Parquet上的火花与蜂巢上的火花(Parquet格式)

Apache火花- Parquet* / Snappy压缩错误*

连续更新分区Parquet

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐