腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(114)
视频
沙龙
1
回答
运行Apache
Hudi
deltastreamer时出错
、
、
、
我正在尝试在AWS EMR上运行
Hudi
deltastreamer。按照此博客中的步骤操作。key=
HUDI
但是当我运行下面的spark提交时,错误出现了: Exception in thread "main" org.apache.
hudi
.com.beust.jcommander.ParameterException_2.11:2.4.4 \ --master yarn --deploy-mode client /usr/lib/
hudi
/
hu
浏览 114
提问于2020-01-31
得票数 2
2
回答
我可以使用mysql数据库作为apache的目标存储吗?
、
我是Apache的新手,请告诉我apache中是否提供了用于在mysql数据库上编写数据的配置。
浏览 9
提问于2022-08-02
得票数 0
1
回答
将Apache
Hudi
数据集写入腾讯云cos可以实现嘛,有没有例子?
、
、
、
将Apache
Hudi
数据集写入腾讯云cos可以实现嘛,有没有例子?
浏览 227
提问于2023-10-10
1
回答
从其他类向类中的方法分配默认值
、
、
我的项目结构如下:utilsproject主文件将在stage.py中创建类的实例,该实例将创建
hudi
类的实例。
hudi
.py的代码是 def __init__(self, spark):在阅读答案时,我尝试了以下代码: class <em
浏览 5
提问于2022-04-04
得票数 0
1
回答
Hudi
分区和upsert不工作
、
这个配置中的错误是什么, 分区键在
HUDI
中不起作用,并且在执行upsert时,
hudi
数据集中的所有记录都会更新。所以不能从表中提取增量。: '
hudi
_db','hoodie.datasource.hive_sync.enable': 'true', 'path': 's3:/
浏览 50
提问于2021-08-29
得票数 1
1
回答
Dataproc上的Apache
Hudi
、
、
、
org.apache.spark.sql.
hudi
.HoodieSparkSessionExtension._jvm.org.apache.
hudi
.QuickstartUtils.DataGenerator()我使用了错误的.jar.在创建表和
hudi
.options之后: 22/12/01 22:26:04 WARN org.apache.
hudi
.common.config.DFSPropertiesConfiguration:Cannot find
HUDI
_CON
浏览 30
提问于2022-12-01
得票数 2
回答已采纳
1
回答
最后/最后一次提交:使用pyspark获得
hudi
的最新提交
、
、
、
、
我每小时都使用spark
hudi
进行增量查询,每次都将增量查询的开始和结束时间保存在db(例如mysql)中。增量查询应该如下所示: 'hoodie.datasource.query.type': 'incremental',':
hudi
_end_commit但我不知道如何在pyspark(python)中找到
hudi
_end_commit。spark_session.read.forma
浏览 7
提问于2022-05-16
得票数 1
1
回答
如何通过
Hudi
CLI更改
Hudi
表版本
如何通过
Hudi
更改表版本? at org.apache.
hudi
.common.table.HoodieTableVersion.lambda(HoodieTable
浏览 32
提问于2022-03-02
得票数 0
1
回答
java.lang.ClassNotFoundException:未能找到数据源:
hudi
。
、
、
我正在尝试从
hudi
读取数据,但得到的数据低于错误。Caused by: java.lang.ClassNotFoundException: Failed to find data source:
hudi
.Please find packages at http://spark.apache.org/third-party-projects.html 我可以使用下面的命令使用jupyter笔记本从
Hudi
val hudiIncQueryDF = spark.read.format("
hudi
浏览 20
提问于2022-06-13
得票数 4
1
回答
如何从被测试的方法的同一个类中模拟一个方法?
、
、
我有以下的项目结构||----
hudi
.py|--tests|----__init__.pyclass Partitions: self.bucket = bucket(cls) -> None: cls.
hudi
_partitions =
hudi</e
浏览 8
提问于2022-04-23
得票数 0
1
回答
AWS Glue-如何在s3存储桶中仅输出一个最新文件
、
、
、
我使用AWS Glue和Apache
Hudi
将RDS中的数据复制到S3。如果我执行以下任务,将在S3存储桶(basePath)中生成2个拼图文件(初始文件和更新文件)。_jvm.org.apache.
hudi
.QuickstartUtils.DataGenerator()basePath = f's3://{bucketName}/{tableName}'
hudi
浏览 27
提问于2021-11-30
得票数 0
1
回答
通过apache livy执行
hudi
delta streamer作业
、
、
spark-submit --packages org.apache.
hudi
:
hudi
-utilities-bundle_2.11:0.5.3,org.apache.spark:spark-avro_conf spark.sql.shuffle.partitions=100 \ --class org.apache.
hudi
.utilities.deltastreamer.HoodieDeltaStreamer\ --table-type MERGE_ON
浏览 29
提问于2021-10-07
得票数 0
1
回答
使用即时时间读取星火数据源
Hudi
表
、
、
我正在使用Spark.read.format("
hudi
")阅读
Hudi
表Incremental
浏览 4
提问于2021-03-09
得票数 0
1
回答
在Apache表中编写火花DataFrame
、
、
我刚开始使用
hudi
,并试图使用spark在
Hudi
表中编写我的数据。第一次输入,我没有创建任何表,也没有在覆盖模式下写入,所以我希望它会创建
hudi
表,我正在编写下面的代码。spark-shell \ --packages org.apache.
hudi
:
hudi
-spark-bundle_2.12:0.7.0,org.apache.spark:spark-avro'spark.serializer=org.apache.spark.serializer.KryoSerializer&
浏览 1
提问于2021-03-19
得票数 2
回答已采纳
2
回答
无法创建配置单元连接jdbc:hive2://localhost:10000。spark-在集群模式下提交
、
、
、
、
我在Apache Spark上运行Apache
Hudi
应用程序。. at org.apache.
hudi
.hive.HiveSyncToo
浏览 87
提问于2021-02-16
得票数 1
回答已采纳
1
回答
直接或通过AWS胶数据目录将红移谱/AWS EMR与
Hudi
连接
、
、
、
、
我正在努力理解如何正确地将红移光谱与
Hudi
数据连接起来。redshift/latest/dg/c-spectrum-external-tables.html所描述的那样,直接为ApacheHudi中管理的数据创建RedShift外部表,另一种方法是像这里提到的那样,将
Hudi
与AWS Glue Data Catalog集成,然后通过AWS Glue Data Catalog访问具有RedShift谱的
Hudi
表。看来我可以直接从EMR或AWS Glue数据目录使用
Hudi
。 现在,我不知道该
浏览 50
提问于2021-09-12
得票数 1
回答已采纳
1
回答
Apache
Hudi
deltastreamer在线程" main“org.apache.
hudi
.com.beust.jcommander.ParameterException‘中抛出异常没有定义主参数
、
、
版本Apache
Hudi
0.6.1,Spark 2.4.6 下面是
Hudi
deltastreamer的标准spark-submit命令,因为没有定义主参数,所以抛出了这个命令。[hadoop@ip-00-00-00-00 target]$ spark-submit --class org.apache.
hudi
.utilities.deltastreamer.HoodieDeltaStreamer'ls /mnt/
hudi
/packaging/
hudi</
浏览 113
提问于2020-09-08
得票数 0
1
回答
从卡夫卡到哈迪的电火花流
、
、
、
、
我刚开始使用
hudi
我有个问题。我正在使用一个在AWS中使用pyspark,Kafka的EMR,我想要做的是阅读一个主题,然后将它移到
hudi
格式的S3中。\ .option("subscribe", topic) \…… .writeStream \ .outputMode('append')
浏览 15
提问于2022-09-28
得票数 2
回答已采纳
1
回答
湖泊形成控制表的底层格式/技术
、
、
会是
Hudi
吗?如果不是
Hudi
,新的格式/技术与
Hudi
相比如何?
浏览 5
提问于2021-02-03
得票数 3
3
回答
Databricks - java.lang.NoClassDefFoundError: org/json/JSONException
、
、
、
(HoodieHiveClient.java:384) at org.apache.
hudi
.hive.HoodieHiveClient.createTable(HoodieHiveClient.java:262) at
浏览 2
提问于2020-11-03
得票数 0
回答已采纳
点击加载更多
相关
资讯
大数据Hadoop之——Apache Hudi 数据湖实战操作(Spark,Flink与Hudi整合)
Apache Zeppelin 整合 Spark 和 Hudi
基于 Hudi 和 Kylin 构建准实时高性能数据仓库
百信银行基于 Apache Hudi 实时数据湖演进方案
数仓实时化改造:Hudi on Flink 在顺丰的实践应用
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券