腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
我们
如何
使用
spark.sql
加载
在
json
数据
上
创建
的
hive
表
来
触发
数据
帧
?
、
、
、
我尝试通过
json
数据
(
使用
spark.sql
)
在
pyspark
数据
帧
中查询
hive
表
,但出现了以下错误 ERROR log: error in initSerDe: java.lang.ClassNotFoundExceptionClass org.apache.
hive
.hcatalog.data.JsonSerDe not foundjava.lang.ClassNotFoundException: Cl
浏览 28
提问于2020-07-16
得票数 0
5
回答
如何
从配置单元外部
表
创建
数据
帧
、
、
、
、
我们
喜欢
在
Hive
外部
表
的
顶部
创建
数据
帧
,并
使用
hive
模式和
数据
进行spark级别的计算。
我们
是否可以从
hive
外部
表
中获取模式并将其用作Dataframe模式。
浏览 69
提问于2017-05-11
得票数 1
回答已采纳
1
回答
无法查看通过Spark SQL
创建
的
新
数据
、
、
、
创建
一个
表
drop table if exists
hive
_parquet_nulls_test ; name String) stored as PARQUET; 然后
创建
一个具有新列
的
数据
框并
加载
它们 import java.sql.Date df.write.m
浏览 30
提问于2019-12-21
得票数 3
回答已采纳
2
回答
如何
在不重复
的
情况下将火花DataFrame插入到
Hive
内部
表
中?
、
、
所以命令直接将附加到
hive
表
是,但是,追加模式是否确保避免了行
的
重复?例: 其中一个是提到
的
,
加载
蜂窝
表</e
浏览 1
提问于2018-10-07
得票数 2
2
回答
Apache不
使用
来自
Hive
分区外部
表
的
分区信息
、
、
我有一个简单
的
Hive
外部
表
,它是
在
S3之上
创建
的
(文件是CSV格式
的
)。当我运行
hive
查询时,它会显示所有记录和分区。但是,当我
在
Spark中
使用
相同
的
表
时( Spark
在
分区列上有一个where条件),它不会显示应用了分区筛选器。然而,对于
Hive
托管
表
,Spark可以
使用
分区信息并应用分区筛选器。是否有
浏览 0
提问于2019-08-24
得票数 3
1
回答
将HBase中
的
数据
作为RDD直接查询到Spark中,还是通过Phoenix作为
数据
帧
进行查询?
、
、
我正在尝试查询存储
在
HBase中
的
数据
,以便在AWS EMR中
使用
Spark ML。我应该将
数据
作为RDD提取(如下所示),还是应该
使用
Phoenix将
数据
作为Dataframe进行查询?我已经尝试过通过HBase RDD和Phoenix将
数据
导入到Spark中。然而,我
在
使用
这两种方法时都遇到了问题。current/hbase-client/conf/hbase-site.xml&qu
浏览 24
提问于2019-06-21
得票数 0
5
回答
如何
使用
星火
数据
帧
的
模式
创建
蜂箱
表
?
、
、
我想
使用
我
的
模式
创建
一个
hive
表
。我怎么能这么做?对于固定列,我可以
使用
:sparksession.sql(CreateTable_query) 但是我
的
dataframe中有很多列,那么有什么方法可以自动生成这样
的
查询呢?
浏览 5
提问于2017-02-15
得票数 17
回答已采纳
1
回答
如何
将spark
数据
帧
与Databricks Deltalake
上
的
hive
表
合并?
、
、
表
: val df2 =
spark.sql
("select * from db.table") 从传入
的
数据
帧
df1中,我获得了两条新记录和两条更新记录。James| Sales| 34| Associate|+-------+-------+---+----------+ 这里
使用
的
密钥是:dept & id
在
我之前
的
一个项目中,<
浏览 19
提问于2021-10-19
得票数 1
回答已采纳
1
回答
使用
Spark
在
Qubole metastore中设置分区位置
、
、
、
如何
在Qubole metastore中为我
的
Hive
表
设置分区位置?我知道这是Spark,但是
如何
使用
MySQL访问它并传递带有修复
的
SQL脚本呢?你知道
如何
直接更新Qubole
的
转移存储吗?我希望将批处理中
的
位置传递给转移存储,以提高性能。
浏览 1
提问于2018-04-11
得票数 0
3
回答
如何
将PySpark
数据
写入DynamoDB
表
?
、
如何
将PySpark
数据
写入DynamoDB
表
?没有找到多少这方面的信息。根据我
的
要求,我必须将PySpark
数据
写入Dynamo
表
。总的来说,我需要从我
的
PySpark代码中读写发电机。
浏览 1
提问于2018-10-29
得票数 3
回答已采纳
1
回答
运行示例时出错
、
、
、
我有下面的,可以
在
官方
的
apache/spark
上
找到。我花了很多时间了解
如何
在Hortonworks Hadoop Sandbox中运行这个示例,但没有成功。(如我
在
安巴里
的
蜂巢中看到
的
那样)设置为warehouseLocation。TABLE src");
spark.sql
("LOAD DATA LOCAL INPATH
浏览 2
提问于2017-12-18
得票数 1
回答已采纳
1
回答
如何
将
数据
推送到phoenix is块
、
、
、
我是这个领域
的
新手。我正在尝试将
数据
从spark推送到phoenix。
数据
的
大小超过100万。spark作业
在
10万条记录
的
情况下运行良好,但当记录数超过100万条时就会卡住。我正在从
hive
加载
数据
val
hive
_data =
spark.sql
(query) 把它推向凤凰城
hive
_data.write.format("org.apache.phoenix.sp
浏览 26
提问于2021-06-26
得票数 0
3
回答
如何
在Spark1.3中通过
Hive
指示SparkSQL中
的
数据
库
、
、
、
我有一个简单
的
Scala代码,它从
Hive
数据
库检索
数据
并从结果集
创建
一个RDD。它可以很好地与HiveContext配合
使用
。问题是
hive
.execution.engine
的
默认设置是'mr‘,这使得配置单元
使用
MapReduce很慢。不幸
的
是,我不能强迫它
使用
"spark“。我尝试通过替换hc = SQLContext SQLContext(sc)来
使用
新
浏览 7
提问于2016-06-22
得票数 5
2
回答
什么是Apache Spark (SQL)中
的
Catalyst Optimizer?
、
我想知道更多关于
在
Apache ( PySpark )中
使用
Catalyst Optimizer
的
信息,
在
pyspark
数据
帧
中
使用
Catalyst Optimizer是可能
的
。
浏览 23
提问于2019-05-18
得票数 1
1
回答
Spark不
使用
Hive
分区外部
表
中
的
分区信息
、
、
、
我有一个复杂/嵌套
的
Hive
-External
表
,它是
在
HDFS
上
创建
的
(文件采用avro格式)。当我运行配置单元查询时,它会显示所有记录和分区。但是,当我
在
Spark中
使用
相同
的
表
时: val df = spark.format("avro").option("avroSchema
浏览 15
提问于2020-01-21
得票数 0
2
回答
Spark saveAsTable抛出NoSuchTableException
、
、
、
我正在
使用
pyspark
的
(Spark 2.3.2) saveAsTable,如下所示: .sortBy("id") \ .option("path", "test_table.parquet") \
在</em
浏览 1
提问于2019-10-10
得票数 0
11
回答
如何
将DataFrame直接保存到
Hive
?
、
、
、
有没有可能将spark中
的
DataFrame直接保存到
Hive
? 我尝试过将DataFrame转换为Rdd,然后保存为文本文件,然后
加载
到
hive
中。但是我想知道我能不能直接把dataframe保存到
hive
浏览 1
提问于2015-06-05
得票数 93
1
回答
如何
在Azure Delta湖上
创建
外部
表
(类似于
Hive
)
、
、
如何
在Azure
数据
湖存储
上
创建
外部Delta
表
?我目前正在从事一个迁移项目(从Pyspark/Hadoop到Azure)。我找不到很多关于
在
Azure中
创建
非托管
表
的
文档。下面是我目前能够
在
Pyspark/
Hive
/HDFS设置中执行
的
一系列操作,不知道
如何
在Azure
上
建立相同
的
操作。即使<em
浏览 3
提问于2022-03-30
得票数 0
1
回答
使用
Scala中
的
值列表过滤Spark
数据
帧
、
、
我正在尝试
使用
SparkSession从
hive
表
创建
数据
帧
,如下所示。
创建
后,我将通过Ids列表
来
筛选行。val myDF =
spark.sql
("select * from myhivetable")有没有一种方法可以查询配置单元
表
,如下所示: val myDF
浏览 0
提问于2018-09-26
得票数 1
1
回答
使用
spark将
数据
插入配置单元
表
的
问题
、
、
、
目前我正在开发Spark版本2.1.0,作为我
的
数据
摄取工作
的
一部分,我必须
使用
ingest方法将
数据
摄取到
hive
表
中。但是Spark 2.1版本有一个bug,当插入
数据
到
hive
表
中时,insertinto方法不会保持列顺序。我已经尝试
在
append模式下
使用
saveAsTable方法,但它不会起作用,因为在
数据
摄取之前,我首先
使用
正确<em
浏览 15
提问于2019-02-26
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Spark之SparkSQL
Spark SQL,DataFrames 以及 Datasets 编程指南
HIVE小结 HIVE基本语法,大数据基础知识理解
【大数据】Hive 分区和分桶的区别及示例讲解
玩转大数据系统系列
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券