腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(681)
视频
沙龙
1
回答
找不到
保
存到
配置
单元
表
的
pyspark
数据
帧
、
、
、
使用
pyspark
创建一个dataFrame,然后将其保
存到
hive。 已在仓库中正确创建该文件,但无法使用show tables在
配置
单元
或impala中找到该文件。但它只显示了以前由spark代码创建
的
表
,这意味着它不能看到通过hive或impala控制台创建
的
表
。 所以我认为可能spark代码没有收集到Hive Metastore服务器。
浏览 12
提问于2019-05-15
得票数 0
1
回答
使用
配置
单元
元
数据
读取HDFS文件-
Pyspark
、
、
、
、
我是
PySpark
新手,正在尝试读取HDFS文件(上面创建了hive
表
)并创建
PySpark
数据
帧
。通过
PySpark
读取
配置
单元
表
非常耗时。有没有什么方法可以动态获取hive列名(用作dataframe中
的
模式)?我希望将文件位置、
表
名和
数据
库名作为输入传递给aa程序/函数,以便从
配置
单元
元
数据
(可能是元
数据
浏览 15
提问于2019-03-06
得票数 0
回答已采纳
1
回答
pyspark
1.3.0将
数据
帧
保
存到
配置
单元
表
中
、
、
136850 177070 我正在尝试将该DF保
存到
不存在
配置
单元
表
中
浏览 0
提问于2017-01-20
得票数 0
1
回答
从在azure云上运行
的
databricks向外部
配置
单元
群集写入
pyspark
、
、
、
我有在databricks中运行
的
pyspark
笔记本。我使用pyhive中
的
'hive.Connection‘连接到外部
配置
单元
群集。我
的
数据
存储在spark
数据
帧
中。我
的
问题是,如何将来自dataframes
的
数据
写入Hive中
的
新
表
,该
表
位于databricks以外
的
不同集群中? 谢谢
浏览 11
提问于2020-09-26
得票数 0
1
回答
Python
pyspark
将DF写入.csv并将其存储在本地c驱动器中。
、
、
、
我想保存一个使用SQLContext拉取
数据
的
数据
帧
,并将其保
存到
c驱动器中
的
.csv文件中。我正在使用Zeppelin来运行我
的
代码。 df = sqlContext.sql("SELECT * from
浏览 1
提问于2020-05-25
得票数 0
2
回答
如何将temptable保
存到
Hive metastore (并在Hive中进行分析)?
、
、
、
、
我使用
的
是Spark 1.3.1。在
配置
单元
中,如果我运行show tables,DataFrame在
配置
单元
数据
库中不会以
表
的
形式出现。我已经将hive-site.xml复制到$SPARK_HOME/conf,但它没有帮助(
数据
帧
也不会出现在
配置
浏览 0
提问于2015-11-18
得票数 0
2
回答
Spark SQL HiveContext - saveAsTable创建了错误
的
模式
、
、
我尝试将
数据
帧
存储到Spark 1.3.0 (
PySpark
)中
的
持久化蜂窝
表
。: long (nullable = true)peopleDF.saveAsTable("peopleHive")Column Data Type Comments col ar
浏览 0
提问于2015-05-14
得票数 9
回答已采纳
1
回答
PySpark
-将
数据
帧
写入
配置
单元
表
、
、
、
、
我有一张空
的
蜂巢桌子。我有18个作业在运行,每个作业都可能有一个
数据
框,我需要将这些
数据
框添加到Hive
表
中,其中包含一个地块文件。我得到
的
是这样
的
东西:但这似乎不太正确。我是否必须添加一些<code>D1</code>文件名,并且每次都要一直添加?
浏览 6
提问于2020-08-06
得票数 0
1
回答
InsertInto(
表
名)始终将
数据
帧
保存在
配置
单元
的
默认
数据
库中
、
、
、
、
嗨,我在我
的
蜂箱中有两个
表
,我从第一个
表
中选择
数据
,创建
数据
帧
,并以orc格式将该
数据
帧
保
存到
另一个
表
中。我在同一个
数据
库中创建了这两个
表
。当我将这个
数据
帧
保
存到
第二个
表
中时,我在
数据
库issue.and中
找不到
表
如果我没有使用任何
数据
库名
浏览 24
提问于2020-04-04
得票数 0
1
回答
将
PySpark
从停靠容器连接到本地计算机
的
配置
单元
表
、
、
我已经使用
Pyspark
构建了一个决策树模型,并希望使用docker容器部署该模型。我使用
的
是spark 1.6.0。
数据
存储在Hive
表
中,并位于我
的
本地计算机中。有没有一种方法可以将
PySpark
从我
的
停靠容器连接到我本地计算机中
的
配置
单元
表
?我
的
配置
单元
表
中
的
数据
可能会更新,所以我不想挂
浏览 7
提问于2018-12-30
得票数 0
1
回答
Spark dataframe将时间戳
数据
加载到hive
表
时出现问题
、
、
我正在尝试将
数据
帧
加载到
配置
单元
表
中。但它增加了额外
的
30分钟。我试过下面的方法 从
pyspark
导入SparkContext,HiveContext sc = SparkContext() hive_context = HiveContext(sc) df_load.write.mode但是在
表
中,它被加载为"2020-09-01 09:30:00“。 如何解决这个问题。
浏览 48
提问于2020-09-01
得票数 0
1
回答
如何使用
PySpark
对Delta文件
的
分区进行动态插入覆盖?
、
、
、
、
我是
pyspark
的
新手,正在寻找动态覆盖增量分区
的
方法。从其他在线可用
的
资源中,我可以看到spark通过将以下conf设置为" dynamic“来支持动态分区。spark.conf.set("spark.sql.sources.partitionOverwriteMode",“动态”) 但是,当我尝试用
数据
帧
覆盖partitioned_table时,
pyspark
(databricks)中
的
以下代码行覆盖了整个
表
浏览 3
提问于2020-06-08
得票数 1
1
回答
如何在Databricks中将
数据
框导出为excel
、
、
、
、
我想在一个excel表格中编写多个
数据
帧
,无论是熊猫、考拉还是
pyspark
,并像xlwx一样做一些奇特
的
事情(改变
单元
格
的
大小或颜色等),然后保
存到
S3存储桶中。我尝试过pandas.to_csv(s3.....test.xlsx),但这不是我想要
的
。
浏览 17
提问于2020-02-08
得票数 0
1
回答
PyArrow
表
到
PySpark
数据
帧
的
转换
、
、
我正在尝试将我
的
Pandas
数据
帧
转换为
PySpark
数据
帧
。createDataFrame函数不起作用,所以我找到了PyArrow。我可以转换PyArrow
表
--> Spark
表
,但是我
找不到
任何方法来转换Pandas
表
--> Spark谢谢
浏览 1
提问于2018-11-16
得票数 3
1
回答
Azure权限中
的
Databricks notebooks沿袭
、
、
如果我将文件从ADLS读取到
PySpark
数据
帧
中,并以不同文件格式写回另一个ADLS文件夹,那么在
配置
单元
中捕获
的
谱系是否会显示为这种操作
的
谱系?
浏览 24
提问于2021-09-28
得票数 0
1
回答
无法在
pyspark
中导入parse_url
、
、
对于
pyspark
中
的
hiveql,我有以下sql查询:df.select(split(parse_url(col('page.viewed_page'), 'HOST')))----> 1 from
pyspark
.sql.function
浏览 25
提问于2019-11-07
得票数 3
回答已采纳
1
回答
PySpark
-保存
配置
单元
表
- org.apache.spark.SparkException:无法识别
配置
单元
类型字符串
、
、
我正在将spark
数据
帧
保
存到
hive
表
中。spark dataframe是一个嵌套
的
json
数据
结构。我可以将
数据
帧
另存为文件,但它在上面创建了一个
配置
单元
表
时失败了,上面写着org.apache.spark.SparkException: Cannot recognize hive type string我不能先创建一个hive
表
模式,然后再将其插入其中,因为
数据</e
浏览 1
提问于2018-08-11
得票数 2
2
回答
Spark saveAsTable抛出NoSuchTableException
、
、
、
我正在使用
pyspark
的
(Spark 2.3.2) saveAsTable,如下所示: .sortBy("id") \ .option("path", "test_table.parquet") \在
表</e
浏览 1
提问于2019-10-10
得票数 0
4
回答
将
数据
帧
另存为外部
配置
单元
表
、
、
、
我已经使用了一种方法将
数据
帧
保存为使用parquet文件格式
的
外部
表
,但是有没有其他方法可以将
数据
帧
直接保存为
配置
单元
中
的
外部
表
,就像我们对托管
表
使用saveAsTable一样
浏览 0
提问于2016-05-31
得票数 5
1
回答
如何将HBase
表
作为
pyspark
数据
帧
读取?
、
有没有可能在不使用Hive或Phoenix或Hortonworks提供
的
spark-Hbase连接器
的
情况下直接以
Pyspark
Dataframes
的
形式读取Hbase
表
?我对Hbase比较陌生,
找不到
一个直接
的
Python示例来将Hbase
表
转换为
Pyspark
数据
帧
。我看到
的
大多数示例都是用Scala或Java编写
的
。
浏览 2
提问于2017-10-05
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
GitHub标星2400,Netflix开源笔记本工具Polynote
网络工程师学习笔记之交换网络基础
如何从Pandas迁移到Spark?这8个问答解决你所有疑问
一文轻松了解Mac引入Valn,老化机制转发流程通信概念16
一文让您全面了解清楚HBase数据库的所有知识点,值得收藏!
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券