腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
指定
Spark
Schema
不会
显示
正确
的
显示
结果
、
、
、
我为我
的
spark
代码
指定
了模式,但是
结果
都返回NULL。然而,当I inferSchema=True,header=True时,我得到了
正确
的
结果
。,StructField("country", StringType(), True)]) 当我应用模式将文件作为数据帧读入时,如下所示: testzip =
spark
.read.csv("adl://mylake.azuredatalakestore.
浏览 35
提问于2020-01-12
得票数 0
回答已采纳
1
回答
如何在scala
spark
中添加
指定
位数
的
前导零填充?
、
我有如下
的
data.txt文件。 12, 345, 6789 现在,我想在参数文件或标准输入
的
指定
字段中使用
指定
的
位数执行前导零填充。在参数文件
的
指定
字段中
指定
的
位数是8位。我该怎么办?这是我
的
代码: import org.apache.
spark
.sql.types._ import org.apache
浏览 142
提问于2019-07-01
得票数 4
回答已采纳
1
回答
在Azure Blob中访问临时存储dir
的
Pyspark错误
、
、
、
、
它似乎能够读取表,但当我想
显示
结果
时,会收到一个错误,指示它无法访问临时目录。如果我使用"wasbs“模式
指定
临时目录,则会得到以下错误:容器名称、帐户名称和帐户键是
正确
的
,所以我猜我没有
正确
地设置配置,但我已经尝试了我能想到
的
一切。我认为它
浏览 7
提问于2022-07-04
得票数 0
2
回答
火花数据文件-进程2 CSV文件
、
、
、
我是星火
的
新手。读取与CSV文件相关联
的
查询。file_type1 = "csv" infer_
schema
1= "
浏览 1
提问于2020-04-16
得票数 1
2
回答
当表已经存在时,使用
spark
dataframe覆盖表失败
、
、
、
我正在尝试使用
spark
dataframe完全覆盖postgres表。由于某些原因,即使当我
指定
postgres时,我也会得到一个relation already exists postgres错误。为什么我
的
代码不能像预期
的
那样覆盖数据库中
的
数据?这会
不会
是内存问题?会
不会
是queryTimeout?df.write.format('jdbc').options(
浏览 2
提问于2019-12-13
得票数 1
4
回答
带有标头
的
星火SQLContext查询
、
、
我见过这样
的
解决方案: .option("header", "true") //reading the headers .csv是否有方法
指定
CSV头并执行SQL SELECT查询?
浏览 1
提问于2018-12-20
得票数 0
回答已采纳
1
回答
火花kryo编码器ArrayIndexOutOfBoundsException
、
、
我正在尝试使用
spark
和esri创建一个带有地理数据集
的
数据集。{Encoder, Encoders, SQLContext} Seq(new Foo(new Point(0, 0), "bar")).toDS.show} 线程"main“中
的
异常org.apache.
spark
.sql.Dataset.showString(Dataset.sca
浏览 4
提问于2016-07-21
得票数 1
1
回答
Apache火花
spark
.read未按预期工作
、
、
、
、
我正在学习IBM Apache
Spark
。我正在使用HMP数据集。我遵循了教程中
的
说明,但代码并没有按预期工作。这是我
的
代码:
浏览 6
提问于2020-02-03
得票数 0
回答已采纳
3
回答
为什么在使用架构查询时所有字段都为空?
、
、
、
我使用在case类和编码器
的
帮助下
指定
模式
的
结构化流来获取流数据。val sampleLogSchema = Encoders.product[SampleLogEntry].
schema
.readStream .option("delimiter", "|") .
schema<
浏览 3
提问于2019-11-23
得票数 3
回答已采纳
2
回答
电火花数据帧空数组仍然有1
的
大小吗?
、
、
我
的
问题与有关,但它遇到了一个新问题。import pyspark.sql.types as T new_customers =
spark
.createDataFrame(data=[["Karen", ["a"]], ["Penny", ["b"]], ["John", [None]], ["Cosimo", ["d"]
浏览 4
提问于2022-09-12
得票数 0
1
回答
用向后兼容模式读取星火中
的
旧数据
、
、
、
我已经将一些较旧
的
数据存储在带有模式
的
parquet中。每次我尝试用
spark
.read.parquet("test_path").as[B].collect()读取数据时,我都会得到以下异常: 是否有方法为我
的
所有数据
指定
一个向后兼容
的
架构?
浏览 0
提问于2017-11-07
得票数 2
回答已采纳
3
回答
如何在Hive表中为数据集创建模式?
、
、
、
、
我需要重新组织和组
的
用户id互动
的
基础上附加
的
json图像格式准备。 StructField("count", LongType(), True)]))), True)
schema
= StructType(fields)这个模式
正确
吗?
浏览 0
提问于2017-05-09
得票数 0
2
回答
Pyspark发出将tsv文件加载为数据文件
的
问题。
、
下面的数据作为标签分隔格式
的
.txt文件存储在blob存储中。我使用pyspark.sql将数据作为pyspark.sql.df加载到databricks中。 [ (203, 'bar'),然后使用以下代码读取数据: df =
spark
.read.csv("/fi
浏览 8
提问于2020-04-11
得票数 1
2
回答
form_json返回空值
、
我尝试使用from_json解析字符串列(包含json字符串),但当我
显示
结果
数据帧时,它将所有值
显示
为null。我使用所有类型作为字符串,所以应该
不会
有任何类型转换问题,但最终
结果
仍然是空
的
。我可以
显示
我
的
originaldf,它会
显示
json字符串。mytype", "version": "0.2", "id": "dc771a5f-336e-4f65
浏览 19
提问于2019-07-15
得票数 1
回答已采纳
1
回答
Databricks模式强制执行问题
、
、
、
、
正如关于
的
文章中所建议
的
那样,声明
的
模式有助于早期发现问题。表列上
的
注释被视为模式中
的
差异。'""") 这将在AnalysisException中失败:
指定
的
模式与/my_table_locationnull结构字段
浏览 2
提问于2021-04-28
得票数 2
1
回答
Cloudera中
的
Oozie火花操作未启用火花历史记录
、
、
、
、
我试图按照这个指示启用历史日志与火花Oozie
的
行动。要确保您
的
星火作业
显示
在星火历史服务器中,请确保
指定
这三个星火配置属性,无论是使用--conf还是从oozie.service.SparkConfigurationService.
spark
.configurations中
指定
。
spark
.eventLog.enabled=true <action name="
spark
-9e7c">
浏览 0
提问于2016-07-29
得票数 2
回答已采纳
2
回答
描述表--请参见哪些列不是NULL
、
、
、
然而,以下声明不告诉我哪些列是空
的
,哪些是非空
的
。DESCRIBE TABLE EXTENDED也是如此。我怎么才能得到完整
的
描述?
浏览 9
提问于2022-01-28
得票数 1
回答已采纳
3
回答
使用
spark
.read.format("com.crealytics.
spark
.excel")
的
inferSchema对日期类型列进行双重推断
、
、
、
、
我正在编写
spark
.read.format("com.crealytics.
spark
.excel"),PySpark (Python3.6和
Spark
2.1.1),并试图使用从excel文件中获取数据示例: df =
spark
.read.format("com.crealytics.
spark
.excel").\
浏览 3
提问于2017-08-16
得票数 1
回答已采纳
3
回答
如何在不使用Scala case类
的
情况下为CSV文件
指定
模式?
、
、
conf=new SparkConf().setAppName("dataframes").setMaster("local")val
spark
=SparkSession.builder().getOrCreate() option("head
浏览 0
提问于2016-11-17
得票数 15
回答已采纳
2
回答
阿帕奇火种熊猫
我是阿帕奇星火公司
的
新手。我创建了模式和数据框架,它
显示
了
结果
,但是格式不太好,而且非常混乱。我几乎看不懂这句话。所以我想以熊猫
的
形式展示我
的
成绩。我附上了我
的
数据帧
结果
的
屏幕截图。但是我不知道如何用熊猫来展示我
的
结果
。StructField("Outcome_type", StringType(), True), df =
spark</e
浏览 3
提问于2020-12-07
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
CAD测量结果显示为“0”?给我整不会了……
在Python中为什么同样的Cypher语句运行结果不会完整显示
Excel–按指定次数重复显示单元格,更简单的方法
Excel – 按指定次数重复显示单元格,更简单的方法
小技巧:如何改变SPSS菜单和输出结果的显示语言
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券