腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
如何从
pySpark
中的
变量
中选择数据框中的列
、
我
在
python中有一个
pySpark
数据帧- from
pyspark
.
sql
.functions import col dataset = sqlContext.range(0, 100).select((col("id") % 3).alias("key")) 列名是key,我想使用
变量
选择此列。myvar = "key" 现在,我希望
在
select语
句中
使用myvar
变量
来选择此列 我
浏览 12
提问于2019-09-13
得票数 5
回答已采纳
1
回答
在
pyspark
SQL
语
句中
传递
变量
、
、
、
我试图
在
Spark
SQL
语
句中
插入多个
变量
,并在这里发现了一个类似的问题:我的问题是如何使用字符串
变量
(下面是部门
变量
)的多
变量
列表来执行此操作?它适用于浮点数/整型数。" 'A', 'B', 'C'", ## this is what's not working "salary": "100.00, 200.00&q
浏览 18
提问于2021-03-03
得票数 0
1
回答
Pyspark
:在运行时为when()子句动态生成条件
、
、
我已将csv文件读入
pyspark
dataframe。现在,如果我
在
when()子
句中
应用条件,那么当条件
在
runtime之前给出时,它会很好地工作。import pandas as pdfrom
pyspark
.
sql
import SQLContextfrom
pyspark
.
浏览 0
提问于2019-11-08
得票数 0
回答已采纳
1
回答
Spark
SQL
传递
变量
- Synapse (Spark池)
、
、
、
、
我有下面的SparkSQL (Spark pool -Spark3.0)代码,我想
传递
一个
变量
给它。我该怎么做呢?我尝试了以下几种方法:%%
pyspark
select * from silver.employee_dim
浏览 23
提问于2021-06-02
得票数 0
1
回答
根据
Pyspark
Dataframe中列的平均值过滤数据?
、
如何根据薪资大于平均薪资的情况,过滤数据框中的数据。df.select('name').filter((df'salary')>(avg'salary))
浏览 2
提问于2020-07-10
得票数 0
1
回答
Python
在
pyspark
.
sql
中使用列表参数,就像sas中的宏一样
、
我有一个列表,希望
在
pyspark
.
sql
语
句中
使用。VLIST=['afhjh', 'aikn5','hsa76'] INC=
pyspark
.
sql
("select * from table1 where VIG=$VLIST") 我尝试使用like sas
浏览 19
提问于2020-09-28
得票数 0
回答已采纳
1
回答
使用WithColumn将相同的值分配给所有
Pyspark
列元素
、
、
、
这是我的代码: for i, file in enumerate (glob.glob(path_csv1+"/"+sub_direct+"/*.csv")): df_spa = df_spa.withColumn("Batt_id", sub_direct) #d
浏览 3
提问于2020-11-06
得票数 0
回答已采纳
1
回答
星星之火-提交:将运行时
变量
传递
给星火脚本
、
、
、
、
我正在使用spark submit选项对
Pyspark
/SparkSQL脚本进行赋值,并且我需要将运行时
变量
(数据库名)
传递
给脚本。spark提交命令:电火花脚本 DF = sqlConte
浏览 2
提问于2017-07-25
得票数 0
回答已采纳
1
回答
将日期列表
传递
给
PySpark
中的
SQL
语句
、
、
、
在
将一些SAS代码转换为
PySpark
的过程中,我们在此代码中为where语句使用了一个宏
变量
。
在
适应
PySpark
的过程中,我试图向where语句
传递
一个日期列表,但是我总是会出错。我希望
SQL
代码能够从这3个月中提取所有数据。有什么指示吗?month_list = ['202107', '202108', '202109']
sql
_query = """
浏览 7
提问于2022-01-20
得票数 0
回答已采纳
1
回答
火花结构化流-无法解决"Kafka“格式( Cloudera集群上的木星笔记本)
、
、
、
、
我试图
在
我的Cloudera集群上使用Juputer笔记本电脑 (
PySpark
内核)运行一个示例的Spark结构化流应用程序,但是我似乎不能让它使用所需的包。": " --packages org.apache.spark:spark-
sql
-kafka-0-10_2.11:2.4.0 --master yarn --deploy-mode client
pyspark
-shell"import os os.e
浏览 1
提问于2019-07-15
得票数 1
1
回答
跨多个笔记本电脑建立数据库
SQL
Server连接
、
、
我找到了一些关于如何在
pySpark
数据库笔记本中
传递
变量
的。我很好奇我们是否可以
传递
SQL
Server连接,比如在Notebook A中设置host/database/port/user/pw,并在Notebook B上调用该连接。
浏览 10
提问于2020-05-20
得票数 0
回答已采纳
1
回答
MLlib regexTokenizer正在忽略重音
、
、
我正在用
pySpark
(Python3)测试MLlib标记器: # -*- coding: utf-8 -*- from
pyspark
.
sql
.functions import row_number # Creating-----------------------------+---------
浏览 9
提问于2020-01-07
得票数 0
2
回答
如何将字符串转换为不同的子字符串并将其放入
变量
中?
我有一个字符串
变量
,即:“黑色、白色、黄色”。问题是,我
在
sql
中使用Where子句,需要将字符串
变量
放入
sql
语
句中
。就像。从Products.color IN (?)产品中选择*但是,正确的语法应该从Products.color
浏览 1
提问于2018-03-14
得票数 0
回答已采纳
3
回答
java.io.IOException:无法运行程序"python3":CreateProcess error=2,系统找不到指定的文件
、
、
在
PYCHARM上运行
pyspark
程序时,我得到以下错误,Error:
在
windows命令提示符中运行相同的程序时,我遇到了类似的问题,并使用解决了这个问题。
浏览 9
提问于2021-08-08
得票数 9
1
回答
如何在气流中将参数
传递
给火花提交作业
、
但是,
pyspark
模块需要将session
变量
作为参数。我已经使用application_args将参数
传递
给
pyspark
模块。但是,当我运行dag时,submit操作符失败了,我传入的参数被认为是None类型
变量
。需要知道如何将参数
传递
给通过spark_submit_operator触发的
pyspark
模块。DAG代码如下:spark = SparkSe
浏览 1
提问于2021-11-24
得票数 0
2
回答
如何将值
传递
给表中的
pyspark
变量
?
、
、
这可能是一个愚蠢的问题,但我有一个表,其中的每一列都包含要
传递
给
变量
的值: select sfObject from db.tblwhere Id = {} 我看到的是一个名为sfObject的列,它的预期值为'ValueA‘,我得到一个
pyspark
.
sql
.dataframe.DataFra
浏览 1
提问于2020-06-10
得票数 1
回答已采纳
2
回答
通过SAS更改IMPALA
SQL
Select语
句中
变量
的长度
、
、
但是,我想在variable
传递
sql
语
句中
更改
变量
的长度,因为否则它将检索长度为32767的
变量
,这不是经过优化的。这就是我
在
SAS中所做的: connect to impala (dsn="somedsn"); select *var1 length=50 disconnect
浏览 0
提问于2021-01-25
得票数 1
回答已采纳
1
回答
如何在
pyspark
中将
变量
传递
给spark.
sql
查询?
、
、
如何在
pyspark
中将
变量
传递
给spark.
sql
查询?当我查询一个表时,它会失败,并返回一个AnalysisException。为什么?call last): File "/usr/local/spark-2.3.0-bin-hadoop2.6/python/
pyspark
/
sql
/
浏览 0
提问于2018-12-30
得票数 2
回答已采纳
5
回答
如何在不访问源代码的情况下检查.NET应用程序在哪种语言环境下运行?
、
、
、
它使用
SQL
Server数据库。它以本地计算机中Administrators组的用户成员身份运行。
在
我将机器添加到域之前,它工作得很好。因此,我将该计算机添加到一个域(Win 2003)中,并将用户更改为Power Users组的成员,现在, 问题:它试图执行的一些
SQL
语句
在
西班牙
语
本地化中是“神奇的”(其中,分隔浮点数而不是.)INSERT语
句中
的列数少于values子
句中
指定的值。values子
句中
的值数必须与INSERT语
句中</em
浏览 53
提问于2008-09-12
得票数 0
回答已采纳
1
回答
在运行
pyspark
时,将选项
传递
给python解释器的环境
变量
是什么?
、
、
、
有一个环境
变量
用于
在
调用
pyspark
时将额外的选项
传递
给python解释器。这个
变量
是什么? $>
PYSPARK
_DRIVER_PYTHON=ipython <WHAT_NAME_HERE?>="--pylab"
pyspark
在
official docs中没有提到,但我知道它确实存在。
浏览 20
提问于2021-08-11
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
PySpark,大数据处理的Python加速器!
如何在CDH集群上部署Python3运行环境及运行Python作业
Jupyter在美团民宿的应用实践
半小时搭建 spark 应用
Ecshop 2.x/3.x SQL注入/任意代码执行漏洞
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券