腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
spark
广播
变量
中
的
getvalue
()
方法
和
value
()
方法
有
什么
不同
、
当我使用get
value
()
方法
时,我仍然可以访问这些
变量
,但是当我使用
value
方法
时,它抛出错误,这是正确
的
。
浏览 13
提问于2017-02-16
得票数 0
1
回答
来自局部函数
的
PySpark
广播
变量
、
、
我正在尝试从Python
方法
中
创建
广播
变量
(尝试抽象一些我正在创建
的
依赖于分布式操作
的
实用程序
方法
)。但是,我似乎不能从
Spark
workers
中
访问
广播
变量
。sc.broadcast(someValue) element *= V.
value
sc.bro
浏览 0
提问于2014-11-17
得票数 12
回答已采纳
1
回答
仅使用
Spark
时
广播
变量
的
使用
、
、
当使用
spark
时,我们可以使用
广播
变量
来优化火花分配不变状态
的
方式。 1)
广播
变量
是如何内部工作
的
?当从闭包
中
引用
广播
变量
句柄时,就像上面所说
的
那样,它将像其他
变量
一样被序列化--只是
广播
变量
句柄本身不包含实际对象。当闭包到达调用broadcastVar.
value
的
点时,
广播
变量<
浏览 0
提问于2020-11-04
得票数 3
回答已采纳
1
回答
激发RDD/DF作为类
的
变量
成员。它会影响性能吗?
、
、
、
但是,这会导致每个分区
的
rddToTransform被序列化多次吗? rddToTransform.complexTransformations2InvlovingAnotherRdd} 我可以给出一个
广播
变量
的
例子假设我们
有
一个大数据
浏览 0
提问于2018-11-06
得票数 0
回答已采纳
1
回答
将
广播
变量
(databricks)
中
的
数据写入azure blob
、
、
、
、
我尝试过将数据保存在数据
中
并将df写到挂载位置,但是数据在GBs
中
是巨大
的
,并且我得到了
spark
.rpc.message.maxSize (268435456字节)错误。我尝试过将数据保存在
广播
变量
中
(它成功地保存了数据),但我不知道如何将数据从
广播
变量
写入挂载位置。下面是如何在
广播
变量
中保存数据
spark
= SparkSession.builder.appName(
浏览 3
提问于2022-04-22
得票数 0
4
回答
Spark
局部
变量
广播
到executor
、
、
、
Bob" -> "Canada")sc.parallelize(names).flatMap(broadcastMap.
value
.get).collect.foreach(println) Canada我在YARN模式下运行这个
spark
作业,我确信驱动程序
和
执行器不在同一个node/JVM
中</em
浏览 1
提问于2019-09-19
得票数 0
1
回答
广播
‘对象’没有属性‘破坏’?
、
、
在我
的
pyspark代码
中
,我声明了一个
广播
变量
。最后,我想销毁这个
变量
,但是 br = sc.broadcast(my_
value
)br.destroy() 我
的
spark
版本是1.6.1,而
浏览 1
提问于2017-07-19
得票数 0
回答已采纳
1
回答
火花:试图在它被摧毁后使用
广播
。
、
oldTargetIdxb.destroy new RDDLabeledPoint(newdata,copyColumnMap,newtargetmap,ilp.name)但是,在
方法
的
末尾销毁了
广播
变量
之后,RDD
中
的
newtrgt
变量
也被销毁了。问题是,一旦从该
方法
返回RDD,任何代码
中
的
任何分析师都可以使用RDD。所以,我似乎失去了对
广播</em
浏览 0
提问于2018-06-20
得票数 0
6
回答
DataFrame连接优化-
广播
哈希连接
、
、
、
我试图有效地加入两个DataFrames,其中一个是大
的
,第二个是小
的
。有没有办法强迫
广播
忽略这个
变量
?
浏览 6
提问于2015-09-07
得票数 48
1
回答
临时视图
和
自动
广播
加入错误
、
、
我
有
一个查询(如下所示),当我运行它时,有时
Spark
会抛出这个错误-我们从源中提取数据,并在临时视图中
的
不同
步骤
中
应用几个转换逻辑。谁能帮助我理解这个错误
的
原因,并减轻同样
的
错误。虽然set
spark
.sql.autoBroadcastJoinThr
浏览 1
提问于2019-09-30
得票数 0
1
回答
星火
广播
--没有空指针
的
HashMap,但它也不获取任何值
、
、
我正在
广播
一个hashmap并从下面的
方法
返回一个映射。LookupUtil.loadLookup(ctx, FilePath); codePairMap= CodeBC.
value
Exception e) { } } 并将映射传递给下面的
方法
在
方法
中看到
浏览 1
提问于2016-05-27
得票数 1
回答已采纳
1
回答
用列表/元组过滤数据帧中火花
广播
变量
的
相关性
、
、
假设我
有
一个用例,需要使用python列表
中
的
值来子集
spark
数据框架。我不明白如果我使用普通python列表 v/s
广播
变量
来完成这个任务,会有
什么
不同
。Eg:df =
spark
.createDataFrame([('1','A'),('2','B'
浏览 4
提问于2021-08-19
得票数 1
回答已采纳
2
回答
Spark
broadcast join将数据加载到驱动程序
据我所知,当
Spark
执行
广播
连接时,它首先收集最小
的
(
广播
) RDD给驱动程序,从它生成一个
广播
变量
,然后才将其上传到每个目标节点。如果
广播
RDD >
spark
.driver.memory,有时会导致驱动程序内存溢出。示例:假设您有3个节点<em
浏览 0
提问于2016-10-28
得票数 5
1
回答
火花流
和
可变
广播
变量
、
、
我找到了这个链接,它显示了一个实现,在这个实现
中
,
广播
变量
正在被更新。这是否是一个有效
的
实现意味着执行者将看到
广播
变量
的
最新值?
浏览 3
提问于2016-09-27
得票数 1
回答已采纳
1
回答
在Apache
spark
中
跨执行器共享数据
、
、
、
、
我
的
SPARK
项目(用Java编写)需要跨执行器访问(选择查询结果)
不同
的
表。这个问题
的
一个解决方案是: 表非常大,因此创建大容量
的
Map并将其作为
广播
变量<
浏览 0
提问于2018-12-18
得票数 0
回答已采纳
2
回答
如何在不指定每一列
的
情况下将整行作为参数传递给
Spark
(Java)
中
的
UDF?
、
、
还有一个
广播
变量
,即HashMap。
广播
变量
final Broadcast<HashMap<String, HashMap&
浏览 10
提问于2017-05-22
得票数 3
1
回答
广播
变量
何时可以更改?
、
我被告知
广播
变量
应该是不可变
的
。 rdd -> {/*MARK*/ rdd.foreac
浏览 0
提问于2018-01-02
得票数 3
1
回答
在火花中,
广播
是如何工作
的
?
、
、
这是一个非常简单
的
问题:在
spark
中
,可以使用broadcast有效地将
变量
发送到执行器。这是怎么回事? 何时发送值:当我调用broadcast时,还是何时使用这些值?访问简单
变量
和
广播
变量
有
区别吗?当我调用.
value
方法
时,引擎盖下会发生
什么
?
浏览 0
提问于2016-11-18
得票数 15
回答已采纳
2
回答
如何在SparkContext类中使用getOrCreate()
方法
?我们通过该
方法
具体实现了
什么
功能
SparkContext Class
中
getOrCreate()
方法
的
用途是
什么
,如何使用?为此,我没有找到任何合适
的
示例(编码方面)。我所理解
的
是,使用上面的
方法
,我可以在应用程序之间共享
spark
上下文。我们这里所说
的
应用程序是
什么
意思?应用程序是提交给
spark
集群
的
不同
作业吗?如果是这样,那么我们应该能够使用在一个应用程序中注册
的
全局<e
浏览 4
提问于2017-06-06
得票数 2
1
回答
从
广播
地图中获取价值在
spark
中
花费了大量
的
时间
、
我
有
三个节点
的
Spark
集群。我正在准备一个map
和
广播
map,以便它在每个节点上都可用。但是从
广播
地图中获取数据需要花费大量
的
时间。
广播
地图
有
140万条记录。我是这样
广播
地图
的
:并通过这种方式获得价值:val sd_stud
浏览 0
提问于2019-11-21
得票数 0
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券