腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
无法
查看
RDD
内容
、
我正在使用scala创建一个
RDD
,但是当我尝试
查看
RDD
的
内容
时,我得到的结果如下我想看看
RDD
的
内容
,怎么才能看到呢
浏览 11
提问于2016-08-24
得票数 1
回答已采纳
2
回答
Apache在内存缓存中的火花
、
、
火花将工作数据集缓存到内存中,然后以内存速度执行计算。有没有一种方法可以控制工作集在RAM中驻留多长时间?
浏览 2
提问于2014-11-11
得票数 8
回答已采纳
10
回答
如何打印
RDD
的
内容
?
、
我正在尝试将集合的
内容
打印到Spark控制台。我有一个类型:我使用下面的命令:但这是打印出来的: 如何将
RDD
写入控制台
浏览 490
提问于2014-04-20
得票数 130
回答已采纳
2
回答
RDD
[(K,V)]是
RDD
[(K,V)]中的一个类型吗?
、
在/core/src/main/scala/org/apache/spark/SparkContext.scala,的spark文件中,有以下
内容
(implicit kt: ClassTag[K], vt: ClassTag[V], ord: Ordering[K] = null) ={ new PairRDDFunctio
浏览 1
提问于2014-05-12
得票数 0
回答已采纳
6
回答
查看
Python火花中的
RDD
内容
?
、
README.md")我想使用foreach操作
查看
RDD
内容
:这会引发语法错误:我遗漏了什么?
浏览 3
提问于2014-08-13
得票数 53
回答已采纳
4
回答
星火之火(
rdd
.map)(_.swap)
、
有谁能解释一下?如果我
查看
Scala/Spark,就
无法
在
RDD
类中找到swap方法。
浏览 8
提问于2016-01-08
得票数 5
回答已采纳
1
回答
persisted可以跨作业使用持久化的
rdd
吗?
、
我要把一个
RDD
保存到磁盘上。但我
无法
判断它是否会在整个工作中重复使用。一般来说,通过
查看
工作历史,你如何判断
rdd
是被重新计算了还是简单地脱水了?
浏览 7
提问于2016-06-09
得票数 1
0
回答
Spark将
rdd
字段值替换为另一个值
、
、
、
、
我可以使用以下命令
查看
elasticsearch数据库中第一个
RDD
的
内容
:>>>(u'1', {u'name': u'john'})name=kvs.map(lambda x: x[1])>>>>robert 我打算用"robert“
浏览 3
提问于2016-12-30
得票数 1
4
回答
在DataFrames上执行
RDD
操作
、
、
、
、
我需要在这些DataFrame上执行
RDD
操作。是否可以执行map、flatMap等
RDD
操作。下面是我的示例代码:这是我的dataframe,我需要将这个dataframe转换成
RDD
,并在这个新的
RDD
上操作一些
RDD
下面是我如何将dataframe转换为
RDD
的代码
RDD
<Row> java = df.select("C
浏览 2
提问于2016-12-14
得票数 0
1
回答
在Spark Python中使用map操作弹性分布式数据集
、
、
我使用numpy的arange创建了一个数组,并希望使用spark.sparkContext.parallelize将该数组转换为
RDD
。np_array = [np.arange(0,300)]times_twelve =
rdd
_numbers.map(lambda
rdd
_numbers:
rdd
_numbers * 12) 我现在想做一个称为times_twelve的随机数描述,它基本上
浏览 3
提问于2017-04-30
得票数 0
1
回答
Apache (Scala) -打印一个
RDD
/ pairRDD的条目
、
、
、
在使用
RDD
时,我按键对
RDD
中的项进行了分组。如果我似乎
无法
按键访问
RDD
中的项,那么拥有密钥又有什么意义呢?在我将filter降到单个项目的那一刻,我仍然有一个
RDD
,因此我必须在
RDD
上做一个foreach才能打印出来:你可能会问我为什么要这么做!之所以会出现这种情况,是因为为了自己的测试目的,我只是想“看看”
浏览 2
提问于2015-03-20
得票数 1
回答已采纳
3
回答
在Spark中向文本文件添加新行
、
有没有一种方法可以在不将
RDD
转换为Array的情况下做到这一点? 谢谢!
浏览 0
提问于2015-04-28
得票数 6
3
回答
RDD
的缓存什么时候过期?
、
我们在
RDD
上使用.cache()对数据集进行持久缓存,我关心的是缓存何时过期?dt.cache()
浏览 0
提问于2016-05-10
得票数 11
回答已采纳
2
回答
为什么shell
无法
加载带有
RDD
导入的类的文件?
、
当我试图加载类时,我会得到以下编译错误: 这是我正在处理的代码
浏览 2
提问于2017-06-09
得票数 3
回答已采纳
1
回答
Python火花中来自两种不同
RDD
的字符串连接
、
、
、
、
假设我有2个
rdd
:第一个
rdd
由字符串组成,这些字符串是html请求:serverIP:80 clientIP1 - - [10/Jun/2016:10:47:37 +0200] "第二个
rdd
是简单的整数:0.025...我想按行连接字符串行,以便获得如下第三个
rdd
:
rdd
3 : serverIP:80 clientIP1 - - [10/Jun/2016:10:47:
浏览 5
提问于2016-07-11
得票数 0
回答已采纳
1
回答
文档相关性的余弦相似度计算
、
、
我已经进行了归一化TF-以色列国防军和关键字
RDD
,现在想要计算余弦相似度,以找到相关评分的文档。
浏览 2
提问于2019-09-25
得票数 0
回答已采纳
1
回答
卡夫卡直接流dstream地图不打印
、
、
、
._2) println("--- New
RDD
with " +
rdd
.partitions.length + " partitionsand " +
rdd
.count() + " flight records"); val flightRows = FlightParser.parserow
浏览 1
提问于2016-04-12
得票数 2
回答已采纳
1
回答
在列表python中存储for循环中的
内容
、
、
、
、
我试图计算每个
RDD
(可以视为文件)中使用for循环的列表‘name’中给出的单词实例数。我希望将每个文件中一个单词的计数存储在一个名称相同的单词列表中。rdds = [hp1
RDD
,hp2
RDD
,hp3
RDD
,hp4
RDD<
浏览 5
提问于2015-11-05
得票数 0
回答已采纳
1
回答
Spark mllib.stat.Statistics - kolmogorovSmirnovTest CDF
、
、
、
我正在
查看
spark的示例HypothesisTestingKolmogorovSmirnovTestExample.scala,但似乎
无法
弄清楚CDF方面。{SparkConf, SparkContext}import org.apache.spark.
rdd
.
RDD
val data:
RDD
[Double] = sc.parallelize(Seq(0.1, 0.15, 0.2, 0.3, 0.25)) &
浏览 17
提问于2017-01-13
得票数 2
1
回答
如何避免使用Scala类型重载泛型Spark
RDD
的方法?
、
我有一个这样的方法: def save[T](index: String, data:
RDD
[T]) = { [A <: Product](
rdd
: org.apache.spark.
rdd
.
RDD
[A])(implicit evidence$1:
浏览 19
提问于2020-04-25
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Windows server无法查看日志解决
嵌入文档的PDF无法查看处理方法
QuickLook-0.3.5—不用打开软件查看文件内容
今日暂不更新 明日更新内容 请点击查看
是不是发现无法打开教务处查看课表?
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券