腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(181)
视频
沙龙
1
回答
如
何用
Scala
在
Spark
GraphX
中
寻找
特定
节点
与其
相邻
节点
的
交集
、
、
我是
spark
GraphX
的
新手,正在尝试分布式地计算
特定
节点
(例如ID =1
的
节点
)与
spark
graphx
中
的
邻居之间
的
交集
。然后,我使用collectNeighborIds找到
节点
ID =1
的
邻居id,并对其执行映射函数,以找到每个邻居并计算与选定
节点
( ID =1
的
节点</
浏览 56
提问于2019-08-20
得票数 2
回答已采纳
1
回答
生成图上运行星火
GraphX
算法
的
问题
、
我使用以下代码
在
星火
GraphX
中
创建了一个图形。(见)import org.apache.
spark
._import org.apache.
spark
.rdd.RDDContext") }现在,我可以访问图表并查看
节点
的
度数。但是,当我试图得到一些措
浏览 0
提问于2015-12-22
得票数 3
回答已采纳
1
回答
当使用
Spark
的
GraphX
分布式函数时,可以拥有可变属性
的
节点
吗?
、
、
、
我正在使用
Spark
的
GraphX
图形分析库查看。我注意到这个实现使用了一个带有几个可变成员(var成员)
的
。我想知道这样做是否会导致不正确
的
行为,因为
在
分布式实现
中
,相同
的
节点
可以
在
多个处理
节点
中复制。 我
的
问题不是关于这种实践在这个
特定
实现
的
上下文中
的
正确性,而是关于一般
的
。如果只是
在
顶点
浏览 0
提问于2017-04-05
得票数 0
1
回答
无法将查询传递到Yarn群集模式下
的
java
spark
程序
、
、
Talend 7.1、MapR6.0分发版、
Spark
2.2、查询可以有复杂
的
配置单元连接&有时用户甚至可以使用特殊字符反引号、!、tilda、@。如果子
spark
作业
在
Spark
Yarn客户端模式下运行,则任何查询都可以正常运行。
浏览 1
提问于2021-03-05
得票数 0
5
回答
星星之火:以编程方式获取集群核心
的
数目
、
、
、
、
我
在
纱线集群
中
运行我
的
火花应用程序。
在
我
的
代码
中
,我使用队列
中
可用
的
数字核心
在
我
的
数据集中创建分区:ds.coalesce(config.getNumberOfCores()); 我
的
问题是:如何通过编程方式而不是通过配置获得队列
的
可用核数
浏览 11
提问于2017-11-20
得票数 16
回答已采纳
1
回答
C#树
节点
类设计
、
我正在
寻找
一些关于如何组织层次树
节点
类
的
建议。我有一个层次树,它有一些与树相关
的
成员,
如
Parent、Children、AddNode()、RemoveNode()等,每个
节点
也使用
特定
于应用程序
的
数据。
在
阅读了大量
的
文章之后,我得到了两个可能
的
设计:p
浏览 2
提问于2015-11-15
得票数 2
回答已采纳
1
回答
基于apache超级集
的
kappa体系结构
、
、
在
互联网上有很多关于kappa体系结构
的
信息,
在
浏览了一些概念方面之后,我试图深入到一些更具体
的
方面。作为我
的
主要来源,我使用了。但是现在你想看看你如
何用
卡帕架构来做这件事,你加入了卡夫卡和火花。您可以将事件发送给kafka,并且可以
在
中
读取此类事件。卡夫卡将保留一个
特定
时期
的
信息,
如
的
答案所指出
的
。当我读到将超级集与
spark
连接时,它说应该
浏览 6
提问于2022-06-21
得票数 2
回答已采纳
3
回答
二维数组
中
的
最大路径和
、
、
、
路径由
相邻
的
整数组成,这些整数要么位于同一行,要么位于同一列,或者沿着向下
的
方向向下
的
对角线。现在,当看到这个问题时,动态编程解决方案在这里似乎是最合适
的
,因为这个问题
与其
他问题(
如
或 )相似。问题是,为了正确解决这个问题,您需要从矩阵
中
的
每个整数(
节点
)开始构建路径,而不仅仅是从左上角和右下角开始路径。最初,我想到了一种类似于解决方案
的
方法,在这种方法
中
,我可以从每个
节点
浏览 3
提问于2017-03-17
得票数 3
回答已采纳
2
回答
星火流mapWithState似乎周期性地重建完全状态
、
、
我正在开发一个
Scala
(2.11) /
Spark
(1.6.1)流项目,并使用mapWithState()来跟踪以前批中看到
的
数据。状态分布
在
多个
节点
上
的
20个分区
中
,使用StateSpec.function(trackStateFunc _).numPartitions(20)创建。在这种状态下,我们只有几个键(~100)映射到具有160.000个条目的Sets,这些条目
在
整个应用程序中都会增长。整个状态由3GB处理,集群
中<
浏览 0
提问于2016-03-16
得票数 16
回答已采纳
1
回答
为什么火花处理要花更长
的
时间?
、
我写了这个简单
的
例子:import time lines = lines.lower()2) res = rdd1.take(N) print(f"
Spark
processing: {end_time - start_time}")Regular processing:
浏览 0
提问于2022-02-21
得票数 0
2
回答
如何使用teradata sql对无向图
的
所有
节点
进行分组/列出
、
、
、
、
我有很多不同
的
数据。表
中
的
一组无向图(
如
相邻
列表关系,一个
节点
连接所有
节点
),我需要对所有单独
的
无向图进行分组。on b.adj_node=c.nodeon c.adj_node=d.node; 现在
浏览 0
提问于2016-02-18
得票数 0
7
回答
解决Apache
Spark
中
的
依赖关系问题
、
、
、
、
构建和部署
Spark
应用程序时
的
常见问题是: java.lang.ClassNotFoundException.object x is not a member of package y编译errors.java.lang.NoSuchMethodError
浏览 275
提问于2016-12-30
得票数 39
回答已采纳
3
回答
为什么连接失败与"java.util.concurrent.TimeoutException:期货超时后[300秒]“?
、
、
、
我用
的
是火花1.5。我有两份表格
的
数据:res1: org.apache.
spark
.sql.DataFrame = [basket_id: string,请注意,我
在
linkPersonItemLessThan500DF上使用
的
是linkPersonItemLessThan500DF,因为我打算稍后加入这两者。我现正跟进上述守则
的
内容如下: val userTripletRankDF = link
浏览 5
提问于2016-12-13
得票数 71
回答已采纳
4
回答
Google Dataflow对Apache
Spark
、
、
、
我正在调查、Google、Dataflow、和Apache ,以决定哪种解决方案更适合我们
的
大数据分析业务需求。我发现在
spark
平台中有
Spark
SQL和MLlib来进行结构化数据查询和机器学习。 我想知道谷歌数据流平台中是否有相应
的
解决方案?
浏览 2
提问于2015-11-04
得票数 32
回答已采纳
2
回答
只有单个线程使用多处理池使用PySpark执行并行SQL查询。
、
、
、
、
理想情况下,我希望拥有计算集群
中
的
每个任务
节点
:获取表
的
名称,从数据库
中
查询该表,并将该表保存为S3
中
的
Parquet文件(或一组Parquet文件)。我
的
第一步是让它在本地以独立模式工作。如果我正确地理解了这里
的
注释:,那么除非与执行并行JDBC查询相关
的
特定
问题,否则我试图做
的
事情应该是可能
的
。编辑:我正在特别
寻找
一种方法,允许我使用某种类型
浏览 0
提问于2018-11-21
得票数 2
回答已采纳
2
回答
文件系统提供商
在
星火中消失?
、
神秘
的
是,当我使用
Spark
时,我
的
自定义文件系统提供程序就消失了。该程序使用FileSystemProvider.installedProviders()列出它找到
的
文件系统提供程序。应该列出"gs“(如果我
在
非
Spark
上下文中运行相同
的
函数),但是当在Dataproc上使用
Spark
运行时,
浏览 2
提问于2016-09-14
得票数 2
2
回答
Spark
/ PySpark:按嵌套列表
的
任意项分组
、
、
、
、
我有一个嵌套列表,上面有ID:我想要实现
的
是,如果任何子列表
中
的
项目与另一个子列表
中
的
项匹配结果应该如下所示:“结果”
中
的
第一个列表与第四个列表匹配。第四个列表与第二个列表匹配,因此所有三个列表都应该合并到一个列表
中
。第三个列表
浏览 3
提问于2017-06-20
得票数 0
回答已采纳
1
回答
纱线模式下
的
Spark
文件记录器
、
、
我想创建一个自定义日志记录器,它从集群
节点
中
特定
文件夹
中
的
执行器
中
写入消息。我已经
在
SPARK
_HOME/conf/
中
编辑了我
的
log4j.properties文件,如下所示:root.logger=WARN,console但在两种模式
的
纱线日志
中
,我也会遇到这个错误(从纱线日志
中
输出火花簇模式)
浏览 6
提问于2018-01-15
得票数 3
回答已采纳
2
回答
在此浏览器对象
的
层次结构中继承
的
角色和责任
、
、
、
在下面的浏览器对象层次结构
中
,上述层次结构
中
的
每个对象都是为了针对管理html元素
的
特定
职责范围而创建
的
。在上面的层次结构
中
,您能否概述每个浏览器对象
的
角色和职责,包括由其子对象继承
的
Object?
浏览 0
提问于2015-12-22
得票数 0
回答已采纳
2
回答
从星火呼叫distcp
、
、
、
有人能告诉我什么是从HDFS复制文件到S3
的
最健壮
的
方式吗?
浏览 8
提问于2018-01-16
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Spark 和Hadoop MR 之间有什么区别?
想要月入30k以上,那么这门技术是必须了解的
01 初识 Spark 你应该知道的
Hadoop MapReduce与Apache Spark
大数据之spark基础知识
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券