腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(1133)
视频
沙龙
1
回答
如何
使用
spark
-
operator-k8
在
RabbitMQ
中
监听
Q
,
然后
使用
amqp
消息
作为
作业
参数
触发
spark
作业
?
、
我有一个能够
使用
kubectl命令运行的
spark
-operator-k8s。但现在我想把它
作为
rabbitmq
的消费者。此外,欢迎对这种方法提出建议,我想了解是否有更好的方法来实现这一点。
浏览 8
提问于2020-03-23
得票数 0
2
回答
Laravel,
RabbitMQ
和运行远程生成的
作业
、
、
我会以承认轻度睡眠不足
作为
开场白。API端点(服务器A)接收传入呼叫,并将其添加到
RabbitMQ
服务器(服务器B)上的特定队列
中
。Laravel Installation (Server )是我们实际的Laravel,它的目的是
在
特定队列上查找
作业
,并与它们一起执行任务。我们
在
Laravel安装中有一个
RabbitMQ
包,它允许
在
RabbitMQ
连接上
使用
常规的Laravel队列机制。我遇到的问题是,
浏览 2
提问于2017-07-03
得票数 2
回答已采纳
1
回答
如何
使用
Google客户端
使用
相关的DataProc桶
中
的jar文件和类提交火花
作业
?
、
、
、
我需要
触发
Spark
使用
API调用从JSON文件聚合数据。我
使用
spring引导来创建资源。因此,解决方案的步骤如下:
使用
指定的jars、类从REST方法
中
触发
聚合
spark
作业
,
参数
是json文件链接。我希望
使用<
浏览 1
提问于2016-02-24
得票数 5
回答已采纳
1
回答
使用
JDBC连接到EMR上的
Spark
SQL
、
、
、
、
我已经
在
EMR上运行了
spark
,并且我一直
在
尝试
使用
JDBC hive驱动程序从SQLWorkbench连接到
spark
-SQL,但都是徒劳的。我已经
在
EMR上启动了thrift服务器,并且能够从Tableau/SQL Workbench连接到端口10000(默认)上的Hive。当我试图运行一个查询时,它会
触发
一个Tez/Hive
作业
。但是,我想
使用
Spark
运行查询。
在
电子病
浏览 1
提问于2016-11-19
得票数 1
2
回答
将命令行
参数
提交给气流
中
的pyspark
作业
。
、
、
我
在
GCP Dataproc上有一个可以
在
气流
中
触发
的火花放电
作业
,如下所示: "properties": config["
spark
_properties"] },
浏览 13
提问于2022-03-25
得票数 4
回答已采纳
3
回答
如何
在
Spark
中
实现自定义
作业
监听
器/跟踪器?
、
我
在
yarn上
使用
spark
1.0并
使用
Java API。JavaSparkContext( "MyJavaWordCount", System.getenv("
SPARK
_EXAMPLES_JAR")); J
浏览 1
提问于2014-06-28
得票数 14
1
回答
使用
Shell脚本文件提交
Spark
作业
、
我试图通过
spark
-submit命令给我的Main函数一个
参数
,但当我尝试执行shell文件时,
作业
失败并返回错误:因为我
在
代码中
使用
了match-case。_2.11-0.1.jar \因此,'xyz‘是我
在
命令
中
传递的字符串。目前我已经硬编码了它,它仍然不能工作,我想把它
作为
参数
动态地传递给shell文件。
浏览 1
提问于2017-11-30
得票数 2
2
回答
避免对
spark
微批进行排队
、
我已经创建了
spark
应用程序,它从Apache flume获取输入数据。我将
spark
批处理间隔设置为4分钟,这样
spark
将每隔4分钟处理一次数据。但是我有一些昂贵的
spark
批处理,这需要相当多的时间(比如30分钟),所以在这段时间内,大约7个
spark
批处理将在队列中等待,一旦昂贵的批处理执行完成,它将一个接一个地开始处理。如果我的
spark
批处理正在执行,并且耗时超过4分钟,我不想在队列
中
添加下一个
spark
批处理。
浏览 1
提问于2019-09-28
得票数 3
1
回答
如何
在AWS EMR
中
停止长时间运行的
spark
流步骤
、
、
、
、
我
使用
AWS EMR进行
spark
流媒体。我
在
EMR
中
添加了一个从Kinesis流读取数据的步骤。我需要的是一种方法来停止这个步骤并添加一个新的步骤。现在,我从
Spark
驱动程序中产生一个线程,
监听
SQS队列
中
的
消息
,并在收到
消息
时调用sparkContext.stop()。我
使用
Chef来实现部署自动化。因此,当有新的工件时,一条
消息
被放入SQS,EMR读取它并停止该步骤。Chef
然后</
浏览 10
提问于2016-09-13
得票数 1
1
回答
Oozie上的Apache
Spark
:提供额外的配置文件?
、
、
、
我们希望
使用
Hue和Oozie,因为运行这些
作业
的人将更习惯
使用
基于浏览器的界面,而不是
在
Oozie XML配置中胡乱操作或在命令行上
触发
spark
-submit。我已经知道
如何
通过Hue (3.10)运行一个基本的Oozie/
Spark
Action。但我们希望能够在运行时通过配置文件提供各种非
Spark
参数
,就像您为普通Scala应用程序所做的那样。我尝试了各种不同的排列方式,例如在Hue
中</
浏览 1
提问于2017-02-06
得票数 0
7
回答
检查
Spark
流
作业
是否挂起的最佳方法
、
、
、
我有
Spark
streaming应用程序,它基本上从Kafka获得
触发
消息
,这启动了批处理,这可能需要2个小时。有一些事件,其中一些
作业
无限期地挂起,并且没有
在
通常的时间内完成,目前我们无法
在
不手动检查
Spark
UI的情况下确定
作业
的状态。我想知道当前正在运行的
spark
作业
是否挂起的方法。我知道我可以
使用
驱动程序和执行器的度量标准。如果我要选择最重要的一个,它将是最后收到的批处理记录。当为St
浏览 6
提问于2018-10-18
得票数 8
1
回答
查找火花
作业
输出文件的位置
、
我正在AWS上的EMR集群
中
测试火花放电
作业
。目标是
使用
Lambda函数
触发
火花
作业
,但现在我正在手动运行火花
作业
。因此,我将SSH发送到主节点,
然后
运行
spark
作业
,如下所示:我的桶
参数
传递给火花
作业
。hdfs://ip-xxx-x
浏览 4
提问于2019-12-03
得票数 0
1
回答
从代码
中
按需启动火花
作业
。
、
从企业应用程序( Java或Scala)
中
按需启动星火
作业
的推荐方法是什么?有一个处理步骤,目前需要几分钟才能完成。我想
使用
星火集群将处理减少到15秒以下:
参数
将
作为
命令行
参数
传递给JAR。星火
作业
然后
从数据库
中
获取源数据。问题1:
如何
在企业应用程序
中
按需启动火花
作业
?
Spark
集群(独立的)位
浏览 4
提问于2016-08-06
得票数 2
回答已采纳
1
回答
将
消息
从
rabbitmq
通道传递到java NIO通道
、
、
我正在为一个应用程序构建一个聊天组件(其中所有讨论都被保存),我计划有一个长轮询服务器
作为
客户端机器和
rabbitmq
服务器之间的接口,它将解析格式并将队列
中
的
消息
排入
作业
队列(
在
rabbitmq
上),由芹菜处理,
然后
将检查是否允许张贴,通过检查数据库
中
的一些信息等,将
消息
保存到数据库
中
,并再次将它们排入
rabbitmq
中
,这一次将由长轮询服务器
使用</e
浏览 1
提问于2012-03-19
得票数 0
回答已采纳
1
回答
如何
从Azure函数调用Azure数据库
中
的
作业
/任务
、
、
、
、
我需要开发一个事件驱动的管道,它应该在ADLS2文件到达时
触发
,即ABFS。
在
文件到达时,我需要
触发
集群上的4个后续
Spark
作业
。对于编排
Spark
,我可以
使用
Databricks
作业
作为
选项,这样就可以
在
管道
中
触发
作业
。 但是,只有
在
文件到达后才能
触发
第一个
作业
。一种解决方案可能是
使用
Az
浏览 9
提问于2022-06-22
得票数 -1
回答已采纳
1
回答
如何
在本地构建和运行Scala
Spark
、
、
、
我正在尝试
在
本地构建Apache
Spark
。这样做的原因是为了调试像reduce这样的
Spark
方法。特别是,我对
Spark
如何
在幕后实现和分发Map Reduce很感兴趣,因为我遇到了性能问题,我认为从源代码运行这些任务是找出问题的最好方法。所以我从
Spark
repo克隆了最新的:
Spark
似乎是一个Maven项目
浏览 0
提问于2014-05-26
得票数 3
回答已采纳
1
回答
如何
在Perl
中
处理AnyEvent、
RabbitMQ
(心跳)和长时间运行的
作业
?
、
、
、
、
我正在实现一个用于分布式cron
作业
执行的系统(称为cron计算集群)。当操作时间存在时,应将Cronjobs排队到
消息
队列(
RabbitMQ
)
中
。请参见下面的代码片段,用于
在
Perl守护进程工作程序
中
执行实际的cron
作业
。它是
在
‘AnyEvent->定时器’内实现的,而不是DoSing
RabbitMQ
用于
消息
。'
RABBITMQ
_ERROR', @_ ) }, )
浏览 2
提问于2016-01-18
得票数 3
回答已采纳
1
回答
不能让斯派克
在
AWS EMR上
使用
超过几%的资源
、
、
我一直试图
在
AWS EMR和
Spark
集群模式下运行一个
Spark
作业
,没有任何设置的组合会导致
作业
最多
使用
总可用资源的几%。.load("input_file.csv")以下是所有节点的典型CPU
使用
率图表(主节点从20%开始,
然后
下降,其他节点都是从节点):上
浏览 0
提问于2018-04-07
得票数 2
1
回答
在
POST/批请求中
使用
现有的SparkSession
我试图
使用
Livy远程提交几个
Spark
作业
。我用来做这个 我知道我可以
使用
spark
-submit Livy 提供上述Livy命令
中
的所有选项。但是,由于我必须远程制作超过250个
spark
-submit,所以我想利用Livy的会话管理功能;也就是说,我希望Livy只创建一次SparkSession,
然后
将其用于所有
spark
-submit请求但是,
在
session
中
没有看到
参数</
浏览 0
提问于2018-08-08
得票数 1
回答已采纳
1
回答
用于处理保存在HDFS
中
的小型二进制文件的
Spark
架构
、
、
、
、
上传完成后,web应用程序将此文件和目录放入HDFS,
然后
在
kafka上发送带有此文件路径的
消息
。
Spark
应用程序从kafka streaming读取
消息
,
在
master(驱动程序)上收集它们,
然后
处理它们。我首先收集
消息
,因为我需要将代码移动到数据,而不是将数据移动到接收
消息
的位置。我理解
spark
将
作业
分配给已经
在
本地有文件执行程序。hadoop小文件
中
的其
浏览 0
提问于2017-01-05
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
携程实时计算平台架构与实践
Rabbitmq-消息队列
Spark高性能优化一:让你拥有大牛的开发理念
高性能Spark作业基础:你必须知道的调优原则及建议
flink和spark Streaming中的Back Pressure
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券