首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Spark 延迟调度策略

本文旨在说明 Spark 的延迟调度及其是如何工作的 什么是延迟调度 在 Spark 中,若 task 与其输入数据在同一个 jvm 中,我们称 task 的本地性为 PROCESS_LOCAL,这种本地性...延迟调度就是为此而存在的。...延时调度如何工作 函数TaskSetManager#getAllowedLocalityLevel是实现延时调度最关键的地方,用来返回当前该 taskSetManager 中未执行的 tasks 的最高可能...getAllowedLocalityLevel返回 myLocalityLevels(currentLocalityIndex) 时间间隔小于 myLocalityLevels(currentLocalityIndex) 对应的延迟时间...这里是延迟调度的关键,只要当前时间与上一次以某个 locality level 启动 task 的时间只差小于配置的值,不管上次是否成功启动了 task,这一次仍然以上次的 locality level

1K30
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    使用runqslower发现调度延迟问题

    怀疑是调度的延迟导致的。那么如何量化是不是内核的调度导致的呢?以及如何发现是什么原因导致的呢?...希望运行,但是得不到运行的时间统计,即run delay,也就是调度延迟。...那么问题来了,如果通过atop监控到某一个进程的run delay是2%,能说明那20ms的长尾延迟是因为调度延迟导致的吗?答案是不能。...所以atop可以统计出来宏观的run delay延迟占比,但是不能统计出来具体的调度延迟极端情况。...通过这样的方法,我们在问题现场上抓到了20ms+的长尾延迟确实是由于调度延迟导致的。 runqslower的改进 尽管知道了长尾延迟的原因,但是还是希望可以发现是由于哪个进程的影响导致了延迟。

    2.2K40

    数据本地化及延迟调度

    Spark数据本地化即移动计算而不是移动数据,而现实又是残酷的,不是想要在数据块的地方计算就有足够的资源提供,为了让task能尽可能的以最优本地化级别(Locality Levels)来启动,Spark的延迟调度应运而生...id val partitionsToCompute: Seq[Int] = stage.findMissingPartitions() ... // 通过getPreferredLocs方法获取rdd...延迟调度策略 若spark跑在yarn上,也有两层延迟调度,第一层就是yarn尽量将spark的executor分配到有数据的nodemanager上,这一层没有做到data locality,到spark...延迟调度的目的是为了较小网络及IO开销,在数据量大而计算逻辑简单(task执行时间小于数据传输时间)的情况下表现明显。...Spark调度总是会尽量让每个task以最高的本地性级别来启动,当一个task以X本地性级别启动,但是该本地性级别对应的所有节点都没有空闲资源而启动失败,此时并不会马上降低本地性级别启动而是在某个时间长度内再次以

    1.2K20

    Kotlin中的延迟属性(lazy properties)

    属于Kotlin中的委托属性这一章中的标准委托 延迟属性Lazy lazy() 是接受一个lambda 并返回一个 Lazy 实例的函数,返回的实例可以作为实现延迟属性的委托。...延迟属性Lazy 与 lateinit 区别 以下是lateinit var和by lazy { ... }委托属性之间的显著差异: lazy { ... }代表只能用于val属性,而lateinit...by lazy { ... }反过来又定义了属性的唯一初始化器,只能通过覆盖子类中的属性进行更改。如果您希望以预先未知的方式从外部初始化属性,请使用lateinit。...另外,还有一个方法没有提到Delegates.notNull(),它适用于non-null属性的延迟初始化,包括Java原始类型的属性。...延迟属性Lazy 与 lateinit 使用总结 lateinit用于外部初始化:当需要外部资料通过调用方法初始化您的值时。

    3.5K30

    java 反射机制--根据属性名获取属性值

    1.考虑安全访问范围内的属性,没有权限访问到的属性不读取 [java] view plain copy /**      * 根据属性名获取属性值      *       * @param fieldName...   try {              Field field = object.getClass().getField(fieldName);   //设置对象的访问权限,保证对private的属性的访问...field.get(object);          } catch (Exception e) {   return null;          }       }   2.不考虑从祖先类继承的属性...,只获取当前类属性,包括四类访问权限,private,protect,default,public [java] view plain copy /**     * 根据属性名获取属性值     *  ...,包括四类访问权限,private,protect,default,public [java] view plain copy /**   * 根据属性名获取属性元素,包括各种安全范围和所有父类

    5.3K20

    Linux CFS调度器之虚拟时钟vruntime与调度延迟--Linux进程的管理与调度(二十六)

    首先计算进程当前时间与上次启动时间的差值 通过负荷权重和当前时间模拟出进程的虚拟运行时钟 重新设置cfs的min_vruntime保持其单调性 3.1 计算时间差 首先, 该函数确定就绪队列的当前执行进程, 并获取主调度器就绪队列的实际时钟值...if (cfs_rq->rb_leftmost) { /* 获取最左结点的调度实体信息se, se中存储了其vruntime * rb_leftmost的vruntime...(调度延迟)与虚拟时间在调度实体内部的再分配 5.1 调度延迟与其控制字段 内核有一个固定的概念, 称之为良好的调度延迟, 即保证每个可运行的进程都应该至少运行一次的某个时间间隔....通过考虑各个进程的相对权重, 将一个延迟周期的时间在活动进程之前进行分配....而,CFS调度器中的权重在内核是对用户态进程的优先级nice值, 通过prio_to_weight数组进行nice值和权重的转换而计算出来的 虚拟时钟相关公式 linux内核采用了计算公式: 属性 公式

    3.4K63

    【Kotlin】属性 与 幕后字段 ( 属性声明 | 属性初始化器 | 属性访问器 | field 属性幕后字段 | lateinit 延迟初始化属性 )

    延迟初始化属性 lateinit I ...., 只能在属性访问器中可以使用 field 获取该值 ; ⑤ 延迟加载属性 : 该属性只能是引用类型 , 并且不能有初始化器和访问器 ; II ....: 属性定义了 get 方法 , 那么每次访问属性值时 ( 获取属性值 ) , 都会自动调用该 get 方法 ; ① 访问器 : get 方法又叫作访问器 , 用于获取属性值 ; ② 属性推断 : 使用...延迟初始化属性 lateinit ---- 1 ....延迟初始化属性为空 : 如果在没有初始化属性值时 , 调用该 lateinit 延迟初始化属性 , 会抛出异常 ; 6 . lateinit 延迟初始化属性推荐示例 : class Student {

    1.3K10
    领券