这两天在定位一个网上问题的时候发现一个很诡异的现象,系统夜间的汇总任务跑了很长一段时间才能结束,而且日志显示这些汇总任务的每个子任务都很快就结束了,但整体任务还是耗费了很长一段时间才结束。
sub-job 1 done in 3ssub-job 2 done in 3ssub-job 3 done in 2ssub-job 4 done in 5ssub-job 5 done in 6ssub-job 6 done in 8ssub-job 7 done in 9s...whole process is down in 3235s |
---|
其实整体业务流程很简单,大致的流程就是系统创建了很多汇总任务,把它们丢到线程池中去执行。这些任务在执行的过程中,为了提高效率,会创建一些子任务并并发的运行它们,当子任务运行结束后,父任务就会结束,所以出现这种现象是非常不科学的。我的第一感觉就是是不是任务间存在不合理的锁竞争导致线程相互等待?仔细检查代码,果然发现了问题,在汇总任务的父类中有这样一个方法:
private static synchronized format(DateTime dt){ return "P" + dt.toString("yyyyMMHHmmss");} |
---|
这个方法是汇总任务根据时间生成目标汇总时间周期用的,之所以会封装成一个方法,估计是为了代码复用考虑。封装本身并没有错,但是要命的是,开发人员将方法声明为static synchronized
,让我们先回忆一下这个两个关键字的作用:
Synchronized Methods
,即同步方法,在The Java™ Tutorials中对同步方法有以下描述:
First, it is not possible for two invocations of synchronized methods on the same object to interleave. When one thread is executing a synchronized method for an object, all other threads that invoke synchronized methods for the same object block (suspend execution) until the first thread is done with the object.
Second, when a synchronized method exits, it automatically establishes a happens-before relationship with any subsequent invocation of a synchronized method for the same object. This guarantees that changes to the state of the object are visible to all threads.
简单来说就是当一个方法声明为同步方法的时候,不可能出现多个线程同时调用同一个对象(注意是同一个对象,这点很重要)上的该方法,只有当一个线程调用结束,其他线程才有可能获取锁并执行该方法。
那么synchronized
加上static
会出现什么效果?按照上面的分析static
是整个类共享的,不仅仅是一个对象,那么static synchronized
修饰的变量、方法或者代码段就是在类的粒度上进行同步,而不是仅仅是在对象粒度上。对于这个问题,Java machine language specification中也有描述:
For a class (static) method, the monitor associated with the Class object for the method’s class is used.
For an instance method, the monitor associated with this (the object for which the method was invoked) is used.
所以在我们的业务代码中,如果在父类中声明了一个static synchronized
的方法,就意味着每个继承它的子类及其对象在调用这个方法时都会争夺这个锁,那么造成任务执行效率低下也就是必然的了。