原文地址:https://blog.csdn.net/yy756127197/article/details/77871609
项目运行了1个多月,多实例的Quartz一直没有问题,今天突然出现一个JOB重复执行了2次。查看日志发现两个实例各执行了一次,但是是偶发现象,也就是一会执行一次,一会执行两次,没有规律。好奇怪,明明用了多实例Quartz。再次查看调度器服务的日志
2017-09-05T11:59:00+08:00
[APP/0]
OUT
2017-09-05 11:59:00.004 INFO 14 --- [ryBean_Worker-3] o.q.p.history.LoggingJobHistoryPlugin : Job DEFAULT.PROBLEM_DISPATCH fired (by trigger DEFAULT.PROBLEM_DISPATCH) at: 11:59:00 09/05/2017
2017-09-05T11:58:00+08:00
[APP/0]
OUT
2017-09-05 11:58:00.009 INFO 14 --- [ryBean_Worker-4] o.q.p.history.LoggingJobHistoryPlugin : Job DEFAULT.PROBLEM_DISPATCH execution complete at 11:58:00 09/05/2017 and reports: null
1
2
3
4
5
6
7
8
9
10
quartz是先找到trigger再次执行JOB,可是我的项目中有多个定时任务都是1分钟执行一次,在重复执行的这个JOB1日志那我发现有个错误,是它的后一个JOB2有错了,原来是同事的这个JOB2代码本身写错了,导致一直报错。
猜测是因为当JOB获得trigger的时间点正好在JOB2获得trigger时间点时,因为JOB2获得trigger报错了,所以导致另一个实例有获取JOB1一次,这样两个实例都获取到了JOB1的trigger,所以就执行了2次。
解决方法: 对于调度服务中的JOB只写一个消费服务的具体feign链接就好,再加上hystrix回退,这样消费者服务出任何错都不会影响其他服务的JOB。PS:同事就是把feign对应的服务名写错了……,唯一一个能出错的地方,就踩到雷了- _-
疑问:为什么我获取trigger时会相互影响?难道是他们在一个Group中的原因?知道的可以告诉我一声,我是先把trigger加了分组,以防万一,原来都是默认的DEFAULT。
2018-04-20
我发现以上都是废话,不知道当时是怎么想的。。。。
问了下经验丰富的同事,他给我的回答是,他们的项目也有这个问题,解决方法是:每当任务执行时自己手动加锁,不用quartz本身的锁机制。好吧,我有点懂,但是能力有限啊~
还好springboot2.0 本身集成了Quartz,想必不会出现这个问题了吧、
2018-07-18
解决方法:
在配置文件加上org.quartz.jobStore.acquireTriggersWithinLock=true
1
感谢lavenderyhj 的分享
原文来自: https://segmentfault.com/a/1190000015492260