1.分布式任务调度应用场景
- 基于时间
- 报表:统计昨天的订单量,或者上一天的订单量
- 日/月结单:支付、金融领域:证劵公司等
- 爬虫:定时进行爬取
- 基于数据量
- 数据归档:数据到一定的量级可以进行归档
2.任务调度的框架有哪些?
-
非分布式
@Scheduled
package com.xiaobu.scheduled; import com.xiaobu.async.DoProcessAsync; import lombok.extern.slf4j.Slf4j; import org.springframework.beans.factory.annotation.Autowired; import org.springframework.scheduling.annotation.Async; import org.springframework.scheduling.annotation.Scheduled; import org.springframework.stereotype.Component; /** * @ClassName MyJob * @description: 非分布式,任务调度@scheduled的使用 * @author: qsong * @create: 2021-06-13 20:48 * @Version 1.0 **/ @Component @Slf4j public class MyJob { @Autowired DoProcessAsync doProcessAsync; /** * fixedDelay:固定延迟,时间间隔是这次任务的结束到下次任务的开始 * fixedDelayString:fixedDelay的字符串参数形式 * initialDelay: 延迟启动 * fixedRate:时间间隔是前次任务和下次任务的开始 * * cron:cron表达式,https://cron.qqe2.com * */ // @Scheduled(fixedRate = 3000,initialDelay = 5000) // @Scheduled(cron = "* * * * * ?") // public void job() throws InterruptedException{ // log.info("scheduled........start"); // Thread.sleep(3000); // log.info("scheduled........end"); // } @Scheduled(fixedDelay = 3000) public void job() throws InterruptedException{ log.info("scheduled1........start"); doProcessAsync.doProcessAsync(); log.info("scheduled1........end"); } // @Scheduled(cron = "* * * * * ?") // public void job2() throws InterruptedException{ // log.info("scheduled2........start"); // Thread.sleep(3000); // log.info("scheduled2........end"); // } }
package com.xiaobu; import org.springframework.boot.SpringApplication; import org.springframework.boot.autoconfigure.SpringBootApplication; import org.springframework.context.annotation.Bean; import org.springframework.scheduling.TaskScheduler; import org.springframework.scheduling.annotation.EnableAsync; import org.springframework.scheduling.annotation.EnableScheduling; import org.springframework.scheduling.concurrent.ThreadPoolTaskScheduler; @SpringBootApplication @EnableScheduling @EnableAsync public class DistributedJobApplication { public static void main(String[] args) { SpringApplication.run(DistributedJobApplication.class, args); } //创建定时线程池 @Bean public TaskScheduler taskScheduler() { ThreadPoolTaskScheduler poolTaskScheduler = new ThreadPoolTaskScheduler(); //设置池子的大小 poolTaskScheduler.setPoolSize(10); return poolTaskScheduler; } }
package com.xiaobu.async; import lombok.extern.slf4j.Slf4j; import org.springframework.scheduling.annotation.Async; import org.springframework.stereotype.Component; /** * @ClassName DoProcessAsync * @description: * @author: qsong * @create: 2021-06-14 00:49 * @Version 1.0 **/ @Component @Slf4j public class DoProcessAsync { @Async public void doProcessAsync() throws InterruptedException { log.info("开启异步。。。。。。。"); Thread.sleep(3000); } }
-
分布式
-
QuartZ
:不推荐使用,也没有可视化界面操作package com.xiaobu.config; import com.xiaobu.quart.MyQuartzJob; import org.quartz.*; import org.springframework.context.annotation.Bean; import org.springframework.context.annotation.Configuration; @Configuration public class MyQuartJobConfig { @Bean public JobDetail jobDetail() { JobDetail detail = JobBuilder.newJob(MyQuartzJob.class) .withIdentity("job1", "group1") .storeDurably() .build(); return detail; } @Bean public Trigger trigger() { Trigger trigger = TriggerBuilder.newTrigger() .forJob(jobDetail()) .withIdentity("trigger1", "group1") .startNow() .withSchedule(CronScheduleBuilder.cronSchedule("0,5 * * * * ?")) .build(); return trigger; } }
package com.xiaobu.quart; import lombok.extern.slf4j.Slf4j; import org.quartz.JobExecutionContext; import org.quartz.JobExecutionException; import org.springframework.scheduling.quartz.QuartzJobBean; @Slf4j public class MyQuartzJob extends QuartzJobBean { /** * MyQuartzJob * 具体的业务实现 * @param * @throws JobExecutionException */ @Override protected void executeInternal(JobExecutionContext context) throws JobExecutionException { // log.info("MyQuartzJob..."); } }
-
Elasticjob
:用到很多的中间件,如zookeeper等,维护比较麻烦 -
XXL-job:推荐使用
-
SchedulerX
:阿里云 -
PowerJob
-
3. XXL-job
1.简介
XXL-JOB是一个分布式任务调度平台,其核心设计目标是开发迅速、学习简单、轻量级、易扩展。现已开放源代码并接入多家公司线上产品线,开箱即用。
2.特性
- 1、简单:支持通过Web页面对任务进行CRUD操作,操作简单,一分钟上手;
- 2、动态:支持动态修改任务状态、启动/停止任务,以及终止运行中任务,即时生效;
- 3、调度中心HA(中心式):调度采用中心式设计,“调度中心”自研调度组件并支持集群部署,可保证调度中心HA;
- 4、执行器HA(分布式):任务分布式执行,任务”执行器”支持集群部署,可保证任务执行HA;
- 5、注册中心: 执行器会周期性自动注册任务, 调度中心将会自动发现注册的任务并触发执行。同时,也支持手动录入执行器地址;
- 6、弹性扩容缩容:一旦有新执行器机器上线或者下线,下次调度时将会重新分配任务;
- 7、触发策略:提供丰富的任务触发策略,包括:Cron触发、固定间隔触发、固定延时触发、API(事件)触发、人工触发、父子任务触发;
- 8、调度过期策略:调度中心错过调度时间的补偿处理策略,包括:忽略、立即补偿触发一次等;
- 9、阻塞处理策略:调度过于密集执行器来不及处理时的处理策略,策略包括:单机串行(默认)、丢弃后续调度、覆盖之前调度;
- 10、任务超时控制:支持自定义任务超时时间,任务运行超时将会主动中断任务;
- 11、任务失败重试:支持自定义任务失败重试次数,当任务失败时将会按照预设的失败重试次数主动进行重试;其中分片任务支持分片粒度的失败重试;
- 12、任务失败告警;默认提供邮件方式失败告警,同时预留扩展接口,可方便的扩展短信、钉钉等告警方式;
- 13、路由策略:执行器集群部署时提供丰富的路由策略,包括:第一个、最后一个、轮询、随机、一致性HASH、最不经常使用、最近最久未使用、故障转移、忙碌转移等;
- 14、分片广播任务:执行器集群部署时,任务路由策略选择”分片广播”情况下,一次任务调度将会广播触发集群中所有执行器执行一次任务,可根据分片参数开发分片任务;
- 15、动态分片:分片广播任务以执行器为维度进行分片,支持动态扩容执行器集群从而动态增加分片数量,协同进行业务处理;在进行大数据量业务操作时可显著提升任务处理能力和速度。
- 16、故障转移:任务路由策略选择”故障转移”情况下,如果执行器集群中某一台机器故障,将会自动Failover切换到一台正常的执行器发送调度请求。
- 17、任务进度监控:支持实时监控任务进度;
- 18、Rolling实时日志:支持在线查看调度结果,并且支持以Rolling方式实时查看执行器输出的完整的执行日志;
- 19、GLUE:提供Web IDE,支持在线开发任务逻辑代码,动态发布,实时编译生效,省略部署上线的过程。支持30个版本的历史版本回溯。
- 20、脚本任务:支持以GLUE模式开发和运行脚本任务,包括Shell、Python、NodeJS、PHP、PowerShell等类型脚本;
- 21、命令行任务:原生提供通用命令行任务Handler(Bean任务,”CommandJobHandler”);业务方只需要提供命令行即可;
- 22、任务依赖:支持配置子任务依赖,当父任务执行结束且执行成功后将会主动触发一次子任务的执行, 多个子任务用逗号分隔;
- 23、一致性:“调度中心”通过DB锁保证集群分布式调度的一致性, 一次任务调度只会触发一次执行;
- 24、自定义任务参数:支持在线配置调度任务入参,即时生效;
- 25、调度线程池:调度系统多线程触发调度运行,确保调度精确执行,不被堵塞;
- 26、数据加密:调度中心和执行器之间的通讯进行数据加密,提升调度信息安全性;
- 27、邮件报警:任务失败时支持邮件报警,支持配置多邮件地址群发报警邮件;
- 28、推送maven*仓库: 将会把最新稳定版推送到maven*仓库, 方便用户接入和使用;
- 29、运行报表:支持实时查看运行数据,如任务数量、调度次数、执行器数量等;以及调度报表,如调度日期分布图,调度成功分布图等;
- 30、全异步:任务调度流程全异步化设计实现,如异步调度、异步运行、异步回调等,有效对密集调度进行流量削峰,理论上支持任意时长任务的运行;
- 31、跨语言:调度中心与执行器提供语言无关的 RESTful API 服务,第三方任意语言可据此对接调度中心或者实现执行器。除此之外,还提供了 “多任务模式”和“httpJobHandler”等其他跨语言方案;
- 32、国际化:调度中心支持国际化设置,提供中文、英文两种可选语言,默认为中文;
- 33、容器化:提供官方docker镜像,并实时更新推送dockerhub,进一步实现产品开箱即用;
- 34、线程池隔离:调度线程池进行隔离拆分,慢任务自动降级进入”Slow”线程池,避免耗尽调度线程,提高系统稳定性;
- 35、用户管理:支持在线管理系统用户,存在管理员、普通用户两种角色;
- 36、权限控制:执行器维度进行权限控制,管理员拥有全量权限,普通用户需要分配执行器权限后才允许相关操作;
3.下载
文档地址
4.源码仓库地址
源码仓库地址 | Release Download |
---|---|
https://github.com/xuxueli/xxl-job | Download |
http://gitee.com/xuxueli0323/xxl-job | Download |
5.*仓库地址
<!-- http://repo1.maven.org/maven2/com/xuxueli/xxl-job-core/ -->
<dependency>
<groupId>com.xuxueli</groupId>
<artifactId>xxl-job-core</artifactId>
<version>${最新稳定版本}</version>
</dependency>
6.环境
- Maven3+
- Jdk1.8+
- Mysql5.7+