04-Flink 部署

2023-10-06 20:24:28

https://flink.apache.org/downloads.html

左侧 Downloads Binaries，1.14.2，.tgz包，300M+大小

yarn模式需要hadoop支持，在Additional Components下面下载

解压 tar -zxvf flink-1.14.2-bin-scala_2.12.tgz

最主要的三个目录：

bin ：shell脚本文件

start-cluster.sh stop-cluster.sh jobmanager.sh taskmanager.sh

特别的：flink文件（没有.sh）

conf：yml配置文件

flink-conf.yaml

jobmanager.rpc.address: localhost 配置jobmanager

jobmanager.rpc.port: 6123

......

rest.port: 8081

rest.address: localhost

masters:配置jobmanager

slaves:配置taskmanager，每行一个

lib：可用的库包，比如hadoop包

执行 ./start-cluster.sh 默认会启动一个standalonesession daemon和一个taskexecutor daemon

执行 jps 查看可以看到一个TaskManagerRunner和一个StandaloneSessionClusterEntrypoint

访问 localhost:8081，可以看到web页面

并行度优先级：代码中setParallelism(n)>提交job时候的设置的parallelism>flink-conf.yaml中parallelism.default设置的值

注意slot和task任务数的配置，可能存在任务提交失败的情况（slot资源不够）

命令行方式：

./flink run -c <mainClass> -p 3 <jarPath> --host localhost --port 7777

./flink cancel <jobId>

./flink list -a

Flink需要hadoop支持

Sesson Cluster

Per Job Cluster

码农公寓