Apache Flink:全球领先的开源大数据计算引擎
Apache Flink 是一个开源的分布式大数据处理引擎, 可对有限数据流和无限数据流进行有状态计算。作为 Apache 软件基金会 (ASF) *项目之一,Flink 在流处理方面具有绝对的优势,提供高吞吐、低延时的计算能力, Exactly-once 语义保证数据的准确性,亚秒级别的处理延迟确保业务的快速响应。
作为快速发展的新一代大数据引擎,Flink 本身的架构优势也吸引着越来越多的开源爱好者投入到社区的建设来。 截止到 2020 年 7 月,社区的 star 数达到 13600+ ,contributor 数达到 718,有 22989 次 commits。伴随着社区的快速发展,Flink 也成为类似阿里巴巴、腾讯、字节跳动、滴滴、美团点评等知名公司建设流处理平台的首选。
Apache Flink 的系统架构
完整白皮书下载>>>
https://files.alicdn.com/tpsservice/b3d617d245349b87d55bf370c1fd71d7.pdf
阿里云实时计算 Flink 版
实时计算 Flink版(Alibaba Cloud Realtime Compute for Apache Flink,Powered by Ververica))是阿里云提供的基于 Apache Flink 构建的企业级、高性能实时大数据处理系统,由Apache Flink创始团队官方出品。在 PB 级别的数据集上可以支持亚秒级别的处理延时,赋能用户标准实时数据处理流程和行业解决方案;在支持 Datastream API 作业开发的同时,提供了完整的SQL语义,使得 BI 场景下的开发变得更加简单;丰富的上下游 connector 保证了与用户已使用的大数据组件无缝对接;智能作业调优和诊断功能进一步简化了用户的开发和使用。
实时计算 Flink版在 Apache Flink 核心功能的基础上还增强了企业用户所关注的集群稳定、性能优化、安全控制、系统监控和作业管理等。阿里云实时计算团队目前是全球最大、拥有 Committer 数量最多、专业性最强的 Flink 团队,为实时计算用户提供企业级的管理和咨询服务。2019 年 6 月,由数据中心联盟发起的大数据产品能力评测结果权威发布,阿里云实时计算 Flink版通过最新制定的分布式流处理平台基础能力评测,成为国内首批通过流计算产品能力评测的产品,并被数据中心联盟圈定为国内大数据流计算基础平台第一梯队。2020 年在国际知名咨询调研公司Forrester 的测评中,实时计算 Flink版成为中国唯一进入Forrester象限的实时流计算产品
阿里云实时计算 Flink 版与 Apache Flink 的对比
实时计算Flink版产品架构
阿里云实时计算 Flink 版产品模式
Flink全托管
- 适合不关注集群运维,要求完全兼容开源的用户
- 集群免运维
- 企业级开发平台和内核引擎
- 按CPU/内存使用量付费,成本低于用户自建
- 100%兼容开源Flink API
Flink半托管
- 适合需要自主掌控集群,要求完全兼容开源的用户
- 集群用户自主可控
- 支持 Yarn/K8S 两种调度模式
- 企业级开发平台和内核引擎
- 包年包月模式与用户自建成本一致
- 100%兼容开源Flink API
独享集群
- 适合需要使用流式SQL开发作业,不关注集群运维的客户
- 提供流式SQL能力,支持DataStream API
- 近百作业指标,完整监控链路
- 提供作业诊断功能,一键分析作业问题
- 提供智能调优功能,作业资源自动调节
阿里云实时计算 Flink 版的优势
实时计算 Flink 版业务场景
实时数仓:
传统意义上将数据汇总到离线计算引擎,通过N+1天生成数据报表的模式已经不能满足快速增长的业务需求,互联网的在线特性也将业务需求推向了实时化,随时根据当前客户行为而调整策略变得越来越常见,传统数仓开始向实时数仓转型。
客户价值:
- 快速响应业务需求:秒级返回业务指标,快速进行多维分析
- 节省用户成本:业务结果实时数据化,协助用户及时调整方向,减少无用投入
实时风控:
风控是用户业务中的核心功能,应用范围非常广泛,包括内容风控、金融风控、营销风控等几大类型。互联网时代的到来产生大量的数据、访问、请求,新的业务需求促使传统的风控系统需要向大数据场景转型
客户价值:
- 实时性强:大数据场景下高吞吐、低延时,毫秒级报警拦截
- 独有事件规则支持:独有的CEP语法天然支持规则设定,完美适配风控场景
实时机器学习:
机器学习作为大数据的重要场景在越来越多的行业得到应用,但传统的算法,主要侧重于使用静态模型和历史数据进行训练并提供预测,如何针对用户短期的行为进行准确的、个性化的预测,从而动态实施决策就成为新的难题
客户价值:
- 运营精细化:可支持对百万级客户快速画像,精准定位用户特性,个性化运营提高客户成交量与留存率
- 低门槛:无缝集成实时计算学习算法平台,一站式完成数据开发、模型训练、场景预测全流程
阿里云实时计算Flink - 解决方案:
https://developer.aliyun.com/article/765097
阿里云实时计算Flink - 场景案例:
https://ververica.cn/corporate-practice
阿里云实时计算Flink - 产品详情页:
https://www.aliyun.com/product/bigdata/product/sc