一、概念
1.什么是DataHub
DataHub是流式数据(Streaming Data)的处理平台,提供对流式数据的发布(Publish),订阅(Subscribe)和分发功能,
可以轻松构建基于流式数据的分析和应用。
2.基本概念
Project:项目,一个项目包含多个topic,是DataHub数据组成的基本单位
Topic:主题,数据分发的基本单位,用来表示一类数据(类似表)
Shard:数据传输通道,每个shard都有自己的ID,并且会占用服务端资源,按需使用
Recode:数据传输的基本单位