背景介绍
JindoFS 作为阿里云基于 OSS 的一揽子数据湖存储优化方案,完全兼容 Hadoop/Spark 生态,并针对 Spark、Hive、Flink、Presto 等大数据组件和 AI 生态实现了大量扩展和优化。
JindoFS 项目包括 JindoFS OSS 支持、JindoFS 分布式缓存系统(JindoFS Cache 模式)和 JindoFS 分布式存储优化系统(JindoFS Block 模式)。
JindoSDK 是各个计算组件可以用来使用JindoFS 这些优化扩展功能和模式的套件,包括 Hadoop Java SDK、Python SDK 和 Fuse/POSIX 支持。JindoSDK 在阿里云 E-MapReduce 产品中被深度集成,同时也开放给非 EMR 产品用户在各种 Hadoop/Spark 环境上使用。
GitHub 地址:https://github.com/aliyun/alibabacloud-jindofs 欢迎点赞送星~
直播预告
对于数据湖 JindoFS+OSS 你是否还想知道更多?仅仅理论的充电已经无法满足你跃跃欲试的实践之心?这次,机会来了!
为了让更多开发者了解并使用 JindoFS+OSS,由阿里云JindoFS+OSS 团队打造的专业公开课【数据湖JindoFS+OSS 实操干货36讲】会在 每周二16:00 准时直播开讲!从五大版块入手,带你玩转数据湖!
线上直接观看直播,记得搬好小板凳,每周二16:00 准时锁定!直接钉钉扫描文章底部二维码进钉钉群观看每场直播~