数据湖架构构建与技术解析 | 开发者社区精选文章合集(二十)

每日集成开发者社区精品内容,你错过的干货补给站


每日精选博文推荐

数据湖架构构建与技术解析 | 开发者社区精选文章合集(二十)

“数据湖”:概念、特征、架构与案例

数据湖的概念非常热,许多前线的同学都在讨论数据湖应该怎么建?阿里云有没有成熟的数据湖解决方案?阿里云的数据湖解决方案到底有没有实际落地的案例?怎么理解数据湖?数据湖和大数据平台有什么不同?本篇就来康一康。>>戳我前往了解全文

数据湖架构,为什么需要“湖加速”?

湖加速即为数据湖加速,是指在数据湖架构中,为了统一支持各种计算,对数据湖存储提供适配支持,进行优化和缓存加速的中间层技术。那么为什么需要湖加速?数据湖如何实现“加速”?本文将从三个方面来介绍湖加速背后的原因,分享阿里云在湖加速上的实践经验和技术方案。>>点击阅读全文

如何用好云原生数据湖?

数据湖可以很好地帮助企业应对当前数据场景越来越多、数据结构越来越复杂、数据处理需求越来越多样化的问题。阿里云从2018年起就开始布局数据湖,推出了云原生数据湖分析Data Lake Analytics(DLA),从数据湖管理(帮助客户高效管理构建数据湖),Serverless Spark(提供高性价比的大规模计算),Serverless SQL(提供高性价比的在线交互式分析)三个方面帮助客户挖掘数据价值。本文分享相关技术挑战及解决方案。>>点击了解全文

深度 | 面向云原生数据湖的元数据管理技术解析

数据湖当前在国内外是比较热的方案,一些企业已经构建了自己的云原生数据湖方案,有效解决了业务痛点;还有很多企业在构建或者计划构建自己的数据湖,Gartner 2020年发布的报告显示目前已经有39%的用户在使用数据湖,34%的用户考虑在1年内使用数据湖。随着对象存储等云原生存储技术的成熟,一开始大家会先把结构化、半结构化、图片、视频等数据存储在对象存储中。当需要对这些数据进行分析时,发现缺少面向分析的数据管理视图,在这样的背景下业界在面向云原生数据湖的元数据管理技术进行了广泛的探索和落地。>>点击阅读全文

每日精选电子书

《阿里云云原生数据湖体系全解读》

《阿里云云原生数据湖体系全解读》是阿里云首次发布云原生数据湖体系,基于对象存储OSS、数据湖构建Data Lake Formation和E-MapReduce产品的强强组合,提供存储与计算分离架构下,涵盖湖存储、湖加速、湖管理和湖计算的企业级数据湖解决方案。

>>点击下载,《阿里云云原生数据湖体系全解读》

《“云湖共生 • 数智未来”数据湖应用实践白皮书》

在汹涌而至的信息化浪潮下,大数据技术不断更新迭代,数据管理工具得到飞速发展,相关概念也随之而生。数据湖(Data Lake)概念自2011年被推出后,其概念定位、架构设计和相关技术都得到了飞速发展和众多实践,数据湖也从单一数据存储池概念演进为支撑高效、安全、稳定企业级数据应用的下一代基础数据平台。此次发布的《数据湖应用实践白皮书》涵盖了数据湖的定义与架构、数据湖核心组件与方案介绍、数据湖构建方案、应用实践等内容,希望为用户提供新的洞察。

>>点击下载,《“云湖共生 • 数智未来”数据湖应用实践白皮书》


热门推荐

每日集成开发者社区精品内容,请持续关注!

上一篇:阿里公开自研AI集群细节:64个GPU,百万分类训练速度提升4倍


下一篇:IO实战篇:数据排序处理深入 | 带你学《Java语言高级特性》之七十六