本文直播作者 木弈 阿里云智能 产品经理
直播视频请点击 直播 观看。
本文将从六个方面讲解。
01 走进 MaxCompute 生态
02 商业智能(BI)分析工具概览
03 开源BI分析工具概览
04 JDBC 简介
05 PyODPS 简介
06 实操展示
下面开始我们第一部分的分享
一、走进 MaxCompute 生态
首先来看下 MaxCompute 产品能支持的外部工具,大概可以分为商业智能、开发管理、传输调度、编程接口。本次分享主要关注商业智能(BI)工具这一板块,可以看到 MaxCompute 官方集成有Tableau、FineReport、FineBI、Quick BI。其中Tableau、FineBI、FineReport是在特定的版本会内置 MaxCompute 驱动,如果需要通过JDBC连接 MaxCompute ,还是需要手动加载 MaxCompute JDBC驱动,Quick BI作为阿里云的产品,是可以通过阿里云账号和AK信息直接连接的,同时在8.6及以上版本的Yonghong Desktop也是可以通过内置驱动连接 MaxCompute。在商业智能部分还有开源BI工具,Superset、Davinci也可以连接 MaxCompute。
在开发管理部分,是我们第二讲要讲的内容,包括DBeaver、DataGrip、SQL Workbench/J。
同时我们的产品还集成了 Kafka和Flink开源引擎。支持的ETL开源工具有Kettle、Airflow、Azkaban,这一部分是在本季直播的第三讲来介绍。支持的编程接口有Python、JDBC、SQLAlchemy。
除了支持的外部工具,MaxCompute 自身也有开放生态,包括内建开源引擎 Spark,迁移工具MMA,开发生态PyODPS、Mars,工具生态Web-Console等。同时 MaxCompute 也与阿里云内部产品共同构建了丰富的解决方案生态和数据应用生态。
二、商业智能(BI)分析工具概览
商业智能 (BI) 工具支持将计算引擎得到的数据通过仪表板、图表和其他图形输出提供数据可视化,以直观的形式展示给决策者,帮助高管和经理做出更明智的业务决策。
本页所展示的都是经过 MaxCompute 团队成员测试,可以成功连接 MaxCompute 表数据并进行数据可视化的BI工具。 本次重点介绍商业型BI工具,其中Tableau、FineBI、FineReport都是需要通过 MaxCompute JDBC驱动连接 MaxCompute。Quick BI和 Yonghong Desktop 可以通过产品内置驱动连接 MaxCompute。这些BI工具成功连接 MaxCompute 数据源后,可以进行列举数据库、列举表、查看表结构、查询表数据、查询视图等相关操作,打造数据报表。
三、开源BI分析工具概览
MaxCompute 支持的开源BI工具主要是Davinci和Superset,分别是以JDBC和PyODPS做为连接驱动。
四、JDBC 简介
JDBC
JDBC(Java DataBase Connectivity)是一种用于执行SQL语句的Java API,可以为多种关系数据库提供统一访问,它由一组用Java语言编写的类和接口组成。简单来说就是用Java语言向数据库发送SQL语句来操作数据库。
MaxCompute JDBC 驱动
MaxCompute JDBC 驱动是 MaxCompute 提供的可以访问 MaxCompute 的JDBC接口。您可以通过标准的JDBC 接口基于 MaxCompute 执行海量数据的分布式计算查询。MaxCompute JDBC 驱动还可以用于连接MaxCompute 和支持 JDBC 的工具。
MaxCompute 相关基本参数信息
•URL:jdbc:odps:<MaxCompute_endpoint>?project=<MaxCompute_project_name>
- :必填。MaxCompute项目所属区域的Endpoint。
- :必填。待连接的目标MaxCompute项目名称。此处为MaxCompute项目名称,非工作空间名称。
•User:有访问指定项目权限的AccessKey ID。
•Password :AccessKey ID对应的AccessKey Secret。
五、PyODPS 简介
PyODPS是MaxCompute的Python SDK,提供DataFrame框架和MaxCompute对象的基本操作方法。您可以通过MaxCompute轻松地分析数据。
PyODPS 支持Python 2.6 以上的 Python 版本,包括Python 3。系统安装了 pip 后,只需运行:
pip install 'git+http://gitlab-ci-token:c60faf31b1f475342c790cca880e06@gitlab-sc.alibaba-inc.com/odps/pyodps.git'
PyODPS 的相关依赖会自动安装。
注意,对于Linux和Mac用户,先安装Cython,再运行安装pyodps命令,能加速Tunnel的上传和下载。
常用参数信息
• :MaxCompute项目所属区域的Endpoint。
• :待连接的目标MaxCompute项目名称。
• User: 有访问指定项目权限的AccessKey ID。
• Password :AccessKey ID对应的AccessKey Secret。
六、实操展示
FinBI实操展示
请点击 视频 查看实操部分
Superset实操展示
请点击 视频 查看实操部分
其他BI工具接入
工具 |
版本要求 |
接入办法 |
其他资源 |
|
|
||
|
|
||
|
|
||
|
|
||
|
|
||
|
|||
|
更多关于大数据计算、云数仓技术交流,欢迎扫码加入 “MaxCompute开发者社区” 钉钉群