环境篇:Superset
Superset 是什么?
Apache Superset 是一个开源、现代、轻量的BI分析工具,能够对接多种数据源,拥有丰富的图表展示形式、支持自定义仪表盘,用户界面友好,易用。
如果没有Superset
大数据展示需要自行开发,费时费力,不能直观的展示数据报表,如数据仓库中大量的表信息图形化展示需要大量的开发周期。
1 搭建
环境要求:Python3.6运行了全套测试控件(建议选择),3.7官网说的也是兼容的,但没有经过全套测试。
1.1 更新yum组件
yum install -y python-setuptools
yum install -y gcc gcc-c++ libffi-devel python-devel python-pip python-wheel openssl-devel cyrus-sasl-devel openldap-devel
1.2 安装 setuptools和pip
pip install --upgrade setuptools pip -i http://mirrors.aliyun.com/pypi/simple/
- 报错
- 需要配置默认镜像源创建或修改配置文件
linux的文件在~/.pip/pip.conf,
windows在%HOMEPATH%\pip\pip.ini
mkdir /root/.pip
vim /root/.pip/pip.conf
#>>>
[global]
index-url=http://mirrors.aliyun.com/pypi/simple/
[install]
trusted-host=mirrors.aliyun.com
#<<<
1.3 安装superset
pip install apache-superset -i http://mirrors.aliyun.com/pypi/simple/
1.4 初始化superset数据库
superset db upgrade
1.5 创建管理员用户
export FLASK_APP=superset
superset fab create-admin
1.6 初始化
superset init
1.7 安装gunicorn
gunicorn 是一个Python WEB服务,可以理解为Tomcat
pip install gunicorn -i http://mirrors.aliyun.com/pypi/simple/
1.7 启动停止
- 启动(注意python3.6)
gunicorn -w 5 --timeout 120 -b 10.28.13.85:8888 "superset.app:create_app()" --daemon
gunicorn 是一个Python WEB服务,可以理解为Tomcat
-w WORKERS:指定线程数
--timeout:worker进程超时时间,超过会自动重启
-b BIND:绑定Superset访问地址
--daemon:后台运行
- 停止
ps -ef | awk '/gunicorn/ && !/awk/{print $2}' | xargs kill -9
2 对接数据源
http://superset.apache.org/installation.html#database-dependencies
从如上文档查看对接相关数据源
2.1 对接mysql
停止superset
conda install mysqlclient
pip install mysqlclient -i http://mirrors.aliyun.com/pypi/simple/
启动superset
3 使用demo
3.1 添加数据源
- 添加数据库
上图为mysql例子,Database为Superbase取的别名。URI写法--> mysql://账号:密码@IP/数据库名称。
- 添加表
3.2 制作仪表盘
- 创建仪表盘
- 创建图
测试数据有点喽,大家将就看了哈
仪表盘的设计,总体来说很简单了,是在不会用,可以点国旗切换文字来玩。