“Talk is cheap. Show me the code.”
― Linus Torvalds
老子第41章
上德若谷
大白若辱
大方無隅
大器晚成
大音希聲
大象無形
道隱無名
拳打千遍, 身法自然
110_1_高中週期性課程: Python程式入門與資料分析初探, 道明高中
文章目录
數據可視化的基本圖表
以下參考 姜楓, 許桂秋, 大數據可視化技術, 人民郵電, 2019, 及 Kaggle 上的教學資料等.
原始數據繪圖
直接將資料畫出, 看出一個初步的模式或走向, 是最基本的作法, 這類圖粗略分為:
下圖依序自左向右是
-
柱狀圖 bar
-
數據點圖,
-
折線圖
3個 gorup群體的某項資料, 例如三個國家的面積大小等, 都可以呈現最簡單的一個分布或是比較 -
走勢圖(趨勢圖)
其實就是數據軌跡圖或是折線圖呈現走勢, 特別是橫軸x軸代表時間時, 例如股市價位隨著時間的描點
下圖呈現 2020年3月, 疫情與沙特石油影響下的美股走勢
以下是美股道瓊指數歷史100年回顧
ref: 【美股歷史走勢】道瓊指數歷史100年回顧, https://www.stockfeel.com.tw/%E9%81%93%E7%93%8A%E6%8C%87%E6%95%B8%E7%99%BE%E5%B9%B4%E5%A4%A7%E5%9B%9E%E9%A1%A7/ link
-
長條圖,
就是把柱狀圖轉成橫的 -
直方圖 histogram,
類似柱狀圖, 但是他是呈現出現的頻率, -
餅圖
-
等高線圖 contour
-
散點圖, 呈現兩種數據的交互分布關係
-
氣泡圖, 就是散點圖, 只是用不同大小的點, 點的大小表示某個數據的大小
-
文氏圖或叫維恩圖 Venn diagram,
就是中小學學的交集聯集的圖 -
熱力圖,
通常是地圖上每個點, 用顏色越深表示數據越大, 例如疫情確診的數量, 越紅的區域表示確診的人越多越密. -
雷達圖,
常用來表現多維的數據, 例如一個學生各個面向的表現, 德智體群等各方面的分數表現.
簡單統計值描繪
多視圖協調關聯
時間數據可視化
比例數據可視化
關係數據可視化
文本數據可視化
複雜數據可視化
交互式數據可視化
Reference
-
姜楓, 許桂秋, 大數據可視化技術, Sec 2.5, 人民郵電, 2019.
- Sec 2.5 數據可視化的基本圖表
2.5.1 原始數據繪圖
2.5.2 簡單統計值描繪
2.5.3 多視圖協調關聯
ch 3 時間數據可視化
ch 4 比例數據可視化
ch 5 關係數據可視化
ch 6 文本數據可視化
ch 7 複雜數據可視化
ch 8 交互式數據可視化
- Sec 2.5 數據可視化的基本圖表
-
Data Visualization 資料視覺化教學, Kaggle 的網頁上的教學, https://www.kaggle.com/learn/data-visualization link
-
Matplotlib30官網手冊與範例, https://matplotlib.org/2.0.2/index.html link.
-
Pyplot tutorial — Matplotlib 3.4.2, https://matplotlib.org/2.0.2/users/pyplot_tutorial.html, link
-
Matplotlib30官網各種例子, https://matplotlib.org/2.0.2/gallery.html link