一.Numpy :数组与向量化计算
import numpy as np
my_arr=np.arange(1000)
1.1 NumPy ndarray:多维数组对象
data=np.random.randn(2,3)
1.2生成ndarray
生成数组的方式就是使用array函数array函数接收任意的序列型对象
data=[6,7.5,8,0,1] arr=np.array(data)
1.3NumPy数组算术
arr=np.array([[1,2,3],[4,5,6]]) arr*arr arr-arr
1.4基础索引与切片
data=np.arange(10) arr[5] arr[5:8]
二.Pandas
2.1Series
Series是一种一维的数组型对象
import pandas as pd obj=pd.Series([4,7,5,3])
用标签来索引
obj2=pd.Series([1,2,3,4],index=['d','b','a','c']) obj2.index obj2['a']
可以用字典来生成
sdata={'Ohio':35000,'Texas':7100,'Oregon':16000,'Utah':5000} obj3=pd.Series(sdata)
2.2DataFrame
DataFrame表示的是矩阵的数据表,它包含以排序的列集合
data{'state':['1','2'],'year':[32000,5222],'pop':[1.5,1.7,3.6]} frame=pd.DataFrame(data)
frame.T#转置操作
三.绘图与可视化
matplotlib
import matplotlib.pyplot as plt data=np.range(10) plt.plot(data)
3.1图片与子图
fig=plt.figure() ax1=fig.add_subplot(2,2,1) ax2=fig.add_subplot(2,2,2) ax3=fig.add_subplot(2,2,3) plt.plot(np.random.randn(50).cumsum(),'k--')
3.2单个子图绘制的数据可视化
fig,axes=plt.subplots(2,3)