pandas是python的第三方库所以使用前需要安装一下,直接使用pip install pandas 就会自动安装pandas以及相关组件。
1、Series模块
1.1 Series的索引默认是从 0 开始的整数。
from pandas import Series import pandas as pd s = Series([1,4,'ww','tt']) s.index # RangeIndex(start=0, stop=4, step=1) s.values # array([1, 4, 'ww', 'tt'], dtype=object) s
0 1 1 4 2 ww 3 tt dtype: object
1.2 Series 可以自定义索引:
s2 = Series(['wangxing','man',24],index=['name','sex','age']) s2
name wangxing sex man age 24 dtype: object
1.3 Series值引用
s2['name'] # 'wangxing' s2['sex'] # 'man' s2['age'] # 24
1.4 传入字典,定义Series的索引与值
# 传入字典,定义Series的索引与值 sd = {'python':9000,'c++':9001,'c#':9000} # s3 = Series(sd) s3 = Series({'python':9000,'c++':9001,'c#':9000}) s3
python 9000 c++ 9001 c# 9000 dtype: int64
1.5 索引“自动对齐”:如果自定义了索引,自定的索引会自动寻找原来的索引,如果一样的,就取原来索引对应的值
如果没有值(null),都对齐赋给 NaN
sd = {'python':9000,'c++':9001,'c#':9000}
# 如果没有值(null),都对齐赋给NaN
s4 = Series(sd, index=['java','c++','c#']) s4
java NaN c++ 9001.0 c# 9000.0 dtype: float64
1.6 Pandas 有专门的方法来判断值是否为空 Series 对象也有同样的方法
#pd.isnull(s4) s4.isnull()
java True c++ False c# False dtype: bool
2、DataFrame
from pandas import Series,DataFrame data = {"name":['google','baidu','yahoo'],"marks":[100,200,300],"price":[1,2,3]} f1 = DataFrame(data) # 按照惯例默认索引就是从 0 开始的整数 f1
# DataFrame 中,columns 其顺序可以被规定 # 且 DataFrame 数据的索引也能够自定义 f2 = DataFrame(data,columns=['name','price','marks'], index=['a','b','c']) f2