Pandas-数据分析包

pandas是python的第三方库所以使用前需要安装一下,直接使用pip install pandas 就会自动安装pandas以及相关组件。

 

1、Series模块

1.1 Series的索引默认是从 0 开始的整数。

from pandas import Series
import pandas as pd

s = Series([1,4,'ww','tt'])
s.index                           # RangeIndex(start=0, stop=4, step=1)
s.values                          # array([1, 4, 'ww', 'tt'], dtype=object)  
s
0     1
1     4
2    ww
3    tt
dtype: object

1.2 Series 可以自定义索引:

s2 = Series(['wangxing','man',24],index=['name','sex','age'])
s2
name    wangxing
sex          man
age           24
dtype: object

1.3 Series值引用

s2['name']     # 'wangxing'
s2['sex']      # 'man'
s2['age']      # 24

1.4 传入字典,定义Series的索引与值

# 传入字典,定义Series的索引与值
sd = {'python':9000,'c++':9001,'c#':9000}
# s3 = Series(sd)
s3 = Series({'python':9000,'c++':9001,'c#':9000})
s3
python    9000
c++       9001
c#        9000
dtype: int64

1.5 索引“自动对齐”:如果自定义了索引,自定的索引会自动寻找原来的索引,如果一样的,就取原来索引对应的值

   如果没有值(null),都对齐赋给 NaN

sd = {'python':9000,'c++':9001,'c#':9000}
# 如果没有值(null),都对齐赋给 NaN s4 = Series(sd, index=['java','c++','c#']) s4
java       NaN
c++     9001.0
c#      9000.0
dtype: float64

1.6 Pandas 有专门的方法来判断值是否为空   Series 对象也有同样的方法

#pd.isnull(s4)
s4.isnull()
java     True
c++     False
c#      False
dtype: bool

 

2、DataFrame

from pandas import Series,DataFrame
data = {"name":['google','baidu','yahoo'],"marks":[100,200,300],"price":[1,2,3]}
f1 = DataFrame(data)
# 按照惯例默认索引就是从 0 开始的整数
f1

Pandas-数据分析包

 

 

# DataFrame 中,columns 其顺序可以被规定
# 且 DataFrame 数据的索引也能够自定义
f2 = DataFrame(data,columns=['name','price','marks'], index=['a','b','c'])

f2

Pandas-数据分析包

 

上一篇:Numpy | 数据类型


下一篇:初识 TensorFlow