Panda的学习之路(1)——series 和 Dataframe

一、Series panda最基本的对象

# pandas的基础
s=pd.Series([1,3,6,np.nan,44,1])#建立个简单的基本对象 类似一个一位数组
print("建立个简单的基本对象 类似一个一位数组")
print(s)
s=pd.Series([1,2,3,4,5],index=['a','b','c','d','e'])
print("命名相关的索引")
print(s)
s.name="xuhan"#series的每个对象都有一个对应的索引和名称
s.index.name="行名"#对行索引进行命名
print("对行名和整个表的名称进行相关的命名:")
print(s)
# 切片操作
print("切片操作")#按行切片
print(s[1:3])

执行结果

建立个简单的基本对象 类似一个一位数组
0 1.0
1 3.0
2 6.0
3 NaN
4 44.0
5 1.0
dtype: float64
命名相关的索引
a 1
b 2
c 3
d 4
e 5
dtype: int64
对行名和列名进行相关的命名:
行名
a 1
b 2
c 3
d 4
e 5
Name: xuhan, dtype: int64
切片操作
行名
b 2
c 3
Name: xuhan, dtype: int64

二、Dataframe

2.1创建

# dataframe 的创建
dates=pd.date_range('',periods=6,name="定义的日期表")#pd中的时间序列 从20160101开始
# # print(dates)
# 第一个参数表示表内的矩阵 第二个参数是每一行的索引 第三个表示没一列的索引
df=pd.DataFrame(np.random.randn(6,4),index=dates,columns=['a','b','c','d'])
print(df)
df2=pd.DataFrame(np.arange(1,13).reshape(3,4),index=list(''),columns=list('abcd'))
print(df2)
df=pd.DataFrame(np.arange(12).reshape(3,4))
print(df)

结果:

                   a         b         c         d
定义的日期表
2016-01-01 0.776594 -0.166321 0.156607 0.576739
2016-01-02 -1.649947 1.274599 0.571282 -0.605256
2016-01-03 -1.361043 0.013429 2.148883 -0.506440
2016-01-04 1.609952 0.498063 -0.763137 1.639300
2016-01-05 0.182889 0.630330 1.221402 -0.942096
2016-01-06 -0.348916 1.339488 1.477448 -1.320836
a b c d
1 1 2 3 4
2 5 6 7 8
3 9 10 11 12
0 1 2 3
0 0 1 2 3
1 4 5 6 7
2 8 9 10 11

2.2对Frame中数据的排序

df=pd.DataFrame(np.arange(12).reshape(3,4))
print(df) print("输出表格内的数据")
print(df.values)#values 表示输出表内的一系列数据 print("输出对列索引的倒叙排序")
print(df.sort_index(axis=1,ascending=False))# 对列索引进行排序 就是对每一行的数据进行排序
print("输出对行索引的倒叙排序")
print(df.sort_index(axis=0,ascending=False))#0是对行索引进行排序
print("对某一行的固定排序")
print(df.sort_values(by=1,ascending=False))#按某一列进行固定的排序
print("输出表格的相关描述")
print(df.describe())#count数量 mean平均值 std标准差 min最小值

结果:

   0  1   2   3
0 0 1 2 3
1 4 5 6 7
2 8 9 10 11
输出表格内的数据
[[ 0 1 2 3]
[ 4 5 6 7]
[ 8 9 10 11]]
输出对列索引的倒叙排序
3 2 1 0
0 3 2 1 0
1 7 6 5 4
2 11 10 9 8
输出对行索引的倒叙排序
0 1 2 3
2 8 9 10 11
1 4 5 6 7
0 0 1 2 3
对某一行的固定排序
0 1 2 3
2 8 9 10 11
1 4 5 6 7
0 0 1 2 3
输出表格的相关描述
0 1 2 3
count 3.0 3.0 3.0 3.0
mean 4.0 5.0 6.0 7.0
std 4.0 4.0 4.0 4.0
min 0.0 1.0 2.0 3.0
25% 2.0 3.0 4.0 5.0
50% 4.0 5.0 6.0 7.0
75% 6.0 7.0 8.0 9.0
max 8.0 9.0 10.0 11.0
上一篇:pandas 学习(2): pandas 数据结构之DataFrame


下一篇:【学习总结】GirlsInAI ML-diary 总