该学习笔记主要是按照添加链接描述
来写的
pandas数据结构
pandas数据结构有两种
维数 名称 描述
1 Series 带标签的一维同构数组
2 DataFrame 带标签的,大小可变的,二维异构表格
DataFrame 是 Series 的容器,Series 则是标量的容器。使用这种方式,可以在容器中以字典的形式插入或删除对象。
首先试试Series,我导入一个numpy数组进去试试
Series的构造
import pandas as pd
import numpy as np
arr=np.array([1,2,3])
se=pd.Series(arr)
print(se)
0 1
1 2
2 3
dtype: int32
可以看到他的结构是这样的,左侧是id从0开始依次往下,右边是数组的内容下面是类型
接下来尝试输入索引
print(se.index)
显示的是这样一串东西
RangeIndex(start=0, stop=3, step=1)
索引范围是从0到3,步长为1,(和range函数和各种索引一样,这是左闭右开区间,实际上是从0到2)
还可以输入se.values
查看值se.type
查看类型
se1=pd.Series([1,2,3,4])
print(se1)
se1.index=['a','b','c','d']
print(se1)
series的值可以直接添加,但是一定要使用列表或者数组的形式添加否则会报错,然后索引值也可以通过index来更改
Index(['a', 'b', 'c', 'd'], dtype='object')
可以看出索引值的类型是object类
用字典的方式同样可以构造pandas
dic = {"a":1,"b":2,"c":3}
se2=pd.Series(dic)
print(se2)
a 1
b 2
c 3
dtype: int64
Series函数里面放上标量值的化,相当于series数据结构里的默认值
se3=pd.Series(5,[1,2,3,4])
print(se3)
1 5
2 5
3 5
4 5
dtype: int64
Series可以像列表一样索引比如print(se3[1:2])
还有学术不精的我第一次直到还能这样索引print(se3[[1,2,4]])
还有一个叫rendix()的函数可以以各种方式来索引
可以参考这位大佬的文章:[https://blog.csdn.net/youngbit007/article/details/53067707]