pandas学习笔记

该学习笔记主要是按照添加链接描述
来写的

pandas数据结构

pandas数据结构有两种
维数 名称 描述
1 Series 带标签的一维同构数组
2 DataFrame 带标签的,大小可变的,二维异构表格
DataFrame 是 Series 的容器,Series 则是标量的容器。使用这种方式,可以在容器中以字典的形式插入或删除对象。
首先试试Series,我导入一个numpy数组进去试试

Series的构造

import pandas as pd
import numpy as np
arr=np.array([1,2,3])
se=pd.Series(arr)
print(se)
0    1
1    2
2    3
dtype: int32

可以看到他的结构是这样的,左侧是id从0开始依次往下,右边是数组的内容下面是类型
接下来尝试输入索引

print(se.index)

显示的是这样一串东西

RangeIndex(start=0, stop=3, step=1)

索引范围是从0到3,步长为1,(和range函数和各种索引一样,这是左闭右开区间,实际上是从0到2)
还可以输入se.values查看值se.type查看类型

se1=pd.Series([1,2,3,4])
print(se1)
se1.index=['a','b','c','d']
print(se1)

series的值可以直接添加,但是一定要使用列表或者数组的形式添加否则会报错,然后索引值也可以通过index来更改

Index(['a', 'b', 'c', 'd'], dtype='object')

可以看出索引值的类型是object类
用字典的方式同样可以构造pandas

dic = {"a":1,"b":2,"c":3}
se2=pd.Series(dic)
print(se2)
a    1
b    2
c    3
dtype: int64

Series函数里面放上标量值的化,相当于series数据结构里的默认值

se3=pd.Series(5,[1,2,3,4])
print(se3)
1    5
2    5
3    5
4    5
dtype: int64

Series可以像列表一样索引比如print(se3[1:2])
还有学术不精的我第一次直到还能这样索引print(se3[[1,2,4]])
还有一个叫rendix()的函数可以以各种方式来索引
可以参考这位大佬的文章:[https://blog.csdn.net/youngbit007/article/details/53067707]

上一篇:Java SE基础知识——(发展历程、变量、基本数据类型)


下一篇:ASP.NET大文件上传支持切割上传