Python———pandas数据处理

pandas模块

更高级的数据分析工具
基于NumPy构建
包含Series和DataFrame两种数据结构,以及相应方法
调用方法:
from pandas import  Series, DataFrame
import pandas as pd
Series
又像数组又像字典:
有序
通常是同构的
元素采用NumPy中的数据类型
既以按键索引,又可以按序号索引
默认创建:
Python———pandas数据处理
 
以字典形式创建
Python———pandas数据处理

以常规形式创建

Python———pandas数据处理

Series算术运算中按照键来对齐

NaN和数字做运算,得NaN

Python———pandas数据处理

DataFrame

很像一个Excel表格
含有一组有序的列
列内(应该)同构,列之间可以是不同的数据类型
既有列索引,也有行索引
以二维结构保存数据(高维数据视作二维表格的叠加)
 
Python———pandas数据处理

改名?增加列

Python———pandas数据处理

按列读取、、按行读取

Python———pandas数据处理

按行、列索引

Python———pandas数据处理

丢弃指定行、列

Python———pandas数据处理

插入列

Python———pandas数据处理

过滤

Python———pandas数据处理

按索引排序

Python———pandas数据处理

Python———pandas数据处理

Python———pandas数据处理

上一篇:《selenium2 python 自动化测试实战》(19)——webdriver错误截图


下一篇:CDOJ 1962 天才钱vs学霸周2【最大流】