Pandas 常见用法个人随笔

以前在学校里,跑深度学习实验,数据都是规则的、同质化数值型数据,很少字符型,只需熟练掌握 numpy 来处理数组、矩阵即可。
现在来工业级做推荐算法了,收集的数据大量都是字符型、异构的数据,因此需要 pandas 进行处理。乘着周末来好好梳理一下 pandas 的常见用法。
主要参考书籍:

  • 《利用 Python 进行数据分析》pandas 之父
  • 《Python 数据科学手册》

pandas 主要是用来处理表格型、异质型数据

import pandas as pd
from pandas import Series, DataFrame
  • Series 是一种一维的数值型对象,包含一个值序列 (.values) 和一个索引 (.index),默认索引是从 0 到 N-1
obj = pd.Series([4, -2, 3, 4])
# 有两个属性,values, index
obj2 = pd.Series([4, -2, 3, 4], index=['d', 'b', 'c', 'a']
上一篇:OLED模块显示自己想要的字


下一篇:特征筛选10——最大信息系数(有监督筛选)