DataFrame 知识积累

- dataFrame 按照某列进行排序

 DataFrame.sort_values(by, axis=0, ascending=True, inplace=False, kind='quicksort', na_position='last', ignore_index=False, key=None)
 by=['col1']/['col1,'col2',...]  按照一列排序/按照多列排序

- dataframe 插入新列

	DataFrame.insert(loc, column, value, allow_duplicates=False)  [一次只能插入一列]

- dataframe 自动转化为数值类型

df = df.apply(pd.to_numeric, errors='ignore')

- dataframe选取特定的几列

df = df[['col1','col2']]

- 绘制dataframe中几列的相关系数的热度图

import matplotlib.pyplot as plt
import seaborn as sns
feaCorr = df2.corr()
plt.subplots(figsize=(18, 16))  # 设置画布大小
# annot=True 显示数值
sns.heatmap(feaCorr, cmap='RdBu', annot=True)
# plt.savefig("相关性.png")  # 保存图片 ,在调用show函数之前;在之后调用图片会显示空白.
plt.show()
上一篇:Python pandas.DataFrame.itertuples函数方法的使用


下一篇:Python pandas.DataFrame.last函数方法的使用