- dataFrame 按照某列进行排序
DataFrame.sort_values(by, axis=0, ascending=True, inplace=False, kind='quicksort', na_position='last', ignore_index=False, key=None)
by=['col1']/['col1,'col2',...] 按照一列排序/按照多列排序
- dataframe 插入新列
DataFrame.insert(loc, column, value, allow_duplicates=False) [一次只能插入一列]
- dataframe 自动转化为数值类型
df = df.apply(pd.to_numeric, errors='ignore')
- dataframe选取特定的几列
df = df[['col1','col2']]
- 绘制dataframe中几列的相关系数的热度图
import matplotlib.pyplot as plt
import seaborn as sns
feaCorr = df2.corr()
plt.subplots(figsize=(18, 16)) # 设置画布大小
# annot=True 显示数值
sns.heatmap(feaCorr, cmap='RdBu', annot=True)
# plt.savefig("相关性.png") # 保存图片 ,在调用show函数之前;在之后调用图片会显示空白.
plt.show()