Pandas、Numpy使用笔记(更新中)

  • 读取csv文件
data = pd.read_csv('路径/文件名.csv',encoding='utf-8')
  • 按行读取数据
data = data[: n] # 取前n行
  • 按列读取数据
data = data[['列名1', '列名2']]
  • 将某列中的特定值进行替换
data['列名'] =data['列名'].replace('被替换值', '替换值') 
  • 按列名删除列
data = data.drop(columns=['列名1','列名2'], axis=1)
  • 按列值查找行
data.loc[data['列名']=='查找值']
  • 查找列值中不符合条件的数据行
data.loc[~data['列名'].isin(['值1','值2','值3'])]
  • 删除列值中含有NaN的行
data = data.dropna(axis=0,how='any') #drop all rows that have any NaN values
  • 在不添加额外索引列的前提下保存数据为csv文件
data .to_csv('./data.csv', index=False)
  • 将tensor(GPU)类型数据转换为numpy类型数据
top_pred = top_pred.cpu().numpy()
  • 将numpy类型数据按行拼接
pred_data = np.concatenate((pred_data, top_pred), axis=0)
  • 将numpy数据进行数据类型转换
pred_data = pred_data.astype(np.int)
  • 将numpy类型数据转换为DataFrame格式
data = pd.DataFrame(pred_data)
  • 保存为csv文件
data.to_csv('./result/result.csv')
上一篇:用PyTorch实现线性回归介绍


下一篇:AQS