python处理数据的一些代码

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档

文章目录


一、如何读取txt文件,将其转化为DataFrame格式

f = open("G:\\prediction\\BIOGRID-ORGANISM-Homo_sapiens-4.4.204.tab3.txt","r",encoding='utf-8')   #设置文件对象
result=[]
for line in f.readlines():#readlines以列表输出文件内容
            line=line.strip().split("\t")
            result.append(line)
f.close()   #将文件关闭
result=pd.DataFrame(result).dropna(axis=0)

二、给DataFrame添加列名

usedata.columns=["Official Symbol Interactor A","Official Symbol Interactor B"]
usedata

python处理数据的一些代码

三、删除指定行

usedata=usedata.drop([0])
#[]里面是行号

四、读取csv文件,不让第一行成为列名

# 读取数据
import pandas as pd
score = pd.read_csv(r"C:\Users\zyy\Desktop\source_code\out_dbis\dbis.cac.w5.l10_other.csv",header=None).dropna(axis=1)
score
# 主要是header=None,如果不加,第一行就成为了列名

python处理数据的一些代码

五、读取DataFrame的第几行第几列

score.loc[2]
# loc[i] 读取第i行
score.iloc[2]
# iloc[i] 读取第i列
上一篇:关于python __str__ and __repr__


下一篇:Python 基础二