提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档
文章目录
一、如何读取txt文件,将其转化为DataFrame格式
f = open("G:\\prediction\\BIOGRID-ORGANISM-Homo_sapiens-4.4.204.tab3.txt","r",encoding='utf-8') #设置文件对象
result=[]
for line in f.readlines():#readlines以列表输出文件内容
line=line.strip().split("\t")
result.append(line)
f.close() #将文件关闭
result=pd.DataFrame(result).dropna(axis=0)
二、给DataFrame添加列名
usedata.columns=["Official Symbol Interactor A","Official Symbol Interactor B"]
usedata
三、删除指定行
usedata=usedata.drop([0])
#[]里面是行号
四、读取csv文件,不让第一行成为列名
# 读取数据
import pandas as pd
score = pd.read_csv(r"C:\Users\zyy\Desktop\source_code\out_dbis\dbis.cac.w5.l10_other.csv",header=None).dropna(axis=1)
score
# 主要是header=None,如果不加,第一行就成为了列名
五、读取DataFrame的第几行第几列
score.loc[2]
# loc[i] 读取第i行
score.iloc[2]
# iloc[i] 读取第i列