在处理文本文件时,很多时候需要我们处理跨行的数据,但是用for循环处理不是很方便,想了一个歪招来处理不是很大的数据。
核心思想就是将上一行的东西存在一个列表里,到下一行用完这个数据在循环体里将列表初始化,再将这行数据存到列表里,这样循环就可以把两行数据联系起来。
另外这样做的还有另外一个好处,就是可以初始化第一行,我们可以通过判断这个“传递列表”空与否来区分标题行的输入和其他循环体的输入情况。
from __future__ import division from sys import argv from itertools import islice Mutation = open('DivFile_sort_chr' + argv[1] +'.txt',"r") REC = open('GeneticMap_Chr' + argv[1],"r") RECList = open('REC_Chr_' + argv[1], "a") transList = [] SNPPosList = [] rholist = [] for lines in islice(Mutation, 1, None): line = lines.strip('\n').split("\t") POS = line[0] SNPPosList.append(POS) print "SNPPos done" for lines in islice(REC, 1, None): line = lines.strip('\n').split("\t") if transList == []: transList.append((line[0],line[1])) RECList.write("position\trate\n") RECList.write('%s\t%s\n' %(line[0],0)) print "headline" else: rho = (float(line[1]) - float(transList[0][1])) / (float(line[0]) - float(transList[0][0])) for i in SNPPosList: if int(i) < int(line[0]) and int(i) > int(transList[0][0]): index = int(SNPPosList.index(i) - 1) site_rho = (int(i) - int(SNPPosList[index])) * rho RECList.write('%s\t%s\n' %(i,site_rho)) else: continue transList = [] transList.append((line[0],line[1],rho)) rholist.append(rho) print rholist for i in SNPPosList: if i > int(transList[0][0]): index = int(SNPPosList.index(i) - 1) site_rho = (int(i) - int(SNPPosList[index])) * rho RECList.write('%s\t%s\n' %(i,site_rho)) else: continue Mutation.close() REC.close() RECList.close()