plink格式中如何提取重复的位点

1、

dat <- read.table("test.map",header = F)
dat2 <- dat[c(1,4)]
unique(sort(dat2$V1))
dat2[dat2$V1 == "X",]$V1 = 10000
dat2$V1 <- as.numeric(dat2$V1)
dat2$V4 <- as.numeric(dat2$V4)
dat3 <- dat2[order(dat2$V1,dat2$V4),]
dat4 <- dat[duplicated(dat3),]
dim(dat4)
write.table(dat4$V2, "dup1.txt",col.names = F, row.names = F,quote = F,sep = "\t")

plink格式中如何提取重复的位点

 

 

2、简化程序

dat <- read.table("test.map",header = F)
dat2 <- dat[c(1,4)]
dat3 <- dat[duplicated(dat2),]
write.table(dat3$V2, "dup2.txt",col.names = F, row.names = F,quote = F,sep = "\t")

plink格式中如何提取重复的位点

 

上一篇:plink软件计算位点杂合度和样本杂合度


下一篇:《Java编码指南:编写安全可靠程序的75条建议(英文版)》—— 2.11 测验