在python中查找两个字符串的唯一组合

我有两个字符串:

StringA: ['K', 'T', 'T', 'T', 'K', 'K', 'G', 'T', 'T', 'T', 'T', 'K', 'K']

StringB: ['T', 'K', 'G', 'G', 'K', 'T', 'T', 'K', 'G', 'G', 'K', 'K', 'T']

我想测试字母的独特组合数.字符串是有序的,所以我只想将StringA位置1与StringB位置1相匹配,StringA位置2与StringB位置2相匹配,依此类推.因此,上述字符串中的对是(KT),(TK),(TG),( TG),(KK),(KT),(GT),(TK),(TG),(TG),(TK),(KK),(KT).

共有5种独特的组合:(KT),(TK),(TG),(GT),(KK)

我已使用以下代码从两个.csv文件生成字符串.

import sys
import csv

pairlist = open(sys.argv[1], 'r')
snp_file = open(sys.argv[2], 'r')

pair = csv.reader(pairlist, delimiter=',')
snps = csv.reader(snp_file, delimiter=',')

output = open(sys.argv[1]+"_FGT_Result", 'w')

snp1 = []
snp2 = []

firstpair = pair.next()

locusa = firstpair[0]
locusb = firstpair[1]

f = snps
        #search = snp.readlines()
for i, row in enumerate(f):
    if locusa in row:
        hita = row
        #print hita
        snp1.append(hita[2])
    if locusb in row:
        hitb = row
        #print hitb
        snp2.append(hitb[2])

print snp1
print snp2

pairlist.close()
snp_file.close()
output.close()

但我不知道如何进行比较.当我在另一个线程中阅读时,我试图将字符串转换为集合,这是必需的,但是我不确定为什么,并且无法使其正常工作.

解决方法:

只需使用zip并将其设置为两个字符串列表并获得唯一的组合即可.我使用列表推导返回组合的字符串:

>>> unique = [''.join(x)  for x in set(list(zip(StringA, StringB)))]
>>> unique
['TG', 'GT', 'KT', 'TK', 'KK']

另外,如果您只想将它​​们放在集合中,则可以删除列表理解:

>>> unique = set(zip(StringA, StringB))
>>> unique
{('T', 'K'), ('T', 'G'), ('K', 'K'), ('K', 'T'), ('G', 'T')}
上一篇:如何提高 PHP 代码的质量?第三:端到端 / 集成测试


下一篇:JavaScript中的多字段比较