Illumina Sequence Identifiers 序列标识符 index详解

大家基本都知道什么是 FASTA 和 FastQ 格式了,但这是不够的。

我们还需要了解世界上最大的测序公司自己定制的 FastQ 格式,因为你可能会经常用到,有时还会亲自去处理它们。

本文主题:Illumina 测序数据中的 Index

Fastq格式详解

@FCHCGKFBCXY:1:1101:1110:2162#AACAGCACCTAGCA_GTAGTGCG/1
ATGTATACTATTGTATGTGAAATGGATCACCAGTCCAGGTTCAACGCCCGAGACAGGGTGCTCAGGGCTGGTGCACTGGATGACCCTGAGGGACGGGATG
+
cccccggegghgbgggggdfgdegfhggggdgfdgghdgggghfghhhhhghhgggdgdgghhhhghhhgghfhghdPcdgPc_dfghbdgfghhhhhgg
@FCHCGKFBCXY:1:1101:1077:2164#NNNNNNNNNNNNNN_NNNNNNNN/1
TGCTGAGCATCAGATCAACCTGATTAAGGTTGATGACAACAAGAAACTAGGGGAATGGGTAGGCCTCTGTAAAANNGANANNNNNNNNNNNNNNNNNNNN
+
ccccchhhhhhhhghhgfgghhhhhhhghhhhhhhhhhhhghhhgghghhhhgghgd_gggghhgghghhhghhBBBBBBBBBBBBBBBBBBBBBBBBBB

ILLUMINA SEQUENCE IDENTIFIERS

@HWUSI-EAS100R:6:73:941:1973#0/1

HWUSI-EAS100R:the unique instrument name

6:flowcell lane

73:tile number within the flowcell lane

941:‘x’-coordinate of the cluster within the tile

1973:‘y’-coordinate of the cluster within the tile

#0:index number for a multiplexed sample (0 for no indexing)

/1:the member of a pair, /1 or /2 (paired-end or mate-pair reads only)

 

有了index就可以同时在一个lane中测多种数据了,后期可以根据index将数据分开。

上一篇:什么php?


下一篇:MVC中AuthorizeAttribute用法并实现权限控制