awk '/^>/ {printf("\n%s\t",$0);next;} {printf("%s",$0);} END {printf("\n");}' < assembly.fasta | egrep -v '^$' | tr "\t" "\n" | awk '!/^>/ { next } { getline seq } length(seq) > 200 { print $0 "\n" seq }' > assembly.fas
相关文章
- 02-17两个长度相同有序序列的中位数
- 02-17p115 最长递增子序列的长度(leetcode 300)
- 02-17awk 筛选特定长度的序列
- 02-172020-10-10 吴恩达DL学习-C5 序列模型-W1 循环序列模型(1.2 数学符号-时序序列数据表示符号/序列长度/one-hot表示字典里的单词)
- 02-17求最长上升子序列的长度(动态规划)
- 02-17使用KafkaAvroDecoder将Avro消息反序列化为特定的数据
- 02-17dataframe中如何筛选包含特定字符串(单个字符串、字符串列表)的列?
- 02-17b_lc_长度为 3 的不同回文子序列(统计两个相同字符中间有多少个不同字符)
- 02-17POJ - 3061 Subsequence(连续子序列和>=s的最短子序列长度)
- 02-171930. 长度为 3 的不同回文子序列