http://www.jquerycn.cn/a_9076
在linux中,使用sort按行进行排序是很简单的。
不过有时,生活总是爱抛给你一个一个的问题。如果使用sort按多个列值排列,同时使用tab作为分隔符,而且对于某些列需要进行逆序排列,这样sort命令来实现就略显折腾。
来看具体的例子吧。
比如下面的文件内容,使用[TAB]进行分割:
Group-ID Category-ID Text Frequency
----------------------------------------------
200 1000 oranges 10
200 900 bananas 5
200 1000 pears 8
200 1000 lemons 10
200 900 figs 4
190 700 grapes 17
----------------------------------------------
200 1000 oranges 10
200 900 bananas 5
200 1000 pears 8
200 1000 lemons 10
200 900 figs 4
190 700 grapes 17
下面使用这些列进行排序(列4在列3之前进行排序,而且列4是逆序排列)
* Group ID (integer)
* Category ID (integer)
* Frequency “sorted in reverse order” (integer)
* Text (alpha-numeric)
* Category ID (integer)
* Frequency “sorted in reverse order” (integer)
* Text (alpha-numeric)
排序后的结果应该为:
Group-ID Category-ID Text Frequency
----------------------------------------------
190 700 grapes 17
200 900 bananas 5
200 900 figs 4
200 1000 lemons 10
200 1000 oranges 10
200 1000 pears 8
----------------------------------------------
190 700 grapes 17
200 900 bananas 5
200 900 figs 4
200 1000 lemons 10
200 1000 oranges 10
200 1000 pears 8
可以直接使用sort命令,解决这个问题:
复制代码代码示例:
sort -t $'\t' -k 1n,1 -k 2n,2 -k4rn,4 -k3,3 <my-file>
解释如下:
-t $'\t':指定TAB为分隔符
-k 1, 1: 按照第一列的值进行排序,如果只有一个1的话,相当于告诉sort从第一列开始直接到行尾排列
n:代表是数字顺序,默认情况下市字典序,如10<2
r: reverse 逆序排列,默认情况下市正序排列
最终的linux命令如下:
复制代码代码示例:
sort -t $'\t' -k 1n,1 -k 2n,2 -k4rn,4 -k3,3 my-file