正则表达式 ------排序三工具(sort、uniq、wc)

一、sort 工具

(1)sort 是一个以行为单位对文件内容进行排序的工具,也可以根据不同的数据类型来排序

(2)sort 命令格式:sort [选项] 参数

(3)常用的选项

  • -f:忽略大小写;
  • -b:忽略每行前面的空格;
  • -M:按照月份进行排序;
  • -n:按照数字进行排序;
  • -r:反向排序;
  • -u:等同于 uniq,表示相同的数据仅显示一行;
  • -t:指定分隔符,默认使用[Tab]键分隔;
  • -o <输出文件>:将排序后的结果转存至指定文件;
  • -k:指定排序区域;

    示例1:将 /etc/passwd 文件中的账号进行排序

sort /etc/passwd

示例2:将/etc/passwd 文件中的第三列进行反向排序

sort -t : -rk 3 /etc/passwd

示例3:将 etc/passwd文件中第三列进行排序,并将输出内容保存至yyy.txt 文件中

sort -t : -k 3 /etc/passwd -o yyy.txt

二、uniq 工具

(1)uniq 工具在 Linux 系统中通常与 sort 命令结合使用,用于报告或者忽略文件中的重复行

(2)命令语法格式为:uniq [选项] 参数

(3)常用选项包括

  • -c:进行计数;
  • -d:仅显示重复行;
  • -u:仅显示出现一次的行;

    示例1:uniq命令去重,只能去连续的重复,如果隔开了还是会出现
    正则表达式 ------排序三工具(sort、uniq、wc)
    正则表达式 ------排序三工具(sort、uniq、wc)
    如果我们想去掉所有的重复行,都只出现一次的话,可以使用 sort -u 命令
    正则表达式 ------排序三工具(sort、uniq、wc)

三、wc 工具

1)统计指定文件中的字节数、字数、行数,并将统计结果显示输出。该命令统计指定文件中的字节数、字数、行数。如果没有给出文件名,则从标准输入读取。wc同时也给出所指定文件的总统计数。

(2)格式:wc [选项] 文件

(3)常用选项

  • -c 统计字节数;
  • -l 统计行数;
  • -m 统计字符数,注意这个标志不能与 -c 标志一起使用;
  • -w 统计字数,一个字被定义为由空白、跳格或换行字符分隔的字符串;
  • -L 打印最长行的长度;