文本处理工具

目录

一、相关命令

二、文本处理命令

1.wc:word counter

2.cut命令

3.sort命令

4.uniq命令

练习

回顾

一、相关命令

wc, cut, sort, uniq

二、文本处理命令

1.wcword counter

输出每个指定文件的行数、单词计数和字节数

      wc [OPTION]... [FILE]...

-l:lines

-w:words

            -ccharacters

文本处理工具

2.cut命令

从每个文件中输出指定部分到标准输出

cut [OPTION]... [FILE]...

-d DELIMITER:指明分隔符

--output-delimiter=STRING:指明输出分隔符

-f FILEDS: 要显示哪些字段

其中FILEDS可以是

                                         #:第#个字段

                                         #,#[,#]:离散的多个字段,例如1,3,6

                                         #-#:连续的多个字段,

文本处理工具

文本处理工具

3.sort命令

串联排序所有指定文件并将结果写到标准输出

      sort [OPTION]... [FILE]...

            -f忽略字符大小写

            -r降序排列

            -t DELIMITER字段分隔符

            P.S. sort 命令以-t选项设定分隔符,cut 以-d选项设定分隔符

            -k #以指定字段开始为标准排序(按字符在ASCII码中排序,而不是按数值大小)-k, --key=位置1[,位置2]     在位置1 开始一个key,在位置2 终止(默认为行尾)

文本处理工具

            -n数值大小进行排序

            -uuniq,排序后去重

文本处理工具

文本处理工具

4.uniq命令

去除相邻的重复(连续且完全相同)

uniq [OPTION]... [FILE]...

uniq:具|有sort不具备的特性

-c显示每行重复出现的次数  counter

            -d显示重复过的行

            -u仅显示不曾重复的行

文本处理工具

文本处理工具

e.g. 结合sort和uniq,排序去重并显示重复的次数

文本处理工具

练习

以冒号分隔,取出/etc/passwd文件的第6至第10行,并将这些信息按第3个字段的数值大小进行排序;最后仅显示的各自的第1个字段

head -10 /etc/passwd | tail -5 | sort -t: -k3n | cut -d: -f1文本处理工具

文本处理工具

sort -k 选项 如果仅指定一个字段编号,则排序键值会自该字段的起始处开始,一直继续到记录的结尾

cut -f 选项要显示哪些字段

sort 命令以-t选项设定分隔符,cut 以-d选项设定分隔符

回顾

      文本处理命令:wc, cut, sort, uniq

参考资料:

马哥随堂笔记

注:诚恳欢迎读者对本文提出批评意见,若发现存在错误,我定第一时间修改。如果读者觉得文章对您有帮助,欢迎点赞鼓励一下哟٩(๑❛ᴗ❛๑)۶。