文本处理工具
目录
一、相关命令
wc, cut, sort, uniq
二、文本处理命令
1.wc:word counter
输出每个指定文件的行数、单词计数和字节数
wc [OPTION]... [FILE]...
-l:lines
-w:words
-c:characters
2.cut命令
从每个文件中输出指定部分到标准输出
cut [OPTION]... [FILE]...
-d DELIMITER:指明分隔符
--output-delimiter=STRING:指明输出分隔符
-f FILEDS: 要显示哪些字段
其中FILEDS可以是
#:第#个字段
#,#[,#]:离散的多个字段,例如1,3,6
#-#:连续的多个字段,
3.sort命令
串联排序所有指定文件并将结果写到标准输出
sort [OPTION]... [FILE]...
-f:忽略字符大小写
-r:降序排列
-t DELIMITER:字段分隔符
P.S. sort 命令以-t选项设定分隔符,cut 以-d选项设定分隔符
-k #:以指定字段开始为标准排序(按字符在ASCII码中排序,而不是按数值大小)-k, --key=位置1[,位置2] 在位置1 开始一个key,在位置2 终止(默认为行尾)
-n:以数值大小进行排序
-u:uniq,排序后去重
4.uniq命令
去除相邻的重复(连续且完全相同)行
uniq [OPTION]... [FILE]...
uniq:具|有sort不具备的特性
-c:显示每行重复出现的次数 counter
-d:仅显示重复过的行
-u:仅显示不曾重复的行
e.g. 结合sort和uniq,排序去重并显示重复的次数
练习
以冒号分隔,取出/etc/passwd文件的第6至第10行,并将这些信息按第3个字段的数值大小进行排序;最后仅显示的各自的第1个字段
head -10 /etc/passwd | tail -5 | sort -t: -k3n | cut -d: -f1
sort -k 选项 如果仅指定一个字段编号,则排序键值会自该字段的起始处开始,一直继续到记录的结尾
cut -f 选项要显示哪些字段
sort 命令以-t选项设定分隔符,cut 以-d选项设定分隔符
回顾
文本处理命令:wc, cut, sort, uniq
参考资料:
马哥随堂笔记
注:诚恳欢迎读者对本文提出批评意见,若发现存在错误,我定第一时间修改。如果读者觉得文章对您有帮助,欢迎点赞鼓励一下哟٩(๑❛ᴗ❛๑)۶。