Linux命令:cat 两个文件,合并在一起
实习面试碰到的问题,当时不会
首先对于对文本文件查看和连接操作要想到cat(当时太菜没想到,直接gg),先简单介绍一下cat,其实最好是自己输入man cat查看官方解释,这才是最详细的。
我只说几个重点的参数
-b 或 --number-nonblank 从1开始,对每一行编号,空行除外
-n 或 --number 从1开始,对每一行编号
-s 或 --squeeze-blank当遇到连续两行空行时,只留一行
这几个经常用到的。
所以合并两个文件是 cat file1 file2 > file3
这里要注意一个>是新建文件,并合并两个内容;>>是把file1和file2附加到file3中
详细的有大牛博客:http://blog.sina.com.cn/s/blog_52f6ead0010127xm.html
到这里实现了基本功能,但是如果面试官又问,如果有重复怎么办
这时应该想到用uniq,具体参数可以自己查看man uniq,我这里只用到uniq处理重复行,但是要注意只能处理邻近的重复行,因此对文件要进行排序。
又要用到sort,sort是对文本进行排序,具体参数查看man sort
主要命令找到了,剩下的就是组合了
我理解的逻辑就是先读取两个文件 cat file1 file2
再将数据排序 cat file1 file2 | sort
再对数据去重 cat file1 file2 | sort | uniq
将数据写入文件中 cat file1 file2 | sort | uniq > file3
去重的合并两个文件就完成了
配合uniq的参数可以实现取两个文件的交集、异或之类的功能,通过不同参数的配合可以实现不同的功能,这里可以自己去摸索。