xargs 是 execute arguments 的缩写,它的作用是从标准输入中读取内容,并将此内容传递给它要协助的命令,并作为那个命令的参数来执行。
坊间有一种说法,将 xargs 解读为乘号(x)和参数(args)的合体,很形象地表达了 xargs 的作用所在。
好了,我们一起来见识一下 xargs 的护花本领吧:
#我们用ls命令列出当前路径下的文件, 包括3个文件 [roc@roclinux ~]$ ls china.txt usa.txt japan.txt #我们通过xargs + ls的方式列出my.txt文件和your.txt文件 [roc@roclinux ~]$ echo "china.txt usa.txt" | xargs ls china.txt usa.txt
可以很清晰地看到,xargs 将 echo 的输出作为自己的标准输入,并且将其传递给了 ls 命令,作为 ls 命令的参数来执行。
xargs 和管道不得不说的故事
为了能够为大家解释清楚 xargs 和管道的关系,我们这次选用了更加典型的 cat 命令来为大家举例。
为什么选择 cat 命令呢?众所周知,cat 命令可以接收文件名作为参数,执行后会显示出文件的内容。但是 cat 命令不能直接从标准输入接收参数,正如下面的例子:
#cat后面直接指定china.txt参数, 可以展示china.txt文件的内容 [roc@roclinux ~]$ cat china.txt hello beijing #我们尝试通过标准输入把参数传给cat, 结果却只是显示了文件名而已 [roc@roclinux ~]$ echo china.txt | cat china.txt
从上面的例子中,我们可以得出下面的结论:
- 管道可以实现:将前面的标准输出作为后面的“标准输入”。
- 管道无法实现:将前面的标准输出作为后面的“命令参数”。
这个时候,就要有请 xargs 这位护花使者了。xargs 所擅长的正是“将标准输入作为其指定命令的参数”。说着有些拗口,但我相信大家懂的。
#xargs果然不负众望, 协助cat完成了使命 [roc@roclinux ~]$ echo china.txt | xargs cat hello beijing
我们知道,xargs 会将前一个命令的标准输出转换成命令参数,但很多人可能不知道的是,xargs 的标准输入中出现的“换行符、空格、制表符”都将被空格取代。下面来看一个带有换行符的例子:
#我们准备好了带有换行的标准输入 [roc@roclinux ~]$ echo -e "china.txt/njapan.txt" china.txt japan.txt #可见, 换行符和空格的作用一样 [roc@roclinux ~]$ echo -e "china.txt/njapan.txt" | xargs cat hello beijing hello tokyo
上面的例子是一个比较简单的场景,我们有时还会遇到更棘手的情况,一起来看一看。
当命令参数中包含了空格时,情况就会复杂很多,一起来看一个示例。
#我们创建了3个日志文件, 且故意让文件名称中都含有空格 [roc@roclinux ~]$ for((i=0;i<3;i++)); do touch "test ${i}.log";done #我们列出创建的文件 [roc@roclinux ~]$ ls -1F test 0.log test 1.log test 2.log #我们来运行xargs命令, 发现报错了 [roc@roclinux ~]$ find . -name '*.log' -print | xargs rm rm: cannot remove ‘./test’: No such file or directory rm: cannot remove ‘1.log’: No such file or directory rm: cannot remove ‘./test’: No such file or directory rm: cannot remove ‘0.log’: No such file or directory rm: cannot remove ‘./test’: No such file or directory rm: cannot remove ‘2.log’: No such file or directory
我们在当前目录中创建了 3 个文件,文件名中间都含有空格。但当 find 命令获取到的文件名经过 xargs 传送给 rm 命令时,文件“./test 1.log”就变成了“./test”和“1.log”两个文件了。即原本 3 个文件名刹那间就变成了 6 个文件名,而这 6 个文件其实并不存在,从而引发了错误。
这个错误的根源就在于 xargs 默认的分隔符是空格,如果我们能将 xargs 的分隔符改成其他符号,问题就迎刃而解了!
xargs 提供了-0
选项,允许将 NULL 作为分隔符,而 find 命令也心有灵犀地提供了对应的选项来产生以 NULL 字符作为分隔符的输出。
find 命令提供的对应方法是 -print0 选项,在文件名之后输出 NULL,而不像 -print 选项那样输出换行符(换行符会被 xargs 替换成空格)。
正如我们所期待的,命令果然正常执行了,完美!
[roc@roclinux ~]$ find . -name '*.log' -print0 | xargs -0 rm -f
对了,要补充一点,xargs 的-0
选项不仅可以将分隔符从默认的空格变成 NULL,还会将单引号、双引号、反斜线等统统默认为是普通字符。所以说,-0
选项特别适合处理命令参数中含有引号、空格、反斜线的情况。
如果你是一位 GEEK,希望掌握得更深入,那么我们就再补充一个知识点。除了可以使用-0
选项外,其实还可以使用-d
选项来指定任何一个符号作为分隔符。只是我们要格外慎重,避免我们所设定的那个分隔符恰好是我们命令参数中所包含的字符,那就会导致非预期的结果了。
让护花使者听我们的话
如果在前一个命令的标准输出中,会有一些参数是你不希望或者不确定是否要传送给后面命令的,这个时候我们就希望 xargs 在传送参数前和我们确认一下。而-p
选项恰好可以实现这个愿望,我们可以输入 y 或者 n 来选择是否要执行当前命令:
[roc@roclinux ~]$ find . -type f |xargs -p rm -f rm -f ./china.txt ./usa.txt ./japan.txt ?...n
上面的命令中,我们输入了“n”,也就是不希望删除这三个文件。不过,这样的确认粒度太粗,我们希望的是更精细地确认,来试试-n
选项吧:
[roc@roclinux 20160408]$ find . -type f |xargs -p -n 1 rm -f rm -f ./china.txt ?...n rm -f ./usa.txt ?...y rm -f ./japan.txt ?...n
使用-n
选项,可以让 xargs 每次只处理 1 个参数,这样做的好处是避免一次性删除过多文件,万一误删了不该删除的文件,那麻烦就大了。
遇到就停止
xargs 已经足够优秀了,可以帮助我们处理各种各样的问题。但我们对 xargs 还有更加苛刻的要求,那就是当碰到某个特定的命令参数时,要求 xargs 立即终止并退出。
这个效果,我们可以使用-E
选项来实现。
比如,我们正在处理一份日志文件 country.list 中的内容,将日志文件中的字符以空行作为分隔符依次 echo 出来,一旦遇到 korea 便终止退出:
[roc@roclinux ~]$ echo "china usa korea japan" > country.list [roc@roclinux ~]$ cat country.list china usa korea japan [roc@roclinux ~]$ cat country.list | xargs -E 'korea' echo china usa
可以看到当处理到 korea 的时候,xargs 机警地发现了状况,于是,按照我们的要求,立即终止并退出了。好乖的 xargs 啊!
你可能一生都不会遇到的参数过长报错
可能很多运维工程师都没有遇到过“Argument list too long”这样的报错。但要想成为一名资深的运维工程师,了解它的原因和解决方法还是很有必要的。
我们来模拟一个这样的场景,新建 10 万个日志文件,并且尝试用 rm 命令一次性删除:
[roc@roclinux ~]$ for((i=0;i<100000;i++)); do touch test${i}.log;done [roc@roclinux ~]$ rm $(find . -type f -name '*.log') -bash: /bin/rm: Argument list too long
出现了“Argument list too long”报错,这说明 rm 可接受的参数长度达到了极限。这其实并非 rm 的错,而是系统限制了参数的长度。通过下面的命令可以查看到系统的参数长度限制值:
[roc@roclinux ~]$ getconf ARG_MAX 2621440
如果真的遇到了参数过长的问题,我们的应对方法其实有很多种,比如把文件手工分组以缩短参数的长度,但是这个方法并不优雅,而且费时费力。最优雅的方法当然就是借助 xargs 啦:
[roc@roclinux ~]$ find . -name '*.log' -print | xargs rm
借助 xargs,并利用管道的特性,find 命令将输出的内容分段传给 rm 命令,而不是一股脑儿地塞过去。这样一来,rm 命令可以先处理最先获取的一部分文件,然后再处理下一批,并一直继续下去,直到全部删除为止。
好了,xargs 这位护花使者是不是既聪明又听话呢,在运维过程中,尝试使用起来吧,你会事半功倍的!
原创文章,作者:奋斗,如若转载,请注明出处:https://blog.ytso.com/21831.html