Linux-Shell-使用mkfifo实现多任务并发及并发数控制详解程序员

文章目录[隐藏]

Linux mkfifo命令
什么是命名管道？
如何识别命名管道？
如何设置自定义访问权限？
使用mkfifo实现多任务并发及并发数控制

Linux mkfifo命令

mkfifo命令基本上可以让你创建FIFO（又名命名管道）。以下是该命令的语法：

mkfifo [OPTION]... NAME...

什么是命名管道？

要理解这一点，你应该首先意识到基本管道的概念。你会看到包含竖线（|）的命令。这个栏被称为管道。它所做的是创建两个进程之间的通信通道（执行完整命令时）。

例如：

ls | grep .txt

上面提到的命令由两个程序组成： ls和grep 。这两个程序都由管道（ | ）分开。所以这里的管道是什么，它创建了这些程序之间的通信通道 - 当执行上述命令时，ls的输出将作为输入提供给grep。最后，在终端上显示的输出只包含那些在其中包含'.txt'字符串的条目。

现在有了命名管道的概念。正如名字本身所暗示的那样，这些名字就是管道。您可以使用mkfifo命令创建一个命名管道。例如：

mkfifo pipe2

所以'pipe2'现在是一个命名管道。现在问题是如何命名管道更有用？那么，考虑一下在终端中运行进程并生成输出的情况，并且您想要的是将该输出信道化到不同的终端。所以在这里，一个命名管道可以有很大的帮助。

例如，假设ls是在第一个终端中运行的进程，并且您希望在不同的终端中查看它的输出结果，那么您可以执行以下操作：

ls > pipe2

以下是您可以在第二个终端中执行的操作：

cat < pipe2

Linux-Shell-使用mkfifo实现多任务并发及并发数控制详解程序员

如何识别命名管道？

命名管道可以像文件一样正常访问。这意味着你可以使用ls命令来访问它们。如果您看到命名管道的访问权限，您会在开始时看到“p”。这表示相关文件是命名管道。这是一个例子：

IT虾米网

如何设置自定义访问权限？

正如您在前面的问答中所看到的那样，命名管道的默认访问权限分别为'rw'，'rw'和'r'（分别针对用户，组和其他人）。但是，如果您愿意，也可以设置自定义权限，您可以使用-m选项执行某些操作。

例如：

mkfifo pipe3 -m700

以下屏幕截图确认设置了自定义权限：

IT虾米网

要了解更多有关mkfifo的信息，可以使用--halp和--version选项。

使用mkfifo实现多任务并发及并发数控制

默认的情况下，Shell脚本中的命令是串行执行的，必须等到前一条命令执行完后才执行接下来的命令，但是如果我有一大批的的命令需要执行，而且互相又没有影响的情况下（有影响的话就比较复杂了），那么就要使用命令的并发执行了。

如下：

#!/bin/bash
IPLIST=/home/meta/ipinfo/iplist
for me in $(cat ${IPLIST} |grep -viE "^#|备机|ts"|awk '{print $1}')
do
ssh $me "cd ~/update/;tar zxf patch-20160909.tgz -C ~/LMDG/ && echo '/$me ok' || echo '/$me bad'"
done >> result.txt

echo "resutl"|mutt -a result.txt -s update-result

对于上面的代码，因为 iplist 中有好多ip，每个”tar zxf”都挺耗时的，所以打算使用并发编程，这样就可以节省大量时间了。

修改如下：

#!/bin/bash
IPLIST=/home/meta/ipinfo/iplist
for me in $(cat ${IPLIST} |grep -viE "^#|备机|ts"|awk '{print $1}')
do
ssh $i "cd ~/update/;tar zxf patch-20160909.tgz -C ~/LMDG/ && echo '/$i ok' || echo '/$me bad'" &
done >> result.txt

echo "resutl"|mutt -a result.txt -s update-result

加上“&” 之后 “tar zxf”就可以并行执行了。实质是将”tar zxf” 作为后台进程在执行，这样该命令就不会占用当前bash，其他命令也不用等待前面命令执行完再继续了，而且可以放入多个任务到后台，这样就实现了多任务并发。

我本来目的是让”tar zxf”这个循环都执行结束后，再“mutt”前面的结果。如果像上面这样写的话，在”tar zxf”都还没结束时就已经开始执行“mutt”了，得到了错误的结果，因此需要做如下修改：

这里添加了“wait” 之后就可以达到我们预期的效果了，wait的作用就是等待子任务都执行完之后在结束父任务，继而执行下面的任务。

但是，紧接着又有问题了，如果这个iplist中的量巨大，这样一口气都放到后台，系统超出负载后，会有性能变差或者宕机风险，因此我们需要一个控制并发数的机制。
因此我们引入了任务队列的概念，有点类似之前socket举例中的消费者生产者模型，通过消息队列来调节供需的不平衡
修改如下：

#!/bin/bash

IPLIST=/home/meta/ipinfo/iplist #任务（消费者）
THREAD=50 #声明并发线程并发个数，这个是此应用的关键，也就是设置管道的最大任务数
TMPFIFO=/tmp/$$.fifo #声明管道名称，'$$'表示脚本当前运行的进程PID
mkfifo $TMPFIFO #创建管道
exec 5<>${TMPFIFO} #创建文件标示符“5”，这个数字可以为除“0”、“1”、“2”之外的所有未声明过的字符，以读写模式操作管道文件；系统调用exec是以新的进程去代替原来的进程，但进程的PID保持不变，换句话说就是在调用进程内部执行一个可执行文件
rm -rf ${TMPFIFO} #清除创建的管道文件

#为并发线程创建同样个数的占位
for((me=1;me<=$THREAD;i++))
do
echo ;
#借用read命令一次读取一行的特性，使用一个echo默认输出一个换行符，来确保每一行只有一个线程占位；这里让人联想到生产者&消费者模型，管道文件充当消息队列，来记录消费者的需求，然后由生产者去领任务，并完成任务，这里运用了异步解耦的思想。
done >&5
#将占位信息写入管道

for me in $(cat ${IPLIST} |grep -viE "^#|备机|ts"|awk '{print $1}') #从任务队列中依次读取任务
do
read -u5
#从文件描述符管道中，获取一个管道的线程占位然后开始执行操作；read中 -u 后面跟fd，表示从文件描述符中读入，该文件描述符可以是exec新开启的。
{
echo $(cat ~/ipinfo/iplist|grep $i|awk '{print $2}');
ssh -oConnectTimeout=10 -oConnectionAttempts=3 $me "cd /home/Log/;grep 'MIL' mission_2016-08-03*.log |awk -F, '{if(/$19==1370) print /$0}'|
awk -F, '{if(/$20==0) print /$0}'>miss_info.txt"
echo "" >&5
#任务执行完后在fd5中写入一个占位符，以保证这个线程执行完后，线程继续保持占位，继而维持管道中永远是50个线程数，&表示该部分命令/任务放入后台不占当前的bash，实现并行处理
} &
done
wait #等待父进程的子进程都执行结束后再结束父进程
exec 5>&- #关闭fd5的管道
exit 0

原文链接：

　　https://blog.csdn.net/qq_34409701/article/details/52488964

　　IT虾米网

原创文章，作者：Maggie-Hunter，如若转载，请注明出处：https://blog.ytso.com/tech/aiops/1852.html

Linux-Shell-使用mkfifo实现多任务并发及并发数控制详解程序员

Linux mkfifo命令

什么是命名管道？

如何识别命名管道？

如何设置自定义访问权限？

使用mkfifo实现多任务并发及并发数控制

相关推荐

发表回复