Perl多進(jìn)程實(shí)戰(zhàn)
perl作為一種解釋性的語(yǔ)言,很受廣大系統(tǒng)管理員的歡迎,好處么就不多說(shuō)了,壞處也有不少,例如對(duì)線程的支持,就一直不咋地,所以大多數(shù)情況下,我們都需要多個(gè)進(jìn)程,來(lái)幫助我們完成工作,閑話(huà)少說(shuō),上代碼。
#!/usr/bin/perl
# test_proc.pl
# test multi process
# create by lianming: 2009-08-12
use strict;
use warnings;
## == fork a new process ==
my $pid = fork();
if (!defined($pid)) {
print "Error in fork: $!";
exit 1;
}
if ($pid == 0) {
## == child proc ==
print "Child: My pid = $$\n";
sleep(5);
print "Child: end\n";
exit 0;
} else {
## == parent proc ==
print "Parent My pid = $$, and my child's pid = $pid\n";
sleep(5);
print "Parent: end\n";
}
exit 0;
執(zhí)行結(jié)果如下:
Child: My pid = 19481
Parent My pid = 19480, and my child's pid = 19481
(5秒鐘等待)
Child: end
Parent: end
父進(jìn)程派生子進(jìn)程,之需要一條命令,那就是fork,fork函數(shù)的返回值賦給一個(gè)變量,上例中賦給了"$pid",接下來(lái),就要根據(jù)$pid值的不同,來(lái)分三種情況了。
1、fork失敗的情況:這個(gè)時(shí)候,$pid處于未定義的狀態(tài),上例中做的一個(gè)"if (!defined($pid))"的判斷,如果為真,說(shuō)明$pid未定義,fork失敗,這個(gè)時(shí)候就要打印錯(cuò)誤信息,并且退出。
2、子進(jìn)程:如果是子進(jìn)程,那么$pid的值為0,就是上例中"if ($pid == 0)"條件為真的狀況,在"$pid == 0"的時(shí)候,那就都是子進(jìn)程了,上例中,子進(jìn)程將自己的pid打出來(lái),為19481。
3、父進(jìn)程:如果是父進(jìn)程,那么$pid的值為它派生出的子進(jìn)程的pid,也就是不為0,就是else的情況,上例中把$pid打出來(lái),可以看到,也是 19481,就是子進(jìn)程的pid值。
這只是一個(gè)最簡(jiǎn)單的例子,一個(gè)父進(jìn)程派生一個(gè)子進(jìn)程,再稍微復(fù)雜一點(diǎn),一個(gè)父進(jìn)程派生多個(gè)子進(jìn)程,代碼如下:
#!/usr/bin/perl
# test_proc_1.pl
# test multi process
# create by lianming: 2009-08-12
use strict;
use warnings;
for (my $i = 0; $i < 10; $i ++) {
## == fork a new process ==
my $pid = fork();
if (!defined($pid)) {
print "Error in fork: $!";
exit 1;
}
if ($pid == 0) {
## == child proc ==
print "Child $i : My pid = $$\n";
sleep(5);
print "Child $i : end\n";
exit 0;
}
sleep(1);
}
exit 0;
這個(gè)例子就是,父進(jìn)程執(zhí)行一個(gè)循環(huán),每次循環(huán)都fork一個(gè)子進(jìn)程,子進(jìn)程執(zhí)行完以后退出,每次循環(huán)都等待1s,循環(huán)10次。
執(zhí)行結(jié)果如下:
Child 0 : My pid = 20499
Child 1 : My pid = 20500
Child 2 : My pid = 20501
Child 3 : My pid = 20502
Child 4 : My pid = 20503
Child 0 : end
Child 5 : My pid = 20506
Child 1 : end
Child 6 : My pid = 20507
Child 2 : end
Child 7 : My pid = 20508
Child 3 : end
Child 8 : My pid = 20509
Child 4 : end
Child 9 : My pid = 20510
Child 5 : end
[root@localhost /tmp]
# Child 6 : end
Child 7 : end
Child 8 : end
Child 9 : end
每個(gè)子進(jìn)程耗時(shí)5s,那么執(zhí)行完總共需要的是15s。
但是,這樣的代碼會(huì)導(dǎo)致一個(gè)問(wèn)題,在執(zhí)行的過(guò)程中,可以在另外的tty上輸入ps auxf來(lái)查看當(dāng)前的進(jìn)程狀態(tài),會(huì)發(fā)現(xiàn)類(lèi)似這樣的東東:
root 20531 0.0 0.0 8460 1704 pts/2 S+ 21:46 0:00 \_ perl test_proc_1.pl
root 20532 0.0 0.0 0 0 pts/2 Z+ 21:46 0:00 \_ [perl] <defunct>
root 20535 0.0 0.0 0 0 pts/2 Z+ 21:46 0:00 \_ [perl] <defunct>
root 20536 0.0 0.0 0 0 pts/2 Z+ 21:46 0:00 \_ [perl] <defunct>
root 20539 0.0 0.0 0 0 pts/2 Z+ 21:46 0:00 \_ [perl] <defunct>
root 20541 0.0 0.0 8460 720 pts/2 S+ 21:46 0:00 \_ perl test_proc_1.pl
root 20543 0.0 0.0 8460 720 pts/2 S+ 21:46 0:00 \_ perl test_proc_1.pl
root 20545 0.0 0.0 8460 720 pts/2 S+ 21:46 0:00 \_ perl test_proc_1.pl
root 20546 0.0 0.0 8460 720 pts/2 S+ 21:46 0:00 \_ perl test_proc_1.pl
root 20548 0.0 0.0 8460 720 pts/2 S+ 21:46 0:00 \_ perl test_proc_1.pl
有4個(gè)進(jìn)程,狀態(tài)為Z,意思就是僵尸進(jìn)程,而正常的程序,是不應(yīng)該出現(xiàn)僵尸進(jìn)程的。
正常情況下,子進(jìn)程的退出需要做兩件事情,第一,子進(jìn)程exit,發(fā)出一個(gè)信號(hào)給自己的父進(jìn)程,第二,父進(jìn)程對(duì)子進(jìn)程進(jìn)行回收,如果父進(jìn)程已經(jīng)不存在了,那子進(jìn)程會(huì)將init,也就是linux中第一個(gè)進(jìn)程作為自己的父進(jìn)程,init會(huì)代替它的父進(jìn)程對(duì)子進(jìn)程進(jìn)行回收。
我們的情況就是,子進(jìn)程已經(jīng)調(diào)用了exit,但是父進(jìn)程并沒(méi)有對(duì)它進(jìn)行回收,如果父進(jìn)程持續(xù)fork子進(jìn)程,那僵尸進(jìn)程就會(huì)越來(lái)越多,越來(lái)越多,最后會(huì)導(dǎo)致什么后果,我就不說(shuō)了。
父進(jìn)程回收子進(jìn)程的函數(shù)有兩個(gè):
wait,和waitpid
wait函數(shù)比較簡(jiǎn)單,沒(méi)有任何參數(shù),調(diào)用以后,父進(jìn)程會(huì)停住,然后等待子進(jìn)程返回。如果沒(méi)有子進(jìn)程,返回-1
waitpid有兩個(gè)參數(shù),第一個(gè)參數(shù)為要等待的子進(jìn)程的pid值,另外一個(gè)是flag,一般來(lái)講,第一個(gè)參數(shù)為-1,意思就是等待所有的子進(jìn)程。調(diào)用方法如下:
$procid = fork();
if ($procid == 0) {
# == child process ==
print ("this line is printed first\n");
exit(0);
} else {
# == parent process ==
waitpid ($procid, 0);
print ("this line is printed last\n");
}
其實(shí),最主要的是讓父進(jìn)程知道,什么時(shí)候才需要去回收已經(jīng)退出的子進(jìn)程,因?yàn)楦高M(jìn)程也是有很多活需要忙的。
這個(gè)可以通過(guò)信號(hào)來(lái)實(shí)現(xiàn),子進(jìn)程在退出的時(shí)候,會(huì)向父進(jìn)程發(fā)送一個(gè)信號(hào),我們只要捕獲了這個(gè)信號(hào),就知道,有些子進(jìn)程需要回收啦。例子如下:
#!/usr/bin/perl
# test_proc_2.pl
# test multi process
# create by lianming: 2009-08-12
use strict;
use warnings;
use POSIX ":sys_wait_h";
## == number of zombies proc ==
my $zombies = 0;
my $collect;
## == get the child signal ==
$SIG{CHLD} = sub { $zombies++ };
for (my $i = 0; $i < 10; $i ++) {
## == fork a new process ==
my $pid = fork();
if (!defined($pid)) {
print "Error in fork: $!";
exit 1;
}
if ($pid == 0) {
## == child proc ==
print "Child $i : My pid = $$\n";
sleep(5);
print "Child $i : end\n";
exit 0;
}
## == if need to collect zombies ==
if ($zombies > 0) {
while (($collect = waitpid(-1, WNOHANG)) > 0) {
$zombies --;
}
}
sleep(1);
}
exit 0;
執(zhí)行結(jié)果和原先一樣:
Child 0 : My pid = 21552
Child 1 : My pid = 21553
Child 2 : My pid = 21554
Child 3 : My pid = 21555
Child 4 : My pid = 21556
Child 0 : end
Child 5 : My pid = 21558
Child 1 : end
Child 6 : My pid = 21570
Child 2 : end
Child 7 : My pid = 21572
Child 3 : end
Child 8 : My pid = 21574
Child 4 : end
Child 9 : My pid = 21575
Child 5 : end
[root@localhost /tmp]
# Child 6 : end
Child 7 : end
Child 8 : end
Child 9 : end
但是ps auxf的結(jié)果就有很大差別了:
root 21551 0.1 0.0 8280 2672 pts/2 S+ 22:06 0:00 \_ perl test_proc_2.pl
root 21558 0.0 0.0 8280 1168 pts/2 S+ 22:07 0:00 \_ perl test_proc_2.pl
root 21570 0.0 0.0 8280 1168 pts/2 S+ 22:07 0:00 \_ perl test_proc_2.pl
root 21572 0.0 0.0 8280 1168 pts/2 S+ 22:07 0:00 \_ perl test_proc_2.pl
root 21574 0.0 0.0 8280 1168 pts/2 S+ 22:07 0:00 \_ perl test_proc_2.pl
root 21575 0.0 0.0 8280 1168 pts/2 S+ 22:07 0:00 \_ perl test_proc_2.pl
僵尸進(jìn)程不會(huì)存在了。
$SIG{CHLD} = sub { $zombies++ }; 這條語(yǔ)句,其實(shí)就是捕獲了子進(jìn)程退出的時(shí)候,向父進(jìn)程發(fā)出的信號(hào),捕獲以后,就給一個(gè)變量($zombies)加1。
如果"$zombies"不為0的時(shí)候,那就說(shuō)明,有子進(jìn)程退出了,需要進(jìn)行回收,那父進(jìn)程就調(diào)用waidpid函數(shù),進(jìn)行一次回收,每回收一個(gè)子進(jìn)程,就給這個(gè)變量減去1,這樣當(dāng)"$zombies"減為0的時(shí)候,就說(shuō)明所有的僵尸進(jìn)程都已經(jīng)回收了。bingo!
有的時(shí)候,我們只是執(zhí)行一定量的任務(wù),只管fork就可以了,但是某些時(shí)候,我們有太多任務(wù)需要執(zhí)行,要一直持續(xù)的fork好多子進(jìn)程,但是我們希望把子進(jìn)程的數(shù)目控制在一個(gè)范圍內(nèi),比如說(shuō),我一個(gè)任務(wù),需要有100個(gè)子進(jìn)程來(lái)執(zhí)行,但是我不能100個(gè)進(jìn)程全部fork出去,這樣太占用資源了,所以我希望把進(jìn)程數(shù)量控制在10個(gè)以?xún)?nèi),當(dāng)?shù)谝粋€(gè)進(jìn)程退出以后,我再fork第11個(gè)進(jìn)程,例子如下:
#!/usr/bin/perl
# test_proc_3.pl
# test multi process
# create by lianming: 2009-08-12
use strict;
use warnings;
use POSIX ":sys_wait_h";
## == number of proc ==
my $num_proc = 0;
## == number of collected ==
my $num_collect = 0;
my $collect;
## == get the child signal ==
$SIG{CHLD} = sub { $num_proc-- };
for (my $i = 0; $i < 10; $i ++) {
## == fork a new process ==
my $pid = fork();
if (!defined($pid)) {
print "Error in fork: $!";
exit 1;
}
if ($pid == 0) {
## == child proc ==
print "Child $i : My pid = $$\n";
sleep(5);
print "Child $i : end\n";
exit 0;
}
$num_proc ++;
## == if need to collect zombies ==
if (($i-$num_proc-$num_collect) > 0) {
while (($collect = waitpid(-1, WNOHANG)) > 0) {
$num_collect ++;
}
}
do {
sleep(1);
} until ($num_proc < 3);
}
exit 0;
執(zhí)行結(jié)果如下:
Child 0 : My pid = 22641
Child 1 : My pid = 22642
Child 2 : My pid = 22643
Child 0 : end
Child 3 : My pid = 22645
Child 1 : end
Child 4 : My pid = 22647
Child 2 : end
Child 5 : My pid = 22658
Child 3 : end
Child 6 : My pid = 22660
Child 4 : end
Child 7 : My pid = 22661
Child 5 : end
Child 8 : My pid = 22663
Child 6 : end
Child 9 : My pid = 22664
Child 7 : end
[root@localhost /tmp]
# Child 8 : end
Child 9 : end
同時(shí),看到的ps auxf的輸出如下:
root 22640 0.0 0.0 8116 2672 pts/2 S+ 22:28 0:00 \_ perl test_proc_3.pl
root 22660 0.0 0.0 0 0 pts/2 Z+ 22:29 0:00 \_ [perl] <defunct>
root 22661 0.0 0.0 8116 1168 pts/2 S+ 22:29 0:00 \_ perl test_proc_3.pl
root 22663 0.0 0.0 8116 1168 pts/2 S+ 22:29 0:00 \_ perl test_proc_3.pl
root 22664 0.0 0.0 8116 1168 pts/2 S+ 22:29 0:00 \_ perl test_proc_3.pl
第一個(gè)子進(jìn)程需要5s才能退出,如果1s執(zhí)行一次fork的話(huà),那么同時(shí)應(yīng)該有5個(gè)子進(jìn)程,但是本例中只有三個(gè),那就是說(shuō)實(shí)現(xiàn)了對(duì)進(jìn)程數(shù)量的控制。
本例中定義了幾個(gè)變量:
$num_proc:正在活動(dòng)的進(jìn)程數(shù)量,控制在3個(gè)以?xún)?nèi),所以在父進(jìn)程每次fork完子進(jìn)程后,都會(huì)檢查這個(gè)變量,如果超出了3個(gè),那就等一會(huì)。當(dāng)父進(jìn)程fork了新子進(jìn)程的時(shí)候,這個(gè)數(shù)字會(huì)增加,當(dāng)子進(jìn)程退出以后,父進(jìn)程捕獲了信號(hào),這個(gè)數(shù)字會(huì)減少。
$num_collect:已回收的進(jìn)程數(shù)量,每回收一個(gè)子進(jìn)程,變量加一。
$i:已經(jīng)fork的進(jìn)程數(shù)量。
$num_proc和$num_collect的和應(yīng)該是等于$i的,如果不等于了,那就說(shuō)明,有子進(jìn)程需要回收了。
進(jìn)程的控制還算簡(jiǎn)單吧?
本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶(hù)發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)
點(diǎn)擊舉報(bào)。