php多进程总结
2021-03-22 20:26
标签:nis back switch 丢失 ict rsync github host 准备 场景:日常任务中,有时需要通过php脚本执行一些日志分析,队列处理等任务,当数据量比较大时,可以使用多进程来处理。 准备:php多进程需要pcntl,posix扩展支持,可以通过 php - m 查看,没安装的话需要重新编译php,加上参数 注意: 多进程实现只能在cli模式下,在web服务器环境下,会出现无法预期的结果,我测试 注意两点:如果是在循环中创建子进程,那么子进程中最后要exit,防止子进程进入循环。 pcntl_fork: 一次调用两次返回,在父进程中返回子进程pid,在子进程中返回0,出错返回-1。 pcntl_wait ( int &$status [, int $options ] ): 阻塞当前进程,直到任意一个子进程退出或收到一个结束当前进程的信号,注意是结束当前进程的信号,子进程结束发送的SIGCHLD不算。使用$status返回子进程的状态码,并可以指定第二个参数来说明是否以阻塞状态调用 阻塞方式调用的,函数返回值为子进程的pid,如果没有子进程返回值为-1; 非阻塞方式调用,函数还可以在有子进程在运行但没有结束的子进程时返回0。 上面的shell程序,列了一个很简单的多进程程序,用一个for循环,实现了8进程并发来跑multiprocessTest.php这个程序。最后的wait语句,也可以使主进程,再等待所有进程都执行完后再往下执行的需求。 这个程序是没有问题的,很多现有的代码也都这样实现,但是这个程序的并发数是不可控的,即我们无法根据机器的核数去调度每一个进程的开关。 若我们的机器有8核或者更多,上面的程序是没有问题的,所有核都能充分利用,并且互相之间,没有争抢资源的情况出现。 但我们的机器要没有8核的话会是什么情况,同一时间运行的进程数多于核数,那么系统就会出现进程分配调度的问题,争抢资源也跟着相应而来,一个进程不能保证独立连续的执行,所有的进程运行会听从系统的调度,这样就会有更多的不确定因素出现。 (1) 父进程通过wait和waitpid等函数等待子进程结束,这会导致父进程挂起。它不适合子进程需要长时间运行的情况(会导致超时)。 执行wait()或waitpid()系统调用,则子进程在终止后会立即把它在进程表中的数据返回给父进程,此时系统会立即删除该进入点。在这种情形下就不会产生defunct进程。 (2) 如果父进程很忙,那么可以用signal函数为SIGCHLD安装handler。在子进程结束后,父进程会收到该信号,可以在handler中调用wait回收。 (3) 如果父进程不关心子进程什么时候结束,那么可以用signal(SIGCLD, SIG_IGN)或signal(SIGCHLD, SIG_IGN)通知内核,自己对子进程的结束不感兴趣,那么子进程结束后,内核会回收,并不再给父进程发送信号 (4)fork两次,父进程fork一个子进程,然后继续工作,子进程fork一个孙进程后退出,那么孙进程被init接管,孙进程结束后,init会回收。不过子进程的回收还要自己做。 php多进程总结 标签:nis back switch 丢失 ict rsync github host 准备 原文地址:https://www.cnblogs.com/liliuguang/p/12697002.html--enable-pcntl,posix一般默认会有。
报错:
Call to undefined function: pcntl_fork()
一个错误 pcntl_fork causing “errno=32 Broken pipe” #474 ,看https://github.com/phpredis/phpredis/issues/474
子进程中的打开连接不能拷贝,使用的还是主进程的,需要用多例模式。/** 确保这个函数只能运行在SHELL中 */
if (substr(php_sapi_name(), 0, 3) !== ‘cli‘) {
die("cli mode only");
}
#!/bin/bash
for((i=1;i
= $maxChildPro) {
pcntl_wait($status);
}
} else {
//子进程运行代码
$s = rand(2, 6);
sleep($s);
echo "child sleep $s second quit", PHP_EOL;
exit;
}
}
0) {
foreach ($childs as $key => $pid) {
$res = pcntl_waitpid($pid, $status, WNOHANG);
//-1代表error, 大于0代表子进程已退出,返回的是子进程的pid,非阻塞时0代表没取到退出子进程
if ($res == -1 || $res > 0)
unset($childs[$key]);
}
sleep(1);
}
_getPassword();
$online_log_path = NginxConf::getArchiveDir($this->_stat_day);
$task_log_path = QFrameConfig::getConfig(‘LOG_PATH‘);
$children = array();
$success = true;
foreach($this->_server_list as $host => $value)
{
$local_dir = $this->_prepareLocalDir($host);
$task_log = "$task_log_path/fetch_log.$host";
$cmd = "sshpass -p $password rsync -av -e ‘ssh -o StrictHostKeyChecking=no‘ $host:$online_log_path/* $local_dir >> $task_log 2>&1";
$pid = pcntl_fork();
if(-1 === $pid)
{
LogSvc::log(‘stat_pv_by_citycode_error‘, ‘could not fork‘);
exit(‘could not fork‘);
}
else if(0 === $pid)
{
system($cmd, $return_value);
if(0 !== $return_value)
{
LogSvc::log(‘stat_pv_by_citycode_error‘, "rsync $host error");
}
exit($return_value);
}
else
{
$children[$pid] = 1;
}
}
while(!empty($children))
{
$pid = pcntl_waitpid(-1, $status, WNOHANG);
if(0 === $pid)
{
sleep(1);
}
else
{
if(0 !== pcntl_wexitstatus($status))
{
$success = false;
}
unset($children[$pid]);
}
}
return $success;
}
posix_kill(posix_getpid(), SIGHUP);
为自己生成SIGHUP信号
declare(ticks = 1); //php
pcntl_signal()
函数仅仅是注册信号和它的处理方法,真正接收到信号并调用其处理方法的是pcntl_signal_dispatch()
函数必须在循环里调用,为了检测是否有新的信号等待dispatching。pcntl_signal_dispatch()
declare(ticks = 1);
表示每执行一条低级指令,就检查一次信号,如果检测到注册的信号,就调用其信号处理器。kill [PID]
命令,未加任何其他参数的话,程序会接收到一个SIGTERM信号。 = 5.3
* 调用已安装的信号处理器
* 必须在循环里调用,为了检测是否有新的信号等待dispatching。
*/
if (!function_exists("pcntl_signal_dispatch")) {
pcntl_signal_dispatch();
}
}
ps -A -ostat,ppid,pid,cmd | grep -e ‘^[Zz]‘
命令注解:
-A 参数列出所有进程
-o 自定义输出字段 我们设定显示字段为 stat(状态), ppid(进程父id), pid(进程id),cmd(命令)这四个参数状态为 z或者Z 的进程为僵尸进程,所以我们使用grep抓取stat状态为zZ进程
运行结果如下:
这时,可以使用
kill -HUP 5255 杀掉这个进程。如果再次查看僵尸进程还存在,可以kill -HUP 5253(父进程)。
如果有多个僵尸进程,可以通过
ps -A -ostat,ppid,pid,cmd | grep -e ‘^[Zz]‘|awk ‘print{$2}‘|xargs kill -9
处理。
多进程--进程间通信(IPC)