正如大家所知,当你分叉时,孩子会获得所有内容的副本,包括文件和网络描述符 – man fork.
在PHP中,当您使用pcntl_fork时,所有用mysql_connect创建的连接都会被复制,这有点问题 – php docs和SO question.在这种情况下,常识是关闭父连接,创建new并让孩子使用旧连接.但如果说父母需要创造许多孩子几秒钟呢?在这种情况下,您最终会创建大量新连接 – 每一个叉子一个.
这在代码中意味着什么:
while (42) {
$db = mysql_connect($host, $user, $pass);
// do some stuff with $db
// ...
foreach ($jobs as $job) {
if (($pid = pcntl_fork()) == -1) {
continue;
} else if ($pid) {
continue;
}
fork_for_job($job);
}
mysql_close($db);
wait_children();
sleep(5);
}
function fork_for_job($job) {
// do something.
// does not use the global $db
// ...
exit(0);
}
好吧,我不想这样做 – 那就是与数据库的连接太多了.理想情况下,我希望能够实现与此类似的行为:
$db = mysql_connect($host, $user, $pass);
while (42) {
// do some stuff with $db
// ...
foreach ($jobs as $job) {
if (($pid = pcntl_fork()) == -1) {
continue;
} else if ($pid) {
continue;
}
fork_for_job($job);
}
wait_children();
sleep(5);
}
function fork_for_job($job) {
// do something
// does not use the global $db
// ...
exit(0);
}
你认为有可能吗?
其他一些事情:
>这是php-cli脚本
>我在第一个例子中尝试过使用mysql_pconnect,但据我所知,没有区别 – mysql服务器接收到新的连接数.也许那是因为它是cli和pconnect不能像在mod_php中那样工作.正如Marc注意到的那样 – 在php-cli中连接是没有意义的.
解决方法:
你唯一可以尝试的是让你的孩子等到彼此的孩子完成它的工作.这样您就可以使用相同的数据库连接(前提是没有任何同步问题).但是当然你会有很多进程,这也不是很好(根据我的经验,PHP有很大的内存使用率).如果有多个进程访问同一个数据库连接不是问题,您可以尝试创建共享连接的进程的“组”.所以你不必等到每个工作完成(你可以在整个团队完成后清理)并且你也没有很多连接.
您应该问问自己是否真的需要为工作进程建立数据库连接.为什么不让父进程获取数据并将结果写入文件?
如果确实需要连接,则应考虑使用其他语言来完成工作. PHPs cli本身不是一个“典型的”用例(它在4.3中添加),而且多处理比支持的功能更像是一个hack.