当前位置:首页 > 运维 > 正文内容

彻底弄懂502/503/504(php-fpm+nginx)亲测可用

phpmianshi6年前 (2015-04-16)运维249

环境 php7.3.5 + nginx1.16.0


相信大家都遇到过50X的问题,网上也看了很多文章,总是各种不对,所以今天咱们详解各种出现50X的情况和原因

502:Bad Gateway  作为网关或者代理工作的服务器尝试执行请求时,从上游服务器接收到无效的响应。

503:Service Unavailable 由于临时的服务器维护或者过载,服务器当前无法处理请求。这个状况是临时的,并且将在一段时间以后恢复。如果能够预计延迟时间,那么响应中可以包含一个 Retry-After 头用以标明这个延迟时间。如果没有给出这个 Retry-After 信息,那么客户端应当以处理500响应的方式处理它。

504:Gateway Time-out 作为网关或者代理工作的服务器尝试执行请求时,未能及时从上游服务器(URI标识出的服务器,例如HTTP、FTP、LDAP)或者辅助服务器(例如DNS)收到响应。


nginx+php 出现502 bad gateway,一般这都不是nginx的问题,而是由于 fastcgi或者php的问题导致的,常见的有以下几种。

1.php-fpm进程挂掉或者重启,大家可以service php-fpm stop 然后再打开php页面就返回502

nginx错误日志:

*153514 connect() to unix:/dev/shm/php-cgi.sock failed (2: No such file or directory) while connecting to upstream

所以平时我们要平滑重启 kill -USR2 pid  就不会报错了


2.php-fpm 平滑重启时也是有可能有502的,大家可以打开一个sleep(10) 的页面,然后service php-fpm reload  或者 kill -USR2 pid 测试

php-fpm错误日志:

/phpmianshi.com/test.php' (request: "GET /test.php") executing too slow

主要原因是:php-fpm.conf中process_control_timeout 设置过小造成的(默认0),sleep 收到 reload 发出的信号后直接返回了,所以出现了502

process_control_timeout 参数解释

参数含义是 设置子进程接受主进程复用信号的超时时间. 控制子进程处理来自master的信号的时间,默认为0.如果正在处理请求, 很可能会收到错误报警。


网上有专家介绍:建议将此参数设置为相同的值 request_terminate_timeout,以便worker有时间完成处理请求, 否则将会中断。


但是实际情况并不乐观,当设置过大时,压测会发现大量的502返回


我们改写一下测试脚本,设置 process_control_timeout = 5s

<?php
    echo 1;sleep(5);
    echo 2;sleep(5);
    echo 3;
?>

为了方便观察php-fpm进程数的变化,我们设置php-fpm.conf

pm = static
pm.max_children = 20

reload后设置监控:

watch -n 1 'ps aux |grep php-fpm'

这时候我们打开测试脚本 https://phpmianshi.com/test.php  接着执行 service php-fpm reload

查看监控页面发现,除了一个进程正在执行该脚本外,其他进程全部被kill掉了,一直到该脚本执行完毕,才正在的reload成功,启动了5个php-fpm

虽然reload导致第一个sleep立刻返回了,但是第二个sleep没有收到reload信号,所以超时时间大于了process_control_timeout的值,于是又返回了502

总结:process_control_timeout设置一个合理的值可以做到真正的平滑重启,但是也不能设置过大,设置过大reload过程中,如果有比较慢的处理,其他进程都没有启动,在高并发场景下会有更大的阻塞


3.request_terminate_timeout 设置的过小,php没有执行完就被中断,大家可以设置小一点,写一个sleep脚本测试

php-fpm错误日志:

[18-May-2015 19:37:47] WARNING: [pool www] child 7906, script '/data/wwwroot/mianshiphp/test.php' (request: "GET /test.php") executing too slow (1.295579 sec), logging
[18-May-2015 19:37:47] WARNING: [pool www] child 7906, script '/data/wwwroot/mianshiphp/test.php' (request: "GET /test.php") execution timed out (1.629247 sec), terminating
[18-May-2015 19:37:47] WARNING: [pool www] child 7906 exited on signal 15 (SIGTERM) after 72.682120 seconds from start

4.nginx fastcgi_read_timeout 设置过小,返回504

比如:设置 fastcgi_read_timeout =1 ,php脚本sleep(3)  ,则返回504

php-fpm错误日志:

[18-May-2020 20:01:47] WARNING: [pool www] child 12044, script '/data/wwwroot/mianshiphp/test.php' (request: "GET /test.php") executing too slow (1.235212 sec), logging

5.当服务器压力过大,没有更多的php-fpm处理请求时,返回504

比如设置php-fpm进程数为1,压力测试 ab -n 100 -c 20 https://phpmianshi.com/?id=90


有文章说,压力过大,没有足够的php-fpm处理时会返回502,这里还是分多种情况,我这边测试部分请求返回了200,其他请求返回了504


说明当php-fpm不足时,是有一个等待队列存在的。已经接到请求的php-fpm会返回200,长时间得不到php-fpm处理的请求就返回了504,


那么这个等待队列是什么呢?分析如下:


其实就是php-fpm.conf 中的listen.backlog配置 ,当backlog队列满了,会出现502错误

nginx_errror.log显示如下:

[error] 7820#0: *157186072 connect() to unix:/tmp/php-cgi.so
ck failed (11: Resource temporarily unavailable) while connecting to upstream



首先查看php活跃的套接字:  ss -ln |grep -E 'php|Netid'


Netid  State      Recv-Q Send-Q Local Address:Port               Peer Address:Port              
u_str  LISTEN     0      32768  /dev/shm/php-cgi.sock 79562794              * 0


关注 Recv-QSend-Q 这两个字段。


LISTEN 状态: Recv-Q 表示的当前等待服务端调用 accept 完成三次握手的 listen backlog 数值,也就是说,当客户端通过 connect() 去连接正在 listen() 的服务端时,这些连接会一直处于这个 queue 里面直到被服务端 accept();Send-Q 表示的则是最大的 listen backlog 数值,这就就是上面提到的 min(backlog, somaxconn) 的值。


于是修改listen.backlog = 1 ,同时开ab -n 5 -c 5 https://phpmianshi.com/backlog.php 测试,发现所有请求又都返回200了


ss -ln |grep -E 'php|Netid'


Netid  State      Recv-Q Send-Q Local Address:Port               Peer Address:Port              
u_str  LISTEN     3      32768  /dev/shm/php-cgi.sock 79562794              * 0


过一会 Recv-Q 慢慢减少到0,所有请求执行完成,说明php-fpm并没有拒绝后两次请求


具体原因如下:


当 queue 满了之后,服务器并不会按照理论所述,不再对 SYN 进行应答,返回 ETIMEDOUT。根据这篇文档的描述,服务器会随机的忽略收到的 SYN,建立起来的连接数可以无限的增加,只不过客户端会遇到延时以及超时的情况。


总结:适当增加max_children还是有用的,这样的话php-fpm能同时处理的请求增加,客户端的延迟等待时间也会相应的减小。


6.nginx配置了频率限制而client端又超过了配置的限制后就会收到503的响应。

nginx错误日志:

2015/05/21 03:29:02 [error] 23794#0: *525984942 limiting requests, excess: 20.66
0 by zone "one", client: 39.97.180.224, server: www.phpmianshi.com, request: "GET
/api/live.php HTTP/1.1", host: "www.phpmianshi.com", referrer: "-"


其他待补充...


总结:


解决问题的最好的方式还是自己去看nginx和fastcgi的errorlog。

最后做个总结: php-cgi进程数不够用、php执行时间长、或者是php-cgi进程死掉,都会出现502错误。

当nginx收到了无法理解的响应时,就返回502。当nginx超过自己配置的超时时间还没有收到请求时,就返回504错误。







版权声明:本文由PHP面试资料网发布,如需转载请注明出处。
分享给朋友:

相关文章


1、应用程序中调用read() 方法,这里会涉及到一次上下文切换(用户态->内核态),底层采用DMA(direct memory access)读取磁盘的文件,并把内容存储到内核地址空间的读取缓存区。

2、由于应用程序无法读取内核地址空间的数据,如果应用程序要操作这些数据,必须把这些内容从读取缓冲区拷贝到用户缓冲区。这个时候,read() 调用返回,且引发一次上下文切换(内核态->用户态),现在数据已经被拷贝到了用户地址空间缓冲区,这时,如果有需要,应用程序可以操作修改这些内容。

3、我们最终目的是把这个文件内容通过Socket传到另一个服务中,调用Socket的send()方法,这里又涉及到一次上下文切换(用户态->内核态),同时,文件内容被进行第三次拷贝,被再次拷贝到内核地址空间缓冲区,但是这次的缓冲区与目标套接字相关联,与读取缓冲区没有半点关系。

4、send()调用返回,引发第四次的上下文切换,同时进行第四次的数据拷贝,通过DMA把数据从目标套接字相关的缓存区传到协议引擎进行发送。

"在整个过程中,过程1和4是由DMA负责,并不会消耗CPU,只有过程2和3的拷贝需要CPU参与


如果在应用程序中,不需要操作内容,过程2和3就是多余的,如果可以直接把内核态读取缓存冲区数据直接拷贝到套接字相关的缓存区,是不是可以达到优化的目的?

Linux中nio的实现原理

我们上一篇文章 《linux中netstat和ss命令详解》中提到了nio 原文:https://phpmianshi.com/?id=105有一些小伙伴私信想了解什么是nio,我们这篇详细介绍下什么...

linux中netstat和ss命令详解

由于nio的普及,ck10k的问题已经成为过去式。现在随便一台服务器,都可以支持数十万级别的连接了。那么10万的连接需要多少资源呢?由于一个连接都是文件句柄,所以需要文件描述符数量支持才行,每一个so...

linux中如何查看系统io使用情况

linux中查看IO的方法主要有下面几种方法:1. top   %wa    的含义是等待输入输出的CPU时间百分比,这个数字越高说明越多的CPU资源...

守护进程详解及其代码实现

1、概念理解:守护进程(Daemon)是运行在后台的一种特殊进程,也称为精灵进程。是生存期较长的一种进程,常常在系统自举时启动,仅在系统关闭时终止。没有控制终端,仅仅在后台运行,Linux有很多守护进...

dnsmasq搭建DNS服务器详解

Dnsmasq 简介Dnsmasq 是一个轻量级的 DNS 缓存、DHCP、TFTP、PXE 服务器。作为域名解析服务器,dnsmasq 可以通过缓存 DNS 请求来提高对访问过域名的解析速度。作为...

高并发场景下backlog详解

本文详解高并发场景下backlog的配置和作用环境介绍: PHP 7.3.5 +nginx/1.16.0 +Linux VM_0_15_centos 3.10.0-514.26.2.el7.x86_6...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。