做 CDN 运维的朋友,多多少少都碰到过回源失败的问题:用户访问页面报 5xx 错误、静态资源加载不出来、后台监控显示回源率异常。
这种问题一旦出现,对业务影响很大,很多人第一反应是找服务商排查,但其实大部分常见问题,自己就能快速定位。
我见过不少案例,回源失败的原因大多集中在几个点:源站 IP 被封禁、回源端口没开、证书配置不匹配,或者是源站的防火墙拦截了 CDN 节点的访问。
还有些情况,是因为源站带宽跑满、CPU 占用过高,导致回源请求超时,看起来像是 CDN 的问题,根源其实在源站本身。
排查的时候,我习惯按这个顺序来:
1. 先看 CDN 后台的错误日志,确认是连接超时、403 拒绝,还是证书错误;
2. 直接在节点上 telnet 源站 IP 和端口,测试网络通不通;
3. 检查源站防火墙 / 安全组,有没有放通 CDN 节点的 IP 段;
4. 核对 HTTPS 证书是否过期、域名是否匹配;
5. 最后再排查源站本身的性能和负载情况。
大部分问题,通过这几步就能定位到。比如之前帮客户排查过一个案例,就是源站的安全组规则不小心被修改了,把 CDN 节点的 IP 段给屏蔽了,导致所有回源请求被拒绝,调整规则后几分钟就恢复了。
360CDN 在后台提供了详细的回源日志和状态码监控,能直接看到每个请求的失败原因,配合这些工具排查,效率会高很多。
