今天下午17:00-17:05之间,在请求量没有明显变化的情况下,SLB中的1台云服务器的CPU突然串到100%(当时SLB中一共有3台云服务器),见下图:

阿里云云服务器CPU 100%

造成的直接后果是请求执行时间变得超长,最长竟然达到了53秒(下图中的紫色线条)。

阿里云ECS请求执行时间变长

另外伴随的表现是大量请求排队。

请求排队监测图

再看看这个时间段其它2台服务器的表现:

云计算之路-阿里云上:2014年6月11日17点遇到的CPU 100%状况

云计算之路-阿里云上:2014年6月11日17点遇到的CPU 100%状况

从这些现象分析,我们猜测CPU 100%这台云服务器出现了CPU资源争抢问题,将之从SLB中摘除后恢复正常。