更新时间:2023-12-28 13:32:45

以下应用场景为指标状态图和指标趋势图相结合来进行具体问题排查。

针对因用户请求数量增加导致应用软件性能下降原因分析场景:项目部署之后,随着业务量的增加,服务的处理性能在不断下降,此时系统管理员在对请求链路分析时发现,随着用户数量的增加,请求数激增,在请求MongoDB服务时,耗时较高。使用【MongoDB-性能剖析】仪表盘查看MongoDB服务指标时发现,此时MongoDB服务的QPS和TPS不断下降,处理的操作数在不断下降,且操作延迟在不断增加。如下图所示。此时系统管理员需要对MongoDB服务进行性能分析,定位性能瓶颈,提出相关的性能优化方案。

第 1 步:基于Linux全息观测仪表盘对MongoDB服务器资源进行分析。进入【01-Linux概览】仪表盘,根据主机IP进行筛选出MongoDB所在服务器,查看服务器系统指标是否出现正常,如下所示:

此时发现MongoDB服务器运行正常, CPU利用率正常,但在发生问题的时间段内,内存使用率和系统的五分钟负载较高,且磁盘IO到达97%。表示磁盘正在受到相当大的负载。此时需要对磁盘资源使用情况做进一步分析。

第 2 步:根据【01-性能剖析】仪表盘对磁盘相关的指标进行分析,如下所示:

此时发现在当前服务器当中,磁盘的写入速率写入次数速率均比较高,磁盘的写入速率已达到当前磁盘的写入速率瓶颈,此时可以推断出当用户的请求数量增加之后,会导致MongoDB出现大量的写磁盘操作,写入的速率过高,导致磁盘出现写入瓶颈,从而影响应用的整体性能。此时需要对MongoDB的相关指标进行分析,定位导致MongoDB出现大量写磁盘操作的原因。然后结合实际情况对MongoDB服务进行优化。