线上问题排查回答(转载)

yizhihongxing

面试官:「你是怎么定位线上问题的?」

这个面试题我在两年社招的时候遇到过,前几天面试也遇到了。我觉得我每一次都答得中规中矩,今天来梳理复盘下,下次又被问到的时候希望可以答得更好。

下一次我应该会按照这个思路去答:

1、如果线上出现了问题,我们更多的是希望由监控告警发现我们出了线上问题,而不是等到业务侧反馈。所以,我们需要对核心接口做好监控告警的功能。

2、如果是业务代码层面的监控报警,那我们应该是可以很快地定位出是哪儿的问题,毕竟告警逻辑都是我们写的嘛。如果是服务器资源/所依赖的中间件告警,那我们可能就要花点时间去排查啦。

3、不管怎么样,无论是系统告警还是是业务侧反馈系统或者接口出了问题。我们要想想在近期有没有发布过系统,如果近期发布过系统,判断能不能立马回滚到上一个版本,恢复系统平稳正常运行(在线上环境下,可用性是相当重要的)。回滚的时候要考虑接口有无依赖性,是否需要跟业务侧同步此次的回滚以及做相关的配合。

4、因为线上大多数的问题都来源于系统的变更,可能我们只是变更了很少的代码,但只要有一丝的逻辑没留意到,就真的很可能会导致出现问题,回滚很可能是最快能恢复线上正常运行的办法。

5、如果近期都没发布过系统,是系统告的警,那追踪下告警和报错日志,应该是可以很快地就能定位出问题。

6、如果不是系统告的警,是业务侧反馈出了问题,那这时候需要业务侧明确是哪个具体的功能/接口出了问题,有没有保留请求入参,有没有返回错误的信息,有何现象

7、知道了问题的现象之后,就需要根据经验排查可能是哪块出了问题了。我的经验一般是:先查存储侧有没有瓶颈(MySQL 的CPU有没有飙高,主从同步延迟是否很大,有没有慢SQL。Redis是不是内存满了,走了淘汰策略。搜索引擎有没有慢Query),把该服务所依赖的中间件的指标看一遍,这个过程中也要去看看服务接口的QPS/RT相关的监控。如果有某项指标不对劲,那顺着写入逻辑也应该很快能看出来

8、一般到这里,大多数的问题都能查出来。可能是逻辑本身的问题,可能是请求入参导致慢查询,可能是中间件的网络抖动,可能是突发或者异常请求的问题。

9、如果都不是,回归到应用和机器本身的监控:应用GC的表现、机器本身的网络/磁盘/内存/CPU 各种的指标有没有发现异常的情况。这里可能是需要运维侧一起配合看看有没有做过改动。

10、要是还定位不出来,看能不能复现,能复现都好说,肯定是能解决的。

11、要是不能复现,只能在怀疑的地方打上详细的日志再好好观察(问题定位不出来,很多时候就是日志不够详细,而日志在正常情况下也不应该打太多)

线上问题排查回答(转载)

原文链接:https://www.cnblogs.com/mzBlogs/p/17359351.html

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:线上问题排查回答(转载) - Python技术站

(0)
上一篇 2023年4月27日
下一篇 2023年4月27日

相关文章

  • IDEA2019.2.2配置Maven3.6.2打开出现Unable to import Maven project

    下面是详细讲解“IDEA2019.2.2配置Maven3.6.2打开出现Unable to import Maven project”的完整攻略。 1. 出现问题的原因分析 可能出现这个问题的原因有很多,比如Maven仓库的路径不正确、Maven的配置文件settings.xml有误、网络环境不佳等等。但通常来说,这个问题是因为缺少Maven插件导致的,ID…

    Java 2023年5月20日
    00
  • java 处理常量字符串过长 & springboot 项目读取 resouces 文件夹下的文件内容

    长字符串起因 项目里面有一长串的加密字符串(最长的万多个字符),需要拼接作为参数发送给第三方。 如果我们使用 枚举 定义的话,idea 编译的时候就会出现编译报错 Error: java:常量字符串过长 解决想法 网上还有一个说法,说是编译器问题,修改 idea 工具的编译为 eclipse 即可。 但是结果我仍然不满意,所以我决定把他放在文件中,然后需要的…

    Java 2023年4月18日
    00
  • jsp request.getParameter() 和request.getAttribute()方法区别详解

    JSP中的request对象是用于客户端到服务器的HTTP请求中传递参数、数据和请求头等信息的。request对象提供了多个方法来获取参数和属性值,其中包括getParameter()和getAttribute()方法。虽然这两个方法都能获取到客户端传输的参数或属性值,但是它们在具体的使用方式上是有所不同的。下面就来详细讲解一下它们的区别。 1. getPa…

    Java 2023年6月15日
    00
  • Java模拟扑克牌洗牌实现生成52张扑克的方法示例

    下面是Java模拟扑克牌洗牌实现生成52张扑克的方法示例的完整攻略: 一、前置知识点 Java基础知识 Java集合框架 二、实现方法 1. 创建扑克牌的List集合 首先,我们需要创建一个包含52张扑克牌的List集合(不包括大小王)。代码如下: List<String> pokerList = new ArrayList<>();…

    Java 2023年5月26日
    00
  • SpringBoot详细讲解视图整合引擎thymeleaf

    让我来详细讲解一下“SpringBoot详细讲解视图整合引擎thymeleaf”的完整攻略。 1. 什么是Thymeleaf Thymeleaf是一种现代化的服务器端模板引擎,可支持HTML、CSS、XML、JavaScript等文档类型。它的语法十分简单且灵活,可以通过简单而自然的模板表达式快速地构建出动态内容渲染的视图。 2. 如何整合Thymeleaf…

    Java 2023年5月19日
    00
  • SPRING BOOT启动命令参数及源码详析

    SPRING BOOT启动命令参数及源码详析 Spring Boot是一个快速开发框架,它提供了许多方便的启动命令参数,可以满足不同的需求。本文将介绍和分析Spring Boot的启动命令参数和源码,帮助读者更加深入地理解Spring Boot的运行机制。 启动命令参数 通用参数 –debug:启用Debug模式,输出额外的调试信息。 –trace:启用…

    Java 2023年5月19日
    00
  • 使用SpringSecurity处理CSRF攻击的方法步骤

    使用Spring Security处理CSRF攻击的步骤如下: 1. 开启CSRF保护 在Spring Security配置文件中,启用CSRF保护,代码如下: @Override protected void configure(HttpSecurity http) throws Exception { http.csrf().csrfTokenRepos…

    Java 2023年5月20日
    00
  • 解决SpringBoot启动过后不能访问jsp页面的问题(超详细)

    解决SpringBoot启动过后不能访问jsp页面的问题(超详细) 问题描述 SpringBoot是一个高度集成化的框架,它不需要xml和配置文件即可构建Spring应用程序。然而,当我们在使用SpringBoot构建web应用程序的过程中,有时会遇到不能访问jsp页面的问题。这是因为SpringBoot默认使用thymeleaf作为模板引擎,而不是jsp。…

    Java 2023年6月15日
    00
合作推广
合作推广
分享本页
返回顶部