聊一聊 dotnet-trace 调查 lock锁竞争

一:背景

1. 讲故事

最近在分析一个 linux 上的 dump,最后的诱因是大量的lock锁诱发的高频上下文切换,虽然问题告一段落,但我还想知道一点信息,所谓的高频到底有多高频?锁竞争到底是一个怎样的锁竞争? 如果了解这些信息对我们后续分析此类问题非常有帮助。

要想获取此类信息,看 dump 肯定是没有用的,只能给程序安装一个摄像头,在 Windows 平台上可以在 perfview 上配一个 Microsoft-Windows-DotNETRuntime:ContentionKeyword 事件轻松搞定,截图如下:

聊一聊 dotnet-trace 调查 lock锁竞争

但 PerfView 是和 Windows 深度绑定的,那在 Linux 上怎么办呢? 对,有朋友知道用 dotnet-trace。

二:探究 dotnet-trace

1. 如何监控 lock 竞争

dotnet-trace 是 CLR 团队写的一个跨平台的小工具,专门用于获取 .NET 程序的各种事件,可以理解成 PerfView 的一个子集,这里安装就不说了,详见官方文档:https://learn.microsoft.com/en-us/dotnet/core/diagnostics/dotnet-trace

查阅文档之后,只需要在 --clrevents 中配 contention 事件即可,详情参见文档:https://learn.microsoft.com/en-us/dotnet/fundamentals/diagnostics/runtime-contention-events

聊一聊 dotnet-trace 调查 lock锁竞争

2. 测试案例

为了方便解读,这里我故意造一个 锁护送 现象,参考代码如下:


    internal class Program
    {
        public static object lockMe = new object();

        static void Main(string[] args)
        {
            long i = 10;

            Parallel.For(0, int.MaxValue, new ParallelOptions() { MaxDegreeOfParallelism = 4 }, (j) =>
            {
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
            });
        }
    }

将程序跑起来后,使用 dotnet-trace ps 找到 PID,再用 dotnet-trace 进行跟踪,这里持续跟踪 1分钟。


[root@localhost ~]# dotnet-trace ps
 3316  dotnet  /usr/share/dotnet/dotnet  dotnet ConsoleApp3.dll  

[root@localhost ~]# dotnet-trace collect -p 3316 --clrevents contention --duration 00:00:01:00

Provider Name                           Keywords            Level               Enabled By
Microsoft-Windows-DotNETRuntime         0x0000000000004000  Informational(4)    --clrevents

Process        : /usr/share/dotnet/dotnet
Output File    : /root/dotnet_20230509_105906.nettrace
Trace Duration : 00:00:01:00
[00:00:01:00]	Recording trace 29.7885  (MB)
Press <Enter> or <Ctrl+C> to exit...148  (MB)
Stopping the trace. This may take several minutes depending on the application being traced.

Trace completed.

[root@localhost ~]# ls

anaconda-ks.cfg  dotnet_20230509_105906.nettrace  Music     Templates
Desktop          Downloads                        Pictures  Videos
Documents        initial-setup-ks.cfg             Public

3. nettrace 文件分析

至于分析 dotnet_20230509_105906.nettrace 的工具就特别多了,dotnet-trace,perf,perfview,visualstudio,不过我个人建议还是使用 prefview,因为它的洞察能力会更好,用 perfview 打开之后点击 EventStats 观察统计信息:

聊一聊 dotnet-trace 调查 lock锁竞争

从图中可以看到 1min 的时间内生成了总计将近 200w 的 start 和 stop 事件。

有了统计信息还不行,我还想知道每一次 start 的详细信息,可以点击 perfview 中的 Events 面板中的 Microsoft-Windows-DotNETRuntime/Contention/Start 事件,可以看到记录中每一次争抢的开始时间。

聊一聊 dotnet-trace 调查 lock锁竞争

有些朋友可能要问了,Start 和 Stop 到底代表什么意思,简而言之就是争抢的开始时间和结束时间,时间差就是排队时间,截图如下:

聊一聊 dotnet-trace 调查 lock锁竞争

从图中可以看到,某些竞争锁的时候耗费了 1ms 的时间,同时得到调度的线程也不是串行的,比如 4232 号线程就得到了两次连续执行。

接下来回答最后一个问题,除了看到每一次lock竞争的详细信息,能不能看到每一次 lock 时的代码调用栈呢? 当然是可以的,毕竟 HasStack="True" ThreadID="3,316" ProcessorNumber="0" ContentionFlags="Managed" ClrInstanceID="0" 中的 HasStack="True" 就是告诉当前是有调用栈信息的,在 Time MSec 列点击右键选择 Open Any Stacks

聊一聊 dotnet-trace 调查 lock锁竞争

从图中的线程栈可以看到,Start 事件是由 Main 方法中的 Parallel.For 诱发的,非常清楚。

三:总结

dotnet-trace 是一个非常强大的跨平台性能分析工具,构建在 EventPipe 之上,特点就是跨平台,除了对锁竞争外,还有其他的各种有趣的事件,有兴趣的朋友可以查阅查阅。

原文链接:https://www.cnblogs.com/huangxincheng/archive/2023/05/09/17384543.html

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:聊一聊 dotnet-trace 调查 lock锁竞争 - Python技术站

(0)
上一篇 2023年5月9日
下一篇 2023年5月9日

相关文章

  • 用几行C#代码实现定时关机/重启(超详细!建议新手练习)

    好的。 在C#中实现定时关机和重启可以使用System.Diagnostics.Process.Start方法来启动cmd命令行,然后通过cmd命令来控制关机和重启的操作。 以下是实现定时关机功能的C#代码: 引入命名空间 using System.Diagnostics; 设置倒计时时间为30秒,即30秒后关机 var shutdownTimeInSeco…

    C# 2023年6月1日
    00
  • C#递归读取XML菜单数据的方法

    在C#中,我们可以使用递归方法来读取XML菜单数据。递归方法是一种自我调用的方法,它可以在方法内部调用自身,以便处理嵌套的数据结构。本文将介绍如何使用递归方法来读取XML菜单数据,并提供两个示例来演示如何使用这些技术。 读取XML菜单数据的方法 以下是读取XML菜单数据的步骤: 创建一个XmlDocument对象,用于加载XML文件。 使用XmlDocume…

    C# 2023年5月15日
    00
  • C# Pointer指针应用实例简述

    C# Pointer指针应用实例简述 在C#语言中,指针(Pointer)是一个非常重要的概念,它可以让我们高效地进行内存操作。本文将简单介绍指针的基本概念,并通过两个应用实例说明指针的具体操作方法。 指针的基本概念 指针是一个变量,它存储着另一个变量的内存地址。在C#中,通过使用关键字“unsafe”来开启指针使用的权限。同时,为了增加运行时的安全性,C#…

    C# 2023年5月31日
    00
  • 简单掌握Windows中C#启动外部程序进程的方法

    下面我将详细介绍如何在Windows中使用C#启动外部程序进程的方法。 1. 引用命名空间 在使用C#启动外部程序进程前,需要先引用System.Diagnostics命名空间,该命名空间包含了一个名为Process的类,用于处理进程相关操作。 using System.Diagnostics; 2. 创建Process对象 创建Process对象是启动外部…

    C# 2023年6月7日
    00
  • ajax 登录功能简单实现(未连接数据库)

    下面是对应的详细讲解。 一、概述 本文将介绍如何使用 Ajax 实现登录功能,包括从前端发送请求,后端接收请求,进行登录校验,并返回结果。由于本文不涉及和数据库的交互,所以没有进行真实的登录校验,只是简单地判断用户名和密码是否正确。 二、前端页面 我们需要一个登录页面,该页面包括输入用户名和密码的输入框,以及一个登录按钮。在输入框失去焦点时校验输入的用户名和…

    C# 2023年5月31日
    00
  • .Net Core应用增强型跨平台串口类库CustomSerialPort()详解

    .Net Core应用增强型跨平台串口类库CustomSerialPort()详解 在本攻略中,我们将详细讲解.Net Core应用增强型跨平台串口类库CustomSerialPort()的技术及工作原理,并提供两个示例说明。 什么是CustomSerialPort()? CustomSerialPort()是一种.Net Core应用增强型跨平台串口类库,…

    C# 2023年5月16日
    00
  • asp.net iis 无法显示网页的解决方法分析

    当使用ASP.NET和IIS部署网站时,有时会遇到无法显示网页的问题。这可能是由于多种原因引起的,例如配置错误、权限问题、网络问题等。本文将提供一个ASP.NET和IIS无法显示网页的解决方法分析,包括两个示例。 解决方法分析 检查IIS配置 首先,我们需要检查IIS的配置是否正确。可以按照以下步骤检查IIS配置: 打开IIS管理器。 在左侧面板中选择“网站…

    C# 2023年5月15日
    00
  • 分享WCF聊天程序–WCFChat实现代码

    WCF(Windows Communication Foundation)是一种用于构建分布式应用程序的框架。WCF可以用于实现各种功能,包括聊天程序。本文将介绍如何使用WCF实现聊天程序,并分享一个名为WCFChat的示例项目。 WCFChat项目介绍 WCFChat是一个使用WCF实现聊天程序的示例项目。该项目包括两个应用程序:WCFChat.Serve…

    C# 2023年5月15日
    00
合作推广
合作推广
分享本页
返回顶部