聊一聊 dotnet-trace 调查 lock锁竞争

一:背景

1. 讲故事

最近在分析一个 linux 上的 dump,最后的诱因是大量的lock锁诱发的高频上下文切换,虽然问题告一段落,但我还想知道一点信息,所谓的高频到底有多高频?锁竞争到底是一个怎样的锁竞争? 如果了解这些信息对我们后续分析此类问题非常有帮助。

要想获取此类信息,看 dump 肯定是没有用的,只能给程序安装一个摄像头,在 Windows 平台上可以在 perfview 上配一个 Microsoft-Windows-DotNETRuntime:ContentionKeyword 事件轻松搞定,截图如下:

聊一聊 dotnet-trace 调查 lock锁竞争

但 PerfView 是和 Windows 深度绑定的,那在 Linux 上怎么办呢? 对,有朋友知道用 dotnet-trace。

二:探究 dotnet-trace

1. 如何监控 lock 竞争

dotnet-trace 是 CLR 团队写的一个跨平台的小工具,专门用于获取 .NET 程序的各种事件,可以理解成 PerfView 的一个子集,这里安装就不说了,详见官方文档:https://learn.microsoft.com/en-us/dotnet/core/diagnostics/dotnet-trace

查阅文档之后,只需要在 --clrevents 中配 contention 事件即可,详情参见文档:https://learn.microsoft.com/en-us/dotnet/fundamentals/diagnostics/runtime-contention-events

聊一聊 dotnet-trace 调查 lock锁竞争

2. 测试案例

为了方便解读,这里我故意造一个 锁护送 现象,参考代码如下:


    internal class Program
    {
        public static object lockMe = new object();

        static void Main(string[] args)
        {
            long i = 10;

            Parallel.For(0, int.MaxValue, new ParallelOptions() { MaxDegreeOfParallelism = 4 }, (j) =>
            {
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
            });
        }
    }

将程序跑起来后,使用 dotnet-trace ps 找到 PID,再用 dotnet-trace 进行跟踪,这里持续跟踪 1分钟。


[root@localhost ~]# dotnet-trace ps
 3316  dotnet  /usr/share/dotnet/dotnet  dotnet ConsoleApp3.dll  

[root@localhost ~]# dotnet-trace collect -p 3316 --clrevents contention --duration 00:00:01:00

Provider Name                           Keywords            Level               Enabled By
Microsoft-Windows-DotNETRuntime         0x0000000000004000  Informational(4)    --clrevents

Process        : /usr/share/dotnet/dotnet
Output File    : /root/dotnet_20230509_105906.nettrace
Trace Duration : 00:00:01:00
[00:00:01:00]	Recording trace 29.7885  (MB)
Press <Enter> or <Ctrl+C> to exit...148  (MB)
Stopping the trace. This may take several minutes depending on the application being traced.

Trace completed.

[root@localhost ~]# ls

anaconda-ks.cfg  dotnet_20230509_105906.nettrace  Music     Templates
Desktop          Downloads                        Pictures  Videos
Documents        initial-setup-ks.cfg             Public

3. nettrace 文件分析

至于分析 dotnet_20230509_105906.nettrace 的工具就特别多了,dotnet-trace,perf,perfview,visualstudio,不过我个人建议还是使用 prefview,因为它的洞察能力会更好,用 perfview 打开之后点击 EventStats 观察统计信息:

聊一聊 dotnet-trace 调查 lock锁竞争

从图中可以看到 1min 的时间内生成了总计将近 200w 的 start 和 stop 事件。

有了统计信息还不行,我还想知道每一次 start 的详细信息,可以点击 perfview 中的 Events 面板中的 Microsoft-Windows-DotNETRuntime/Contention/Start 事件,可以看到记录中每一次争抢的开始时间。

聊一聊 dotnet-trace 调查 lock锁竞争

有些朋友可能要问了,Start 和 Stop 到底代表什么意思,简而言之就是争抢的开始时间和结束时间,时间差就是排队时间,截图如下:

聊一聊 dotnet-trace 调查 lock锁竞争

从图中可以看到,某些竞争锁的时候耗费了 1ms 的时间,同时得到调度的线程也不是串行的,比如 4232 号线程就得到了两次连续执行。

接下来回答最后一个问题,除了看到每一次lock竞争的详细信息,能不能看到每一次 lock 时的代码调用栈呢? 当然是可以的,毕竟 HasStack="True" ThreadID="3,316" ProcessorNumber="0" ContentionFlags="Managed" ClrInstanceID="0" 中的 HasStack="True" 就是告诉当前是有调用栈信息的,在 Time MSec 列点击右键选择 Open Any Stacks

聊一聊 dotnet-trace 调查 lock锁竞争

从图中的线程栈可以看到,Start 事件是由 Main 方法中的 Parallel.For 诱发的,非常清楚。

三:总结

dotnet-trace 是一个非常强大的跨平台性能分析工具,构建在 EventPipe 之上,特点就是跨平台,除了对锁竞争外,还有其他的各种有趣的事件,有兴趣的朋友可以查阅查阅。

原文链接:https://www.cnblogs.com/huangxincheng/archive/2023/05/09/17384543.html

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:聊一聊 dotnet-trace 调查 lock锁竞争 - Python技术站

(0)
上一篇 2023年5月9日
下一篇 2023年5月9日

相关文章

  • C#利用Windows自带gdi32.dll实现抓取屏幕功能实例

    下面是C#利用Windows自带gdi32.dll实现抓取屏幕功能的完整攻略: 第一步:导入gdi32.dll库 要使用gdi32.dll中的函数,我们需要手动导入该库,首先需要在原生方法前加入[DllImport(“gdi32.dll”)],以便让.NET框架能够找到该库。然后需要在代码开头添加命名空间:using System.Runtime.Inter…

    C# 2023年5月31日
    00
  • C#实现简单的五子棋游戏

    C#实现简单的五子棋游戏攻略 1. 确定游戏规则和UI设计 五子棋游戏有一定规则,包括游戏开始、棋子下子、禁手判断、胜负判断、悔棋等。首先需要了解游戏规则,并设计好游戏的UI界面,包括游戏棋盘的布局、棋子的显示、提示信息等。 2. 建立游戏主体框架 在C#中,我们可以使用Windows窗体应用程序来实现五子棋游戏的UI设计和游戏主体框架的建立。具体步骤如下:…

    C# 2023年6月7日
    00
  • js使用html2canvas实现屏幕截取的示例代码

    html2canvas是一个JavaScript库,可以将网页中的任何部分转换为Canvas图像。在本文中,我们将介绍如何使用html2canvas实现屏幕截取的示例代码。 示例1:截取整个屏幕 在这个示例中,我们将演示如何使用html2canvas截取整个屏幕。 在HTML文件中引入html2canvas库。在标签中添加以下代码: <script s…

    C# 2023年5月15日
    00
  • C# Linq的SkipWhile()方法 – 跳过序列中的元素,直到某个元素不满足

    下面是关于 C# Linq 的 SkipWhile() 的完整攻略。 SkipWhile() 简介 SkipWhile() 方法是 C# Linq 中的一种用来过滤序列的方法,其参数为一个带有一个参数和一个返回bool类型的委托,该委托定义了决定跳过哪些元素的方法。SkipWhile() 方法会跳过序列中开头符合条件的元素,直到遇到第一个不符合条件的元素为止…

    C# 2023年4月19日
    00
  • c# 网址压缩简单实现短网址

    下面是C#网址压缩简单实现短网址的完整攻略: 1. 短网址原理 短网址是将长的url经过特殊算法处理,缩短成几个字符,方便用户记忆、分享、输入等。短网址生成的过程包含以下几个步骤: 生成长的url 将url转换为数字 将数字进行压缩,生成短网址 将短网址与url映射存储到数据库 2. 算法原理 常用的短网址算法有以下几种: 哈希算法 随机数算法 自增序列算法…

    C# 2023年6月7日
    00
  • C# WinForm捕获全局变量异常 SamWang解决方法

    下面是详细讲解“C# WinForm捕获全局变量异常SamWang解决方法”的完整攻略。 背景 在C# WinForm程序的开发过程中,如果出现了全局变量异常,这会导致程序崩溃或者无法正常运行。为了避免这种情况的发生,我们需要在程序中加入一些对全局变量异常的处理方法。 解决方法 一般来说,我们可以使用try-catch语句来捕获全局变量异常。但是,如果全局变…

    C# 2023年5月14日
    00
  • 在C#及.NET框架中使用StringBuilder类操作字符串的技巧

    在 C# 和 .NET 框架中,操作字符串时,使用 StringBuilder 类会比字符串连接或操作符等方式更高效。在本攻略中,我将介绍如何使用 StringBuilder 类来更有效地操作字符串。以下是几个技巧: 1. 使用 StringBuilder 类的优点 StringBuilder 是字符串处理中的一种优化方式。在对字符串进行拼接、插入和删除等操…

    C# 2023年5月31日
    00
  • C#影院售票系统毕业设计(4)

    C#影院售票系统毕业设计(4)详细攻略: 需求分析与实现设计 在需求分析中,我们确定了本系统的主要功能:用户注册登录、电影列表、选座购票、订单管理、影院信息查询等。 接着,我们需要对这些功能进行实现设计,可以采用 MVC (Model-View-Controller)架构。 其中,Model负责数据处理、View负责用户界面,Controller负责用户交互…

    C# 2023年6月7日
    00
合作推广
合作推广
分享本页
返回顶部