聊一聊 dotnet-trace 调查 lock锁竞争

一:背景

1. 讲故事

最近在分析一个 linux 上的 dump,最后的诱因是大量的lock锁诱发的高频上下文切换,虽然问题告一段落,但我还想知道一点信息,所谓的高频到底有多高频?锁竞争到底是一个怎样的锁竞争? 如果了解这些信息对我们后续分析此类问题非常有帮助。

要想获取此类信息,看 dump 肯定是没有用的,只能给程序安装一个摄像头,在 Windows 平台上可以在 perfview 上配一个 Microsoft-Windows-DotNETRuntime:ContentionKeyword 事件轻松搞定,截图如下:

聊一聊 dotnet-trace 调查 lock锁竞争

但 PerfView 是和 Windows 深度绑定的,那在 Linux 上怎么办呢? 对,有朋友知道用 dotnet-trace。

二:探究 dotnet-trace

1. 如何监控 lock 竞争

dotnet-trace 是 CLR 团队写的一个跨平台的小工具,专门用于获取 .NET 程序的各种事件,可以理解成 PerfView 的一个子集,这里安装就不说了,详见官方文档:https://learn.microsoft.com/en-us/dotnet/core/diagnostics/dotnet-trace

查阅文档之后,只需要在 --clrevents 中配 contention 事件即可,详情参见文档:https://learn.microsoft.com/en-us/dotnet/fundamentals/diagnostics/runtime-contention-events

聊一聊 dotnet-trace 调查 lock锁竞争

2. 测试案例

为了方便解读,这里我故意造一个 锁护送 现象,参考代码如下:


    internal class Program
    {
        public static object lockMe = new object();

        static void Main(string[] args)
        {
            long i = 10;

            Parallel.For(0, int.MaxValue, new ParallelOptions() { MaxDegreeOfParallelism = 4 }, (j) =>
            {
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
                lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++; lock (lockMe) i++;
            });
        }
    }

将程序跑起来后,使用 dotnet-trace ps 找到 PID,再用 dotnet-trace 进行跟踪,这里持续跟踪 1分钟。


[root@localhost ~]# dotnet-trace ps
 3316  dotnet  /usr/share/dotnet/dotnet  dotnet ConsoleApp3.dll  

[root@localhost ~]# dotnet-trace collect -p 3316 --clrevents contention --duration 00:00:01:00

Provider Name                           Keywords            Level               Enabled By
Microsoft-Windows-DotNETRuntime         0x0000000000004000  Informational(4)    --clrevents

Process        : /usr/share/dotnet/dotnet
Output File    : /root/dotnet_20230509_105906.nettrace
Trace Duration : 00:00:01:00
[00:00:01:00]	Recording trace 29.7885  (MB)
Press <Enter> or <Ctrl+C> to exit...148  (MB)
Stopping the trace. This may take several minutes depending on the application being traced.

Trace completed.

[root@localhost ~]# ls

anaconda-ks.cfg  dotnet_20230509_105906.nettrace  Music     Templates
Desktop          Downloads                        Pictures  Videos
Documents        initial-setup-ks.cfg             Public

3. nettrace 文件分析

至于分析 dotnet_20230509_105906.nettrace 的工具就特别多了,dotnet-trace,perf,perfview,visualstudio,不过我个人建议还是使用 prefview,因为它的洞察能力会更好,用 perfview 打开之后点击 EventStats 观察统计信息:

聊一聊 dotnet-trace 调查 lock锁竞争

从图中可以看到 1min 的时间内生成了总计将近 200w 的 start 和 stop 事件。

有了统计信息还不行,我还想知道每一次 start 的详细信息,可以点击 perfview 中的 Events 面板中的 Microsoft-Windows-DotNETRuntime/Contention/Start 事件,可以看到记录中每一次争抢的开始时间。

聊一聊 dotnet-trace 调查 lock锁竞争

有些朋友可能要问了,Start 和 Stop 到底代表什么意思,简而言之就是争抢的开始时间和结束时间,时间差就是排队时间,截图如下:

聊一聊 dotnet-trace 调查 lock锁竞争

从图中可以看到,某些竞争锁的时候耗费了 1ms 的时间,同时得到调度的线程也不是串行的,比如 4232 号线程就得到了两次连续执行。

接下来回答最后一个问题,除了看到每一次lock竞争的详细信息,能不能看到每一次 lock 时的代码调用栈呢? 当然是可以的,毕竟 HasStack="True" ThreadID="3,316" ProcessorNumber="0" ContentionFlags="Managed" ClrInstanceID="0" 中的 HasStack="True" 就是告诉当前是有调用栈信息的,在 Time MSec 列点击右键选择 Open Any Stacks

聊一聊 dotnet-trace 调查 lock锁竞争

从图中的线程栈可以看到,Start 事件是由 Main 方法中的 Parallel.For 诱发的,非常清楚。

三:总结

dotnet-trace 是一个非常强大的跨平台性能分析工具,构建在 EventPipe 之上,特点就是跨平台,除了对锁竞争外,还有其他的各种有趣的事件,有兴趣的朋友可以查阅查阅。

原文链接:https://www.cnblogs.com/huangxincheng/archive/2023/05/09/17384543.html

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:聊一聊 dotnet-trace 调查 lock锁竞争 - Python技术站

(0)
上一篇 2023年5月9日
下一篇 2023年5月9日

相关文章

  • C#找不到类型名”SqlConnection”的有效解决方法

    为了解决 “C#找不到类型名”SqlConnection” 的报错问题,有如下几个有效的解决方法: 1. 添加System.Data.SqlClient引用 在使用 SqlConnection 的代码文件中,我们需要添加 System.Data.SqlClient 引用,这是用于连接 SQL Server 的命名空间。 步骤如下: 打开你的项目 右键点击”引…

    C# 2023年5月15日
    00
  • C#窗体实现点餐系统

    C#窗体实现点餐系统,是一种常见的应用场景,本文将从以下几个方面详细讲解该系统的实现过程。 系统结构设计 整个系统可以分为前台展示、后台数据管理、数据库存储三部分。其中,前台展示负责向用户展示菜单和订单信息,后台数据管理负责将用户的订单信息提交至数据库中进行管理,数据库存储则负责数据的持久化存储。 前台界面设计 本系统的前台界面主要包含以下内容: 菜单展示:…

    C# 2023年6月1日
    00
  • 互斥量mutex的简单使用(实例讲解)

    互斥量mutex的简单使用(实例讲解) 什么是互斥量mutex 互斥量是一种用于保护共享资源的锁,它可以防止多个线程同时访问共享资源,从而保证线程安全。 如何使用互斥量 在使用互斥量之前,我们需要了解一些基本操作。 初始化互斥量 初始化互斥量可以使用pthread_mutex_init函数,该函数有两个参数,第一个参数是互斥量的指针,第二个参数是一个指向pt…

    C# 2023年6月7日
    00
  • .net从服务器下载文件中文名乱码解决方案

    针对“.net从服务器下载文件中文名乱码解决方案”,以下是完整攻略的步骤: 问题背景 当从服务器下载文件时,如果文件名中包含中文字符,很容易出现乱码错误。这是由于字符编码问题造成的。 解决方案 .NET提供了System.Net.WebClient类来下载文件。要解决中文文件名乱码问题,我们需要进行以下设置: 设置下载参数 下载文件前需要设置WebClien…

    C# 2023年5月15日
    00
  • C#中的正则表达式双引号问题

    C#中的正则表达式中双引号问题,主要是因为C#语言本身使用双引号来定义字符串,而正则表达式中也常常需要使用双引号来定义某些模式。因此,在将正则表达式作为字符串处理时,需要注意双引号字符的转义问题。 1. 双引号的转义 在C#中,要在字符串中插入双引号字符,需要使用反斜杠(\)字符进行转义,例如: string str = "This is a \&…

    C# 2023年6月7日
    00
  • ASP.NET 谨用 async/await

    ASP.NET是一种在Web应用程序中使用的框架,其中包含了许多可用于编写可执行的应用程序代码的内置功能。其中一个特性是使用async/await异步编程模式。 Async/await允许在Web应用程序中执行耗时长的操作而不会阻塞线程。这是由于该方法异步执行,当操作执行完毕时,将使用已处理请求的线程调用回调。下面是使用async/await在ASP.NET…

    C# 2023年5月15日
    00
  • .Net下的签名与混淆图文分析

    我来为大家详细讲解“.Net下的签名与混淆图文分析”的完整攻略,包含以下内容: 什么是.Net下的签名与混淆 在 .Net 程序中,签名是指通过一定的算法对程序集中的每个方法、属性或成员类型等进行计算而得出的一段字节码。而混淆是指在保留程序功能不变的情况下,修改程序代码的结构和算法,使得程序难以被反编译或者逆向工程分析。 如何使用签名来保证程序编译的正确性 …

    C# 2023年5月31日
    00
  • Unity 数据存储和读取的方法汇总

    下面是关于Unity数据存储和读取方法的详细攻略,我们将涉及两种常见的数据存储和读取方法:PlayerPrefs和Json文件。 PlayerPrefs PlayerPrefs是Unity内置的一种数据存储方式,它使用键值对来存储和读取数据。在使用PlayerPrefs时,需要指定一个键(Key)和一个值(Value)。下面是一个使用PlayerPrefs存…

    C# 2023年6月3日
    00
合作推广
合作推广
分享本页
返回顶部