NVIDIANsightSystems入门及使用

更新时间:2023-05-31 20:10:19 阅读: 评论:0

NVIDIANsightSystems⼊门及使⽤
⽬录
squirrel怎么读
# Nsight Systems ⼊门
什么是Nsight Systems
NVIDIA Nsight Systems,简称nsys,是⼀个低开销的系统分析⼯具。
在本⽂档中,我们将配置⽂件的配置对象和⽤户⽤来⼯作并控制配置⽂件会话的计算机作为主机。 请注意,对于基于x86_64的系统,它们可能位于同⼀设备上,⽽对于基于Tegra,ARM或IBM Power的系统,它们将始终是分开的。
此外,将三种不同的活动区分如下:
- **分析—收集任何性能数据**的过程。Nsight Systems中的性能分析会话通常包括采样和跟踪。
- **采样—定期停⽌配置⽂件**(在配置⽂件会话期间正在研究的应⽤程序)的过程,通常⽤于收集回溯(活动线程的调⽤堆栈),这使您可以统计地了解每个函数花费了多少时间。
此外,还可以对硬件计数器进⾏采样。 当收集到少量样品时,此过程本质上是不精确的。
- **跟踪-收集有关概要⽂件或系统中发⽣的各种活动**的精确信息的过程。    例如,可以跟踪概要**API的执⾏**,以提供函数调⽤的确切时间和持续时间
reneeNsight Systems在⼤多数平台上⽀持的常见功能包括:
使⽤多种算法(例如帧指针或DWARF数据)对Profilee进⾏采样并收集回溯。 根据需要构建⾃上⽽下,⾃下⽽上和平⾯视图。 此信息有助于确定CPU密集型代码中的性能瓶颈。大学英语四级单词
wana采样或跟踪系统电源⾏为,例如CPU频率。
(仅在Nsight Systems嵌⼊式平台版本上)来⾃ARM PMU(性能监视单元)的采样计数器。 诸如缓存未命中之类的信息在统计上与函数执⾏相关。
⽀持多个窗⼝。 具有多台监视器的⽤户可以同时查看多个报告,或在同⼀报告⽂件中拥有多个视图。英语个人简历
⽤户能⽤nsys做什么
使⽤Nsight Systems,⽤户可以:
确定独占CPU的呼叫路径。
确定独占CPU的各个功能(跨不同的调⽤路径)。
优点英语
对于Nsight Systems Embedded Platforms Edition,请确定缓存利⽤率较低的功能。
如果平台⽀持CUDA,请查看CUDA运⾏时和驱动程序API调⽤以及CUDA GPU⼯作负载的直观表⽰。
Nsight Systems使⽤CUDA分析⼯具界⾯(CUPTI),有关更多信息,请参阅:CUPTI⽂档。
如果⽤户使⽤NVIDIA⼯具扩展(NVTX)进⾏注释,请参见NVTX注释的可视表⽰形式:范围,标记和线程名称。
对于Windows⽬标,请参见D3D12的直观表⽰:正在CPU上进⾏哪些API调⽤,图形框架,停顿分析以及GPU⼯作负载(命令列表和调试范围)。
对于x86_64⽬标,请参见Vulkan的直观表⽰:正在CPU上进⾏哪些API调⽤,图形框架,停顿分析以及Vulkan GPU⼯作负载(命令缓冲区和调试范围)
Nsight Systems⽀持⼤多数平台的CUDA 10.0、10.1、10.2和11.0。
数量的英文
Nsight Systems on ARM SBSA⽀持10.2和11.0。
请注意,CUDA版本和驱动程序版本必须兼容。
Nsight Systems 使⽤
nsys windows 版本GUI使⽤步骤
安装windows版本的的NVIDIA Nsight Systems,下载地址在官⽹。
安装好后,出现如下页⾯。可以选择CPU Rows on Top classic mode(默认选项)。
接下来,下拉Select target for profiling,会出现:
Localhost connections (这⾥指的就是你的windows电脑本地)
SSH connections (这⾥可以指定服务器(Linux)的位置)
configure target (这⾥可以修改你选定的target位置的配置)
这⾥先跳过本地选项,直接ssh连接到linux服务器,毕竟⼤部分的AI模型都是在服务器上去跑。
点击Select target for profiling右边的⼯具按钮,出现如下页⾯。点击Create a new connection,进⾏SSH连接。
连接成功之后,出现如下界⾯:
bauhaus
可以对profilin进⾏设置,有如下设置项:
先简单设置第⼀个Sample target process, 在其中设置服务器上要跑的程序。这⾥我在HOME⽬录下,设置要运⾏的命令是ls(linux的列举命令),然后点击右边的Start (右边也可以设置,等熟悉之后就可看需求来设置)。其他例⼦,在跑模型的时候,可以设置命令为python train.py等等。
48个英语音标正确读法
命令跑完的结果如下,可以得到⼀个Report,它是⼀个.qdrep⽂件,如果是在Linux CLI下运⾏nsys得到这个⽂件,也可以传到windows 上⽤nsys打开来做分析:
这个Report包含5部分内容:
1. Analysis Summary (分析总结,内容⾮常全⾯,包含了Target的详细信息,Process summary, Module summary, Thread
summary, Environment Variables, CPU info, GPU info等等)
2. Timeline View (展⽰CPU/GPU各个核的⼯作时间线,⼀般⽤来来勘察模型训练或者推理的瓶颈在哪⾥)
3. Diagnostics Summary (顾名思义,诊断总结。就是程序在运⾏中做了什么,有什么warning , error,或者message的,都在这⾥
汇总)
4. Symbol Resolution Logs(暂时不知道是⼲嘛的)
奥斯卡奖电影
5. Files (执⾏结果的log ⽂件:pid_stdout.log,& 执⾏出错的log ⽂件pid_stderr.log)
的时间线。
nsys Linux CLI (Command Line Interface)常见命令

本文发布于:2023-05-31 20:10:19,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/90/129618.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:版本   命令   采样   分析   收集
相关文章
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图