工具名称:Intel® VTune™ Amplifier XE 2016 Update 2 for Linux
see: $install-dir/documentation/$language/
see: $install-dir/documentation/$language/welcomepage/get_started.htm
简介
Intel® VTune™ Amplifier XE 可以在Windows*, OS X*, and Linux* 平台上安装和使用。用于分析本地或者远程目标系统。使用这个工具可以——分析算法选择、找到串行或并行代码的瓶颈、找到你的应用当中那些部分可以从硬件资源中获益,加快程序的执行速度。
VTune Amplifier XE 可以是一个单独的产品或者一下产品的一个套件:
- Intel Parallel Studio XE 2016 Cluster Edition and Professional Edition
- Intel® Media Server Studio 2016 Professional Edition
先决条件
==对于基于事件的硬件采样分析,需要首选确认安装了采样驱动。(这个很重用)==
see: $install-dir/documentation/$language/help/GUID-92B13766-1617-44D0-BA70-AC61F5833CA4.htm
以下这些分析依赖采样驱动(详见下文)
Advanced Hotspots
General Exploration
Memory Access
TSX Exploration
TSX Hotspots
SGX Hotspots
CPU/GPU Concurrency
System Overview (based on Perf* driverless collection)
HPC Performance Characterization (Preview)对于远程分析,需要先设置下远程Linux目标系统
gui界面基本工作流程
步骤1:启动VTune Amplifier
- 设置环境变量
csh/tcsh用户:source <install_dir>/amplxe-vars.csh
bash 用户: source <install_dir>/amplxe-vars.sh
默认情况下<install_dir>是:
root用户:/opt/intel/vtune_amplifier_xe_2016
非root用户: $HOME/intel/vtune_amplifier_xe_2016
- 启动VTune Amplifier
启动界面执行amplxe-gui命令
启动命令行 执行amplxe-cl命令
以下操作都是在gui可视界面下,对应的命令行命令可以在配置好界面好,界面窗口的右下角Command line …按钮生成
步骤2:设置分析目标
- 使用Release模式(打开所有优化选项)生成目标应用程序
- 创建一个Vtune Amplifier工程
a. 点击右上角菜单 New > Project 新建一个工程
b. 在对话框中指定保存工程需要的路径
在Analysis Target标签中选择目标系统(要分析的系统在本地选择local, 远程主机选择remote Linux);选择分析目标类型(Launch application、Attach to Process 或者Profile System)
配置目标,应用所在路径,需要传入的参数,如果需要设置搜索路径
步骤3:配置分析选项
- 切换到Analysis Type标签
- 左边面板中选择分类型(Basic Hotspots, Advanced Hotspots, Concurrency等),右边面板配置分析选项
算法分析:
Basic Hotspots: 帮助理解应用的执行流程,可以确定各个代码段的执行时间。那些落在采样时间点上最多的处理过程、线程或者模块可能就是导致性能瓶颈的问题所在。同时也收集了函数的调用堆栈。分析过程会造成大约5%的额外开销,不会显著影响应用。Basic Hotspots只关心某个进程的本身的,不同于Advanced Hotspots, 它不会分析到整个系统的性能。
Advanced Hotspots:确定然间程序热点,硬件热点。也可以分析程序栈、上下文切换等。某些选项依赖时间采样驱动。
Concurrency: 并发热点分析。
Locks and Waits: 锁和等待时间分析
...
微架构分析:
General Expioration: 代码在pipeline中传输的效率
Memory Access: 内存相关
TSX Exploration:首先要支持Intel TSX。分析其行为及可能倒是其事务中断的原因。
TSX Hotspots:首先要支持Intel TSX。并对起热点分析。
SGX Hotspotes:首先要支持Intel SGX。并对起热点分析。
平台分析:
CPU/GPU Concurrency:
- Start按钮开始分析
步骤4:观察性能分析结果
数据分析完成时,Vtune Amplifier会打开分析结果视图(停留在默认视角上)。可以在不同的视角切换,从不同的角度查看分析结果(Bottom-up、Top-down等)。
Contact: bigjordon@163.com