Intel Vtune使用

工具名称:Intel® VTune™ Amplifier XE 2016 Update 2 for Linux

see: $install-dir/documentation/$language/

see: $install-dir/documentation/$language/welcomepage/get_started.htm


简介

Intel® VTune™ Amplifier XE 可以在Windows*, OS X*, and Linux* 平台上安装和使用。用于分析本地或者远程目标系统。使用这个工具可以——分析算法选择、找到串行或并行代码的瓶颈、找到你的应用当中那些部分可以从硬件资源中获益,加快程序的执行速度。

VTune Amplifier XE 可以是一个单独的产品或者一下产品的一个套件:

  • Intel Parallel Studio XE 2016 Cluster Edition and Professional Edition
  • Intel® Media Server Studio 2016 Professional Edition

先决条件

  • ==对于基于事件的硬件采样分析,需要首选确认安装了采样驱动。(这个很重用)==

    see: $install-dir/documentation/$language/help/GUID-92B13766-1617-44D0-BA70-AC61F5833CA4.htm

    以下这些分析依赖采样驱动(详见下文)
    Advanced Hotspots
    General Exploration
    Memory Access
    TSX Exploration
    TSX Hotspots
    SGX Hotspots
    CPU/GPU Concurrency
    System Overview (based on Perf* driverless collection)
    HPC Performance Characterization (Preview)

  • 对于远程分析,需要先设置下远程Linux目标系统


gui界面基本工作流程

这里写图片描述


步骤1:启动VTune Amplifier

  • 设置环境变量
csh/tcsh用户:source <install_dir>/amplxe-vars.csh
bash 用户: source <install_dir>/amplxe-vars.sh

默认情况下<install_dir>是:
root用户:/opt/intel/vtune_amplifier_xe_2016
非root用户: $HOME/intel/vtune_amplifier_xe_2016
  • 启动VTune Amplifier
启动界面执行amplxe-gui命令

启动命令行  执行amplxe-cl命令

以下操作都是在gui可视界面下,对应的命令行命令可以在配置好界面好,界面窗口的右下角Command line …按钮生成


步骤2:设置分析目标

  • 使用Release模式(打开所有优化选项)生成目标应用程序
  • 创建一个Vtune Amplifier工程
a. 点击右上角菜单 New > Project 新建一个工程
b. 在对话框中指定保存工程需要的路径
  • 在Analysis Target标签中选择目标系统(要分析的系统在本地选择local, 远程主机选择remote Linux);选择分析目标类型(Launch application、Attach to Process 或者Profile System)

  • 配置目标,应用所在路径,需要传入的参数,如果需要设置搜索路径


步骤3:配置分析选项

  • 切换到Analysis Type标签
  • 左边面板中选择分类型(Basic Hotspots, Advanced Hotspots, Concurrency等),右边面板配置分析选项
算法分析:
    Basic Hotspots: 帮助理解应用的执行流程,可以确定各个代码段的执行时间。那些落在采样时间点上最多的处理过程、线程或者模块可能就是导致性能瓶颈的问题所在。同时也收集了函数的调用堆栈。分析过程会造成大约5%的额外开销,不会显著影响应用。Basic Hotspots只关心某个进程的本身的,不同于Advanced Hotspots, 它不会分析到整个系统的性能。
    Advanced Hotspots:确定然间程序热点,硬件热点。也可以分析程序栈、上下文切换等。某些选项依赖时间采样驱动。
    Concurrency: 并发热点分析。
    Locks and Waits: 锁和等待时间分析
    ...
微架构分析:
    General Expioration: 代码在pipeline中传输的效率
    Memory Access: 内存相关
    TSX Exploration:首先要支持Intel TSX。分析其行为及可能倒是其事务中断的原因。
    TSX Hotspots:首先要支持Intel TSX。并对起热点分析。
    SGX Hotspotes:首先要支持Intel SGX。并对起热点分析。
平台分析:
    CPU/GPU Concurrency: 
  • Start按钮开始分析

步骤4:观察性能分析结果

数据分析完成时,Vtune Amplifier会打开分析结果视图(停留在默认视角上)。可以在不同的视角切换,从不同的角度查看分析结果(Bottom-up、Top-down等)。


Contact: bigjordon@163.com

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值