nvidia Thor U与qualcomm 8295 DMPIS算力测试对比

使用的是老牌的dmpis测试工具dhrystone,来源于下面的组件包:

https://github.com/ARM-software/workload-automation/tree/master/wa/workloads/dhrystone

测试结果:

thor U:

测试参数:./dhrystone -l 100000 -t 12

duration: 0 seconds
number of threads: 12
number of loops: 100000000000
delay between starting threads: 0 seconds

Dhrystone(1.1) time for 4038366037 passes = 64.1
This machine benchmarks at 62957815 dhrystones/second
                           35833 DMIPS
Dhrystone(1.1) time for 4038366037 passes = 64.1
This machine benchmarks at 62972197 dhrystones/second
                           35841 DMIPS
Dhrystone(1.1) time for 4038366037 passes = 64.2
This machine benchmarks at 62939376 dhrystones/second
                           35822 DMIPS
Dhrystone(1.1) time for 4038366037 passes = 64.2
This machine benchmarks at 62876581 dhrystones/second
                           35786 DMIPS
Dhrystone(1.1) time for 4038366037 passes = 64.1
This machine benchmarks at 62961231 dhrystones/second
                           35835 DMIPS
Dhrystone(1.1) time for 4038366037 passes = 64.2
This machine benchmarks at 62939684 dhrystones/second
                           35822 DMIPS
Dhrystone(1.1) time for 4038366037 passes = 64.1
This machine benchmarks at 62967973 dhrystones/second
                           35838 DMIPS
Dhrystone(1.1) time for 4038366037 passes = 64.2
This machine benchmarks at 62940267 dhrystones/second
                           35823 DMIPS
Dhrystone(1.1) time for 4038366037 passes = 64.1
This machine benchmarks at 62985840 dhrystones/second
                           35849 DMIPS
Dhrystone(1.1) time for 4038366037 passes = 64.2
This machine benchmarks at 62920790 dhrystones/second
                           35811 DMIPS
Dhrystone(1.1) time for 4038366037 passes = 64.2
This machine benchmarks at 62919382 dhrystones/second
                           35811 DMIPS
Dhrystone(1.1) time for 4038366037 passes = 64.3
This machine benchmarks at 62809656 dhrystones/second
                           35748 DMIPS

Total dhrystone run time: 67.257970 seconds.

sa8295:

测试参数:./dhrystone -t 8 -l 100000

duration: 0 seconds
number of threads: 8
number of loops: 100000000000
delay between starting threads: 0 seconds

Dhrystone(1.1) time for 3910065408 passes = 65.5
This machine benchmarks at 59695907 dhrystones/second
                           33976 DMIPS
Dhrystone(1.1) time for 3910065408 passes = 67.3
This machine benchmarks at 58083572 dhrystones/second
                           33058 DMIPS
Dhrystone(1.1) time for 3910065408 passes = 68.8
This machine benchmarks at 56805880 dhrystones/second
                           32331 DMIPS
Dhrystone(1.1) time for 3910065408 passes = 71.3
This machine benchmarks at 54848298 dhrystones/second
                           31217 DMIPS
Dhrystone(1.1) time for 3910065408 passes = 66.9
This machine benchmarks at 58452019 dhrystones/second
                           33268 DMIPS
Dhrystone(1.1) time for 3910065408 passes = 76.1
This machine benchmarks at 51396807 dhrystones/second
                           29253 DMIPS
Dhrystone(1.1) time for 3910065408 passes = 76.9
This machine benchmarks at 50833711 dhrystones/second
                           28932 DMIPS
Dhrystone(1.1) time for 3910065408 passes = 77.4
This machine benchmarks at 50538931 dhrystones/second
                           28764 DMIPS

Total dhrystone run time: 72.050782 seconds.

测试结论:

Thor U总算力约为:35.8k*12核 约等于430k dmpis

sa8295总算力约为:250k左右

<think>好的,我需要回答用户关于NVIDIA Thor的详细资料和使用方法。首先,我应该回顾用户提供的引用内容,看看有哪些相关信息。引用1提到NVIDIA DRIVE平台和Thor作为车载计平台,引用2详细介绍了Thor-X的设计思路和选型原则,引用3讨论了Thor的性能和大芯片趋势,引用4似乎是一个关于服务器使用的问题,可能不相关。 用户的主要需求是了解Thor的详细资料和用法。我需要整理现有的信息,确保覆盖技术参数、架构设计、应用场景以及使用方法。可能需要从硬件规格、软件支持、应用案例等方面展开。同时,用户可能对如何开发或集成Thor感兴趣,所以需要提及开发工具链和生态系统支持。 需要注意的是,用户之前的引用中提到了Thor的高性能、多核架构、冗余设计等,这些都是关键点。此外,Thor作为集中式单芯片解决方案,取代了分布式ECU,这也是重要信息。在用法部分,可能需要介绍NVIDIA提供的软件栈,如DriveOS、Omniverse平台,以及如何利用这些工具进行开发。 另外,用户可能对Thor其他产品的比较或选型原则感兴趣,引用2提到了选型原则,这部分可以简要提及。最后,生成的相关问题需要围绕Thor的技术细节、应用场景、开发方法等展开,帮助用户进一步探索。</think>### NVIDIA Thor 芯片详解及使用方法 #### 一、核心参数架构特性 1. **性能** NVIDIA Thor 是面向自动驾驶的高性能计芯片,**峰值达2000 TFLOPS**[^3],支持多传感器融合处理(如激光雷达、摄像头、毫米波雷达)和复杂法并行计。 2. **架构设计** - **超异构计架构**:集成 ARM CPU 核、GPU 核和专用 AI 加速单元(如 DLA/Tensor Core),实现 CPU+GPU+AI 的混合计模式[^2][^3] - **冗余安全设计**:通过双计路径实现 ASIL-D 功能安全等级,满足车规级要求[^2] - **高速互联**:支持 PCIe Gen5 和 LPDDR5X 内存,带宽提升至 1.5TB/s[^2] 3. **芯片定位** Thor 属于集中式域控制器芯片,取代传统分布式 ECU 架构,可同时处理: - 自动驾驶感知决策(L4/L5 级) - 智能座舱交互 - 车身控制域功能融合[^3] #### 二、开发环境搭建 1. **硬件依赖** - 需搭载 NVIDIA DRIVE Thor 开发套件(含散热系统扩展接口) - 典型外设:激光雷达仿真器、多路摄像头输入模块 2. **软件工具链** ```bash # 基础环境配置 sudo apt-get install drive-os-linux pip install nvidia-driveworks-sdk ``` - **DriveOS**:实时操作系统内核,提供低延迟任务调度[^1] - **Omniverse Replicator**:用于生成合成训练数据[^1] - **CUDA-X**:加速深度学习模型部署(支持 TensorRT 推理优化) #### 三、典型开发流程示例 ```python # 使用 DriveWorks SDK 实现目标检测 import driveworks as dw from driveworks.sensors import Camera # 初始化 Thor单元 thor = dw.Core(platform='DRIVE_Thor') # 配置 8 路摄像头输入 cameras = [Camera(config_file='camera_%d.cfg'%i) for i in range(8)] # 加载 DNN 模型 detector = dw.ObjectDetector( model_path='resnet34_detector.trt', precision=dw.Precision.FP16 ) while True: frames = [cam.read() for cam in cameras] detections = detector.inference(frames) # 多传感器融合处理... ``` #### 四、应用场景选型建议 | 场景类型 | 推荐配置 | 性能需求 | |----------------|--------------------------|--------------------| | L4 自动驾驶 | 双 Thor 冗余部署 | 1500+ TFLOPS | | 智能物流车 | 单 Thor + 边缘计单元 | 800 TFLOPS | | 高精地图生成 | Thor + Omniverse 云协同 | 1200 TFLOPS + 10Gbps 上行 | **选型关键指标**: - 传感器接入数量(建议 ≥12 路摄像头+3 激光雷达) - 功能安全等级要求(ASIL-B/D) - OTA 升级带宽需求[^2]
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值