RK3399中文简介

1.概述
RK3399是一种低功耗、高性能的处理器,可用于计算、个人移动互联网设备和其他智能设备应用程序。基于大。小架构,它集成了双核心Cortex-A72和四核Cortex-A53与单独的NEON协处理器。

许多嵌入式功能强大的硬件引擎为高端应用程序提供了优化的性能。RK3399支持多格式视频解码器,包括H.264/H.265/VP9up到4Kx2K/60f解码器,特别是H.264/H.265解码器支持10位编码,还支持1080p/MVC/VP8编码器,1080p,高质量的JPEG编码器/解码器,特殊的图像预处理器和后处理器。

嵌入式3DGPU使RK3399与OpenGLES1.1/2.0/3.0/3.1/3.2、OpenCL1.2和DirectX11.1完全兼容。特殊的二维硬件引擎与MMU将最大限度地提高显示性能,并提供非常平稳的操作。

RK3399具有高性能的双通道外部内存接口(DDR3/DDR3L/LPDDR3/LPDDR4),能够维持苛刻的内存带宽,还提供了一套完整的外设接口,以支持非常灵活的应用程序。

2.功能

2.1微处理器
双核ARM皮层-A72MPCore处理器和四核ARM皮层-A53MPCore处理器,都是高性能、低功耗和缓存的应用处理器
两个CPU集群大集群-A72优化的高性能和小集群与四核皮层-A53优化的低功耗。
完全实现ARM架构v8-A指令集,ARMNeon高级SIMD(单条指令,多数据)支持加速媒体和信号处理
ARMv8密码扩展
SCU确保每个集群的MPCore之间的内存一致性
CCI500确保两个集群之间的内存一致性每个Cortex-A72集成了48KBL1指令缓存和32KBL1数据缓存与4路集关联。每个CortexA53集成32KBL1指令缓存和32KBL1数据缓存,分别采用4路集关联
1MB统一L2缓存,512KB统一L2缓存信任区技术支持
全核视图调试解决方案
CPU核心系统的8个独立的电源域,以支持内部电源开关,并根据不同的应用场景在外部打开/关闭
两个隔离电压域,分别支持大簇和小簇的DVFS。

2.2内存组织
内部片内内存
–BootROM
–内部SRAM
外部片外memory①
–DDR3/DDR3L/LPDDR3/LPDDR4
–SPI非/NAND闪存
–eMMC5.1SD3.0/MMC4.51

2.3内存
内部引导
–大小:32KB
–支持系统从以下设备引导:
SPI接口
eMMC接口
SD/MMC接口
–支持系统接口下载以下:
USBOTG接口
内部SRAM大小:200KB
支持安全和非安全访问
安全或非安全软件可编程
安全空间安全空间可以是0KB,4KB,8KB,12KB,16KB,…高达64KB,4KB步骤

2.4外接存储器或存储设备
动态内存接口(DDR3/DDR3L/LPDDR3/LPDDR4)
兼容JEDEC标准DDR3-1866/DDR3L-1866/LPDDR3-1866/LPDDR4sdram
支持2通道,每个信道16或32位数据宽
每个通道支持最多2级(芯片选择);共4GB(最大)地址空间。最大地址的空间通道也4GB,这是软件可配置
32位/64位数据宽度是软件可编程
可编程定时参数支持DDR3/DDR3DL/LPDDR3/LPDDR4DDRam从各种供应商
高级命令重新排序和调度最大化总线利用率
嵌入式PHY动态漂移检测与控制器
可编程输出和ODT阻抗与动态PVT补偿
低功率模式,如DDR3/DDR3L/LPDDR3/LPDDR4sdram
断电和自刷新支持待机模式自动门控DDR控制器时钟省电
支持断电DDR控制器和DDRPHY
支持基于硬件的DDR频率扩展

2.5系统组件
内核-M0
两个内核-M0在RK3399与内核-A72/内核-A53
拇指指令集结合高代码密度和32位性能
集成睡眠模式低功耗
快速代码执行允许慢处理器时钟或增加睡眠模式时间
确定性,高性能中断处理时间关键应用程序
串行线调试减少所需的针脚调试

CRU(时钟和重置单元)
支持时钟门控个别组件在RK3399
一个振荡器24兆赫时钟输入和8嵌入式锁
支持全球软复位控制整个SOC,也个人软复位为每个组件

PMU(电源管理单元)
多种可配置的工作模式来节省电力通过不同的频率或自动时钟门控控制或电源域开/关控制
大量的唤醒源在不同的模式
6单独的电压域
30单独的电源域,软件可以根据不同的应用场景上下电源

计时器
14芯片上64位计时器SoC基于中断操作不安全应用
12芯片上64位计时器SoC基于中断操作安全应用
提供两种操作模式:自由运行和用户定义计数支持计时器工作状态检查
固定24MHz时钟输入

PWM
四芯片基于中断操作
可编程预比例操作总线时钟,然后进一步缩放
嵌入式32位定时器/计数器设施
支持捕获模式支持连续模式或一次性模式
提供参考模式和输出各种占空比波形

看门狗
3个32位计数器宽度的计数器
计数器从APB总线计数从预设值下降到0,以指示超时
WDT在超时发生时可以执行两种类型的操作:
生成一个系统重位首先生成一个中断,如果在第二次超时发生时没有被服务例程所清除,则生成一个系统重位
可编程重位脉冲长度
完全16个确定的主要超时范围

邮箱
两个邮箱在SoC服务多核通信
支持每个邮箱四个邮箱元素,每个元素包括一个数据字,一个命令字寄存器和一个标志位,可以代表一个

中断
提供32个锁寄存器用于软件指示邮箱是否被占用
总线架构
128位/64位/32位多层AXI/AHB/APB复合总线架构
CCI500嵌入式支持两个集群缓存一致性
5嵌入式AXI互连
PERI低性能互连与一个128位AXI主服务器,7个64位AXI主服务器,一个32位AXI主服务器,两个64位AXI主服务器,5个32位AHB主服务器和许多32位AHB/APB从
PERI高性能互连一个128位AXI主服务器,一个128位AXIAHB主服务器和许多32位AHB/APB奴隶
显示互连两个128位AXI主服务器,两个64位AXI主服务器,一个32位AXI主服务器和大量32位AHB/APB奴隶
GPU互连一个128位AXI主服务器和32位APB从
视频与两个128位AXI主服务器,两个64位AXI主服务器和4个32位AHB从服务器灵活的不同QoS解决方案,以提高总线带宽的效用

中断控制器
支持8PPI中断源和148SPI中断源输入来自RK3399
支持16软件触发中断输入中断级别是固定的,对SPI高水平敏感,对PPI
支持本地特定的外围中断(LPI)低级敏感。这些中断是通过对控制器中的内存映射寄存器的外围接口生成的
支持每个中断源的不同中断优先级,并且它们始终是软件可编程的

2.6视频编解码器
视频解码器
MMU嵌入式
实时视频解码器:MPEG-1、MPEG-2、MPEG-4、H.263、H.264、H.265、VC-1、VP9、VP8、MVC
在这里插入图片描述
视频编码器
在这里插入图片描述
在这里插入图片描述
2.7外设接口
SDIO接口
兼容SDIO3.0协议
4位数据总线宽度
总共有2个MMC接口,可配置为SD/MMC或SDIO

GMAC10/100/1000M以太网控制器
有一个千兆以太网接口
使用RGMII接口支持10/100/1000mbps数据传输速率
支持10/100mbps数据传输速率
支持全双工和半双工操作

SPI控制器
6片上SPI控制器在
支持串行主和串行从模式,软件可配置基于
DMA或基于中断的操作
嵌入式两个32x16位FIFO分别用于TX和RX操作

UART控制器
5片上UART控制器在RK3399
基于DMA或基于中断的操作
嵌入式两个64字节FIFO为TX和RX操作
分别支持5位、6位、7位、8位串行数据传输或接收
标准异步通信位,如启动、停止和奇偶校验
支持UART操作的不同输入时钟达到4Mbps或其他特殊波特率
支持波特时钟生成的非整数时钟划分
支持UART0和UART3的自动流量控制模式

I2C控制器
9芯片上I2C控制器
多主I2C操作
支持7位和10位地址模式
串行8位定向和双向数据传输可以使
软件可编程时钟频率
I2C总线上的数据可以传输速率高达100k位/s,在快速模式,400k位/s或在快速模式+1Mbit/s。

GPIO
5组GPIO(GPIO0~GPIO4),完全有122GPIO
所有GPIO可以用来生成中断CPU
GPIO0和GPIO1可以用来唤醒系统从低功耗模式
拉方向(上拉或下拉)所有GPIO是软件可编程
所有GPIO总是在输入方向缺电复位
所有GPIO的驱动强度是软件可编程的

USBOTG3.0
嵌入式2USBOTG3.0接口
兼容规范通用串行总线3.0规范,版本1.0
通用串行总线规范,通用串行总线(xHCI)版本2.0
可扩展主机控制器接口,版本1.1
支持控制/批量(包括流)/中断/同步传输
同步传输USB3.0,高达8Gbps带宽描述符缓存和数据预取
USB3.0设备功能

USB2.0主机
嵌入式2USB2.0主机接口
兼容USB2.0主机规范
支持高速(480Mbps)、全速(12Mbps)和low-speed(1.5Mbps)模式
提供16个主机模式通道
支持主机模式下的定期输出通道

PCIe
在RK3399中的一个PCIe端口,兼容PCI快速基本规范修订2.1
操作模式:根复杂(RC)
最大链路宽度为4,单双向链路接口
支持2。5GT/s每车道串行数据传输速率
支持模块内的DMA,2个通道,2个RAM分区,2K字节深度
支持可调整BAR能力支持单物理PCI功能支持端点模式
支持遗留中断和MSI和MSI-X中断
支持出站和入站地址转换
支持附加到物理功能的虚拟功能
支持PCI快速活动状态电源管理(ASPM)状态L0和L1
支持L1电源管理子状态
支持PCI功能电源状态D0、D1和D3,以及相应的链路电源状态L0、L1和L2

<think>好的,我现在要处理用户关于RKNN和NPU的询问。首先,我需要理清用户的问题:他们想了解RKNN和NPU的介绍及应用。根据提供的引用资料,我需要整合这些信息,同时按照系统级指令的要求来组织回答。 首先,NPU是神经网络处理单元,专门用于加速AI任务。用户提供的引用中,引用[1]提到RK3566内置NPU模块,引用[2]和[3]涉及RK3588平台的RKNN SDK和RKNPU2的使用,而引用[4]详细介绍了RKNN Toolkit Lite2的用途和部署流程。需要将这些信息综合起来,分别解释NPU和RKNN的概念,以及它们的应用场景。 接下来,系统指令要求使用正确的中文回答,生成相关问题,并正确引用资料。我需要确保所有数学表达式(如果有的话)使用正确的格式,但当前问题主要涉及技术描述,可能不需要数学公式。不过需要注意代码块的使用,比如引用中的Python示例,可能需要展示相关代码片段,例如引用[4]中的git命令和工具链使用步骤。 然后,要检查每个引用的内容,确保引用的标注正确。例如,当提到NPU在RK3566中的应用时,需要引用[1];当讨论RKNN SDK时,引用[2]和[4];提到不同芯片平台时,引用[3]和[4]等。 用户可能的应用场景包括图像处理、语音识别等AI任务,需要结合引用中的例子,如rknn_yolov5_demo在RK3588上的运行(引用[3])以及YOLOV5部署到OK3588(引用[4])。 在结构方面,应该先介绍NPU和RKNN的基本概念,再分点说明应用场景、开发流程、工具链支持等。同时,生成的相关问题需要围绕用户可能感兴趣的后续内容,比如如何部署模型、性能优化、与其他硬件的对比等。 需要确保回答真实可靠,所有技术细节均来自提供的引用资料,避免编造信息。例如,RKNN模型需要通过RKNN Toolkit2转换,而部署时使用RKNN Toolkit Lite2,这些步骤在引用[4]中有详细说明。 最后,按照示例中的格式,使用标题、代码块(如果有必要)、引用标注,以及相关问题部分。确保没有使用Markdown格式,但保持结构清晰。同时,检查LaTeX是否符合要求,虽然当前问题可能不需要,但需注意后续是否有数学相关内容。 总结步骤: 1. 定义NPU及其在Rockchip芯片中的作用。 2. 介绍RKNN作为模型格式和SDK工具链。 3. 分点说明应用场景,如视觉处理、语音识别等。 4. 描述开发流程:模型转换、部署步骤。 5. 提供工具链信息,如RKNN Toolkit Lite2的使用。 6. 生成相关问题,如优化方法、部署步骤对比等。 需要确保每个关键点都有对应的引用标注,如NPU模块在RK3566中的使用引用[1],RKNN SDK的作用引用[2]和[4],不同平台的支持引用[3]和[4]等。</think>### RKNN与NPU介绍及应用 #### 1. **NPU简介** NPU(Neural Processing Unit)是专门用于加速神经网络计算的硬件单元,具备高效能、低功耗的特点。Rockchip芯片(如RK3566、RK3588)内置NPU模块,可加速AI推理任务,例如图像分类、目标检测等[^1][^2]。 #### 2. **RKNN的定义与作用** RKNN是Rockchip定义的神经网络模型格式,需通过**RKNN Toolkit2**将主流框架(如TensorFlow、PyTorch)的模型转换为RKNN格式,从而在NPU上高效运行[^4]。 其核心工具链包括: - **RKNN-Toolkit2**:模型转换与量化工具,支持跨平台模型优化。 - **RKNN-Toolkit-Lite2**:部署工具,提供Python接口实现模型推理加速。 #### 3. **应用场景** - **计算机视觉**:如YOLOv5目标检测(参考`rknn_yolov5_demo`在RK3588上的部署[^3])。 - **语音处理**:语音识别、降噪等实时任务。 - **边缘计算**:低功耗设备上的实时AI推理,如智能摄像头、工业检测[^1]。 #### 4. **开发流程示例** 以部署YOLOv5模型到RK3588为例: 1. **模型转换**:使用RKNN-Toolkit2将PyTorch模型转为RKNN格式。 2. **部署到设备**:通过RKNN-Toolkit-Lite2加载模型,调用NPU接口加速推理。 3. **代码示例(简化)**: ```bash git clone https://github.com/rockchip-linux/rknn-toolkit2 # 下载工具链[^4] ``` ```python from rknnlite.api import RKNNLite rknn = RKNNLite() rknn.load_rknn("yolov5.rknn") # 加载模型 rknn.init_runtime(core_mask=RKNNLite.NPU_CORE_0) # 指定NPU核心[^4] ``` #### 5. **工具链与平台支持** - **芯片兼容性**:RK3566、RK3588等(RKNPU2支持RK3588,旧版本支持RK3399)。 - **开发环境**:需在设备上安装Miniconda及RKNN SDK依赖库[^4]。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

流年過客

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值