RISC-V处理器设计(五)—— 在 RISC-V 处理器上运行 C 程序

目录

一、前言

二、从 C 程序到机器指令

三、实验

3.1 实验环境

3.11 Windows 平台下环境搭建

3.12 Ubuntu 平台下环境搭建

3.13 实验涉及到的代码或目录

3.2 各文件作用介绍

3.2.1 link.lds

3.2.2 start.S

3.2.3 lib 和 include 目录

3.2.4 common.mk

3.2.5 demo 目录

3.3 上板测试

第一种:直接作为 FPGA 比特流的一部分下载到板子上。

第二种:使用串口烧录程序。

四、写在最后


文章目录

RISC-V处理器的设计与实现(一)—— 基本指令集_Patarw_Li的博客-优快云博客

RISC-V处理器的设计与实现(二)—— CPU框架设计_Patarw_Li的博客-优快云博客

RISC-V处理器的设计与实现(三)—— 上板验证_Patarw_Li的博客-优快云博客

RISC-V处理器设计(四)—— Verilog 代码设计-优快云博客 

RISC-V处理器设计(五)—— 在 RISC-V 处理器上运行 C 程序-优快云博客 

一、前言

前面我们使用 verilog 完成了一个 risc-v cpu 的设计,但 cpu 最终也是为了程序服务的,不能执行程序的 cpu 没有任何意义。所以这一节我们要研究如何在自己设计的 cpu 上运行 C 程序。项目仓库如下:

risc-v-cpu: 一个基于 RISC-V 指令集的 CPU 实现(成功移植到野火征途 PRO 开发板),以及从零开始写一个基于 RISC-V 的 RT-Thread~ - Gitee.com

本节涉及到的代码都在仓库的 rt-thread 目录下。

二、从 C 程序到机器指令

当然,cpu 肯定不能直接执行 C 程序,cpu 只能识别机器语言,机器语言就是由 0 和 1 组成的一条二进制序列,比如 ADD 指令有如下格式:

在确定 rs1、rs2、rd 三个寄存器后,就能确定 ADD 指令的二进制序列,cpu 能够识别并执行这个二进制序列。 risc-v 指令集相关内容可以看我的这篇文章:
RISC-V处理器的设计与实现(一)—— 基本指令集_risc_v-优快云博客

那么我们如何从 C 程序得到我们想要的机器指令呢?答案就是使用编译器,编译分为如下四个阶段(程序从编译到运行-优快云博客):

即预处理阶段、生成汇编代码阶段、汇编阶段、链接阶段,你可能会问为什么图里面的编译器只参与了一个阶段的工作,这是因为现在的编译工具功能非常强大,比如 linux 下的 gcc,我们只需要一行指令就能帮我们完成四个阶段的操作:

gcc hello.c

最终生成的 a.out 即为操作系统(如 Linux、Ubuntu)上的可执行程序,此时的 a.out 虽然能在 像 Linux 这种操作系统上运行,但是 cpu 并不能直接识别并运行,编译生成的 a.out 大多是 ELF 格式。

ELF 格式的可执行文件包含了很多 cpu 不能识别的信息,但像 Linux 这样的操作系统可以识别这些信息,比如判断该可执行文件可以在哪种架构上运行,该可执行文件的各个段的位置在哪等等。关于 ELF 文件的解析可以看如下博客:

ELF文件详解—初步认识-优快云博客

为了得到 cpu 能直接识别的内容,我们可以通过 objcopy 指令将生成的 a.out 转变为去掉了这些无用信息的 hello.bin 文件,具体怎么操作可以看我的这篇博客:

开发一个RISC-V上的操作系统(一)—— 环境搭建_riscv操作系统开发_Patarw_Li的博客-优快云博客

同时,如果要编译出我们 risc-v 架构的 cpu 能识别的机器指令,我们还需要选择对应的交叉编译器,如 Ubuntu 20.04 下可以使用官方提供的 riscv64-unknown-elf-gcc。如果你使用的是 x86 下的gcc,那么编译出来的机器指令则只能由 x86 架构的 cpu 识别。

三、实验

实验的目录在本仓库的 rt-thread 目录下,该目录下新增了一个 demo 目录,可供用户自己设计 C 程序到本 cpu 上运行。其他的 experiment 目录都是和 rt-thread 移植相关的,后续也会更新相应的文章。

3.1 实验环境

下面是两种平台下的编译环境搭建,大家可以根据自己的情况自行选择。 

3.11 Windows 平台下环境搭建

  1. GNU 工具链(链接:https://pan.baidu.com/s/1Bdmn-FH0T7ekm2kMxkzJTw?pwd=qn69 提取码:qn69),百度云下载解压后,将 bin 目录添加到环境变量里即可。
  2. make 工具(链接:https://pan.baidu.com/s/1X-F1BVPMa3-B-V1EHB4tEQ?pwd=418d 提取码:418d),百度云下载解压后,将 bin 目录添加到环境变量里即可。
  3. Python 3.7

3.12 Ubuntu 平台下环境搭建

Ubuntu 版本:

$ lsb_release -a
No LSB modules are available.
Distributor ID:	Ubuntu
Description:	Ubuntu 20.04.2 LTS
Release:	20.04
Codename:	focal
 
$ uname -r
5.15.0-76-generic

安装Ubuntu 20.04官方提供的 GNU工具链:

sudo apt update
sudo apt install build-essential gcc make perl dkms git gcc-riscv64-unknown-elf

并且要将 Makefile 里面的 include ../common.mk 修改为 include ../common_ubuntu.mk

3.13 实验涉及到的代码或目录

  1. include:公共头文件目录;
  2. lib:公共函数目录;
  3. start.S:启动文件;
  4. link.lds:链接脚本;
  5. common.mk:Makefile 的公共部分(Windows 平台下);
  6. common_ubuntu.mk:Makefile 的公共部分(Ubuntu 平台下);
  7. demo:用户可以在本目录下编写能在本 CPU 上运行的 C 程序;

3.2 各文件作用介绍

3.2.1 link.lds

link.lds 被称为链接脚本,是编译器链接步骤的重要部分。 官方文档

链接操作都是由链接脚本(Linker Script)所控制的,按照官方的话来说,链接脚本用来描述 input file(比如 hello.c 和 printf.c,编译器会将他们分别编译成 hello.o 和 printf.o,这两个文件就是链接操作的输入)中的每个 section 应该如何被映射到 output file(最终生成的可执行文件)中,并且控制 output file 中的内存布局。

我们可以自己编写链接脚本,也可以使用默认的链接脚本,如果要使用自己编写的链接脚本,则需要在编译时使用 -T 参数来指定。

关于链接脚本的语法大家可以自行查阅资料,这里我只介绍对于本次实验比较重要的部分:

1. ENTRY 来确定程序的入口为 _start,该符号在 start.S 中声明:

ENTRY(_start)

2. MEMORY 部分,这部分是根据 soc 上的 flash 和 ram 在总线上的起始地址以及所支持的空间大小来配置的。比如本 cpu 的 rom 起始地址为 0x00000000,大小为 16KB:

MEMORY
{
  flash (rxai!w) : ORIGIN = 0x00000000, LENGTH = 16K
  ram   (wxa!ri) : ORIGIN = 0x10000000, LENGTH = 8K
}

3. 定义程序栈大小,如果其他地方没有 __stack_size 的定义就把栈大小定义为 2KB:

 __stack_size = DEFINED(__stack_size) ? __stack_size : 2K;

4. 有些段是可读可写的,比如 .data 段,这些段是不能放到 flash 上的(flash 只读),所以我们在链接脚本中会把 .data 段指定到 ram 上存储(使用 >ram):

 .lalign         :
  {
    . = ALIGN(4);
    PROVIDE( _data_lma = . );
  } >flash AT>flash 

  .dalign         :
  {
    . = ALIGN(4);
    PROVIDE( _data = . );
  } >ram AT>flash 

  .data          :
  {
    *(.rdata)

    *(.gnu.linkonce.r.*)
    *(.data .data.*)
    *(.gnu.linkonce.d.*)
    . = ALIGN(8);
    PROVIDE( __global_pointer$ = . + 0x800);
    *(.sdata .sdata.*)
    *(.gnu.linkonce.s.*)
    . = ALIGN(8);
    *(.srodata.cst16)
    *(.srodata.cst8)
    *(.srodata.cst4)
    *(.srodata.cst2)
    *(.srodata .srodata.*)
  } >ram AT>flash 

  . = ALIGN(4);
  PROVIDE( _edata = . );
  PROVIDE( edata = . );

但这样会导致生成的二进制文件中间产生很大的空洞,因为 flash 和 ram 的地址一般是不同的,所以我们需要使用 AT>(关于 AT> 的作用可以看这篇博客https://www.cnblogs.com/LogicBai/p/16982841.html),这样可以把 .data 段先放到 flash 中,然后在启动文件 start.S 中通过 _data_lma、_data、_edata(分别对应 .data 段在 flash 中的实际地址、在 ram 上的逻辑起始地址、在 ram 上的逻辑末尾地址)这三个地址来把 .data 段从 flash 上搬运到 ram 上,这样就可以将数据存储的位置和运行的位置区分开来

5. 因为 .bss 段的数据都为 0,所以无需占用存储空间,只需要保存 .bss 段的运行时的逻辑起始地址和末地址(__bss_start 和 _end),然后在启动时使用  start.S 将起始地址到末地址中间的内容初始化为 0 即可:

  PROVIDE( __bss_start = . );
  .bss            :
  {
    *(.sbss*)
    *(.gnu.linkonce.sb.*)
    *(.bss .bss.*)
    *(.gnu.linkonce.b.*)
    *(COMMON)
    . = ALIGN(4);
  } >ram AT>ram 

  . = ALIGN(8);
  PROVIDE( _end = . );

3.2.2 start.S

启动文件 start.S 作为 cpu 上电复位后第一个执行的程序,主要完成以下工作:

  • 初始化 gp (global pointer) 全局指针寄存器、sp (stack pointer) 栈指针寄存器;
  • 将 .data 段的数据从 flash 中加载至 RAM 中;
  • 清空 bss 段数据;
  • 进入 main 函数运行;

start.S 的代码如下: 

.section .init;
.globl _start;
.type _start, @function

_start:
.option push
.option norelax
    la gp, __global_pointer$
.option pop
    la sp, _sp

    /* 把 data section 从 flash 搬运到 ram 中 */
    la a0, _data_lma
    la a1, _data
    la a2, _edata
    bgeu a1, a2, 2f
1:
    lw t0, (a0)      /* 从 flash 中取出一个 word 的数据 */
    sw t0, (a1)      /* 将取出的数据存入 ram 中对应位置 */
    addi a0, a0, 4
    addi a1, a1, 4
    bltu a1, a2, 1b
2:
    /* 将 bss section 初始化为 0 */
    la a0, __bss_start
    la a1, _end
    bgeu a0, a1, 2f
1:
    sw zero, (a0)
    addi a0, a0, 4
    bltu a0, a1, 1b
2:

    /* 调用初始化函数 */
    call _init
    /* 跳转到 main */
    call main

/* never came here */
loop:
    j loop

第 8 行, 加载全局指针寄存器 gp。

第 10 行,加载栈指针寄存器 sp。

第 13 ~ 22 行,把 .data 段从 flash 搬运到 ram 中。

第 25 ~ 31 行,将 .bss 段初始化为 0。

第 35 行,调用初始化函数,定义在 init.c 中。

第 37 行,调用 main 函数,执行用户编写的程序。

第 40、41 行,为了防止执行用户程序后,cpu 跑飞的情况,最后写了一个死循环。

3.2.3 lib 和 include 目录

这两个目录主要提供一些公共的函数,比如串口、printf 函数等,用户可以在 main.c 文件里面包含头文件后使用里面定义的函数。

3.2.4 common.mk

该文件为 Makefile 编译脚本的公共部分,所有 Makefile 文件(比如 demo 里面的 Makefile)都会包含 common.mk。

common.mk 的内容如下: 

CROSS_COMPILE = riscv-none-embed-

RISCV_GCC     := $(CROSS_COMPILE)gcc
RISCV_AS      := $(CROSS_COMPILE)as
RISCV_GXX     := $(CROSS_COMPILE)g++
RISCV_OBJDUMP := $(CROSS_COMPILE)objdump
RISCV_GDB     := $(CROSS_COMPILE)gdb
RISCV_AR      := $(CROSS_COMPILE)ar
RISCV_OBJCOPY := $(CROSS_COMPILE)objcopy
RISCV_READELF := $(CROSS_COMPILE)readelf

.PHONY: all
all: $(TARGET)

ASM_SRCS += $(COMMON_DIR)/start.S

C_SRCS += $(COMMON_DIR)/init.c 
C_SRCS += $(COMMON_DIR)/lib/uart.c 
C_SRCS += $(COMMON_DIR)/lib/printf.c
C_SRCS += $(COMMON_DIR)/lib/hw_timer.c


LINKER_SCRIPT := $(COMMON_DIR)/link.lds

INCLUDES += -I$(COMMON_DIR)

LDFLAGS += -T $(LINKER_SCRIPT) -nostartfiles -Wl,--gc-sections -Wl,--check-sections

ASM_OBJS := $(ASM_SRCS:.S=.o)
C_OBJS := $(C_SRCS:.c=.o)
LINK_OBJS += $(ASM_OBJS) $(C_OBJS)
LINK_DEPS += $(LINKER_SCRIPT)

CLEAN_OBJS += $(TARGET) $(LINK_OBJS) $(TARGET).dump $(TARGET).bin ../$(TARGET).inst

CFLAGS += -march=$(RISCV_ARCH)
CFLAGS += -mabi=$(RISCV_ABI)
CFLAGS += -mcmodel=$(RISCV_MCMODEL) -nostdlib -ffunction-sections -fdata-sections -fno-builtin-printf -fno-builtin-malloc -Wall

$(TARGET): $(LINK_OBJS) $(LINK_DEPS) Makefile
	$(RISCV_GCC) $(CFLAGS) $(INCLUDES) $(LINK_OBJS) -o $@ $(LDFLAGS)
	$(RISCV_OBJCOPY) -O binary $@ $@.bin
	$(RISCV_OBJDUMP) --disassemble-all $@ > $@.dump
	python ../../tools/bin_to_mem.py $@.bin ../$@.inst

$(ASM_OBJS): %.o: %.S
	$(RISCV_GCC) $(CFLAGS) $(INCLUDES) -c -o $@ $<

$(C_OBJS): %.o: %.c
	$(RISCV_GCC) $(CFLAGS) $(INCLUDES) -c -o $@ $<

.PHONY: clean
clean:
	rm -f $(CLEAN_OBJS)

第 1 ~ 10 行,配置工具链。

第 15 ~ 20 行,指定需要编译的公共汇编文件和 C 文件。

第 23 行,配置链接脚本的路径。

第 25 行,指定公共头文件目录。

第 27 行,指定链接参数

  1. -nostartfiles:指定链接时不要使用标准的系统启动文件,自定义入口函数(_start)时必须使用 -nostartfiles 选项进行链接。
  2. -Wl,--gc-sections:在链接生成最终可执行文件时,如果带有-Wl,--gc-sections参数,并且之前编译目标文件时带有-ffunction-sections-fdata-sections参数,则链接器ld不会链接未使用的函数,从而减小可执行文件大小。
  3. --check-sections:检查段地址是否重叠 (默认)。

3.2.5 demo 目录

此目录下包含了 main.c 文件和 Makefile,在此目录下执行 make 命令即可生成 demo.bin 和 demo.inst 文件,下面上板测试会用到这两个文件。

main.c 文件的内容是一个简单的加法,然后输出加法的结果,用户可以改成自己的 C 程序:

/* 头文件声明 */
#include "../include/printf.h"
#include "../include/uart.h"

/* main 函数 */
int main(void)
{
    int a = 1;
    int b = 2;
    int c = a + b;
    printf("The result of c: %d\n", c);

    /* stop here */
    while(1){};
}

3.3 上板测试

有两种将编译好的二进制程序在本 CPU 上执行的方法。

第一种:直接作为 FPGA 比特流的一部分下载到板子上。

将 FPGA/rtl/perips/rom.v 文件里面的如下部分的注释打开,并且将路径改为生成的指令文件 demo.inst 的路径:

重新编译后,直接烧录到板子上即可: 

使用串口工具连接板子,配置好串口号和波特率并打开串口后,按下板子上的复位键即可看到输出: 

第二种:使用串口烧录程序。

将 demo.bin 二进制文件复制到 serial_utils/binary 目录下,然后进入 serial_utils 目录,先按住 key1 不动: 

然后使用命令行执行如下命令烧录 demo.bin 文件,烧录完成即可松开 key1:

# 这里的 COM 号要根据你自己的来选,我这里是 COM3
python .\serial_send.py COM3 .\binary\demo.bin

使用串口工具连接板子,配置好串口号和波特率并打开串口后,按下板子上的复位键即可看到输出: 

两种方法相比,第一种方法更为稳妥,第二种方法更为灵活,这里更建议大家使用第一种方法,在程序出问题的时候,第一种方法还可以使用 modelsim 仿真调试。

第二种方法目前还不太稳定,如果遇到第二种方法烧录失败可以多烧录几次(可能因为接触不良),或者尝试一下第一种方法。

四、写在最后

至此,如何在本项目的 CPU 上运行 C 程序已经介绍完了,既然能运行 C 程序,那么运行一个实时操作系统应该也是没问题的,这也对应了本项目的 rt-thread 实验,大家感兴趣的话可以继续学习本仓库,后续也会出相应的文章!

如果遇到问题也欢迎加群 892873718 交流~ 

<think>好的,用户现在问的是链接脚本中的srodata、ldata、interface等段是什么意思。我需要先回忆之前和用户的对话历史。之前用户询问了关于Tasking编译器中链接脚本的关键字,比如farrom,以及类似的关键字,比如nearrom、nearram等。用户现在的问题还是关于链接脚本中的段名,但这次是srodata、ldata、interface这些段。 首先,我需要确认用户提到的这些段具体是哪些环境下的。用户之前提到的是Tasking编译器针对英飞凌TriCore架构的链接脚本(.lsl文件)。不过,srodata、ldata、interface这些段可能更常见于GNU链接脚本或者其他编译环境,比如RISC-V或某些嵌入式系统。需要确认这一点,但用户没有明确说明,可能需要根据常见用法来解释。 接下来,我需要逐个分析这些段名的含义。比如srodata可能代表“small read-only data”,类似于常见的.rodata段,但可能针对小型数据进行了优化。ldata可能指的是“long data”或者“large data”,用于存放较大的数据。interface段可能用于模块间的接口数据,但需要进一步验证。 还要考虑不同编译器和架构的差异。比如在GNU链接器中,常见的段有.text、.data、.bss、.rodata等,但srodata可能不是标准段名,而是特定项目或架构的约定。同样,ldata和interface也可能是项目特定的自定义段。 可能需要查阅相关资料,确认这些段在特定上下文中的定义。比如在RISC-V的嵌入式开发中,可能有sdata(small data)和srodata(small read-only data),用于快速访问的小数据。ldata可能对应ldata或large data,用于较大的数据块,需要不同的访问方式。interface段可能用于存放不同模块之间共享的数据结构或函数指针表,确保链接时正确放置。 同时,需要提醒用户,这些段名可能因项目和工具链的不同而有所变化,建议用户参考具体的链接脚本文档或项目规范。此外,解释段的作用时,要结合内存布局和访问速度等因素,比如小数据段通常放在靠近CPU的快速内存区域,而大数据段可能放在较慢但容量大的区域。 还要检查之前的回答是否覆盖过类似内容,确保这次回答的一致性和补充性。之前提到过nearrom、farrom等内存区域关键字,现在需要扩展到段(section)的概念,比如代码段、数据段等,以及特定段的作用。 最后,确保语言清晰,结构合理,分点解释每个段的含义和用途,并举例可能的链接脚本用法,帮助用户理解如何将这些段映射到内存区域。同时,注意用户可能的实际需求,比如优化代码或解决链接问题,因此需要强调正确分配段的重要性,以及如何根据硬件特性进行配置。</think>在链接脚本中,`srodata`、`ldata`、`interface` 等是用于定义代码和数据存储位置的 **段(Section)名称**。这些段的命名和用途通常与编译器、目标架构(如TriCore)以及具体项目的内存布局约定相关。以下是详细解释: --- ### **1. 通用段分类** #### **(1) `.text`** - **用途**:存储可执行代码(函数、程序指令)。 - **典型属性**:`READONLY`、`EXECUTE`。 #### **(2) `.data`** - **用途**:存储已初始化的全局变量或静态变量。 - **典型属性**:`READWRITE`。 #### **(3) `.bss`** - **用途**:存储未初始化的全局变量或静态变量(默认初始化为0)。 - **典型属性**:`READWRITE`、`NOBITS`(不占用二进制文件空间)。 #### **(4) `.rodata`** - **用途**:存储只读数据(如常量字符串、常量数组)。 - **典型属性**:`READONLY`。 --- ### **2. 用户问题中的特殊段** #### **(1) `srodata`** - **含义**:**Small Read-Only Data**(小型只读数据)。 - **用途**: - 存储小型常量数据(如小型查找表、短字符串)。 - 通常映射到快速访问的“近地址”ROM(例如 `nearrom`)。 - **特点**: - 与普通 `.rodata` 相比,`srodata` 可能针对硬件优化(例如TriCore的本地内存单元LMU)。 - 需通过短地址寻址(减少指令周期)。 #### **(2) `ldata`** - **含义**:**Long/ Large Data**(长数据或大型数据)。 - **用途**: - 存储较大的数据块(如大型数组、结构体)。 - 通常映射到“远地址”RAM(例如 `farram`)。 - **特点**: - 访问速度较慢,但容量更大。 - 可能需通过长指针或间接寻址访问。 #### **(3) `interface`** - **含义**:**模块接口段**。 - **用途**: - 存储模块间共享的数据或函数指针表(如API接口表)。 - 确保不同模块在链接时能正确访问共享资源。 - **特点**: - 可能需固定地址或对齐约束(例如4字节对齐)。 - 常见于多核或分模块开发的复杂系统。 --- ### **3. 链接脚本中的定义示例** 以下是一个简化的链接脚本(以TriCore的Tasking编译器为例): ```lsl // 定义内存区域 memory nearrom { size = 64K; type = rom; } memory farram { size = 1M; type = ram; } // 将srodata绑定到nearrom section_layout ::tc0:fpi_bus0 { group (run_addr = mem:nearrom) { select ".srodata"; } } // 将ldata绑定到farram section_layout ::tc0:fpi_bus0 { group (run_addr = mem:farram) { select ".ldata"; } } // 固定interface段的地址 section_layout ::tc0:fpi_bus0 { group (run_addr = 0x80000000) { select ".interface"; } // 强制地址对齐 } ``` --- ### **4. 段分配的核心原则** 1. **性能优化**: - 高频访问的小数据 → `srodata`(近地址ROM)。 - 低频访问的大数据 → `ldata`(远地址RAM)。 2. **模块化设计**: - 共享接口 → `interface`(固定地址,避免链接冲突)。 3. **硬件约束**: - 根据内存类型(ROM/RAM)、地址范围、总线宽度合理分配。 --- ### **5. 其他常见段** | 段名 | 用途 | |----------------|--------------------------------------| | `.stack` | 栈空间(函数调用、局部变量) | | `.heap` | 动态内存分配区域 | | `.vectors` | 中断向量表 | | `.init` | 初始化代码(如启动代码) | | `.shared` | 多核共享数据区 | --- ### **6. 注意事项** 1. **命名约定**: - 段名通常以 `.` 开头,但具体名称可能因编译器或项目而异。 2. **内存冲突**: - 需检查 `.map` 文件,确保不同段不重叠。 3. **对齐要求**: - 部分段(如中断向量表)需强制对齐(例如256字节对齐)。 --- ### **总结** - `srodata`:小型只读数据段,优化快速访问。 - `ldata`:大型数据段,适合远地址存储。 - `interface`:模块接口段,用于共享数据或函数表。 - 实际开发中需结合硬件手册和项目需求,合理规划段与内存的映射关系。
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值