实战派S3 做语音留言器（TF卡录音）

原创于 2025-12-08 11:35:38 发布 · 541 阅读

22 ·

CC 4.0 BY-SA版权

文章标签：

#实战派S3 # 录音机 # 嵌入式音频

AI助手已提取文章相关产品：

用“实战派S3”打造一个会说话的口袋录音机 🎙️

你有没有过这样的经历？突然冒出一个灵感，想记下来，却发现手机不在身边；或者家里老人不会打字，有事只能打电话说一遍又一遍。其实我们真正需要的，不是复杂的语音助手，而是一个 按一下就能说话、自动存文件、随时能回放 的小玩意儿——就像小时候那种磁带随身听，但更聪明、更安静、还能插卡保存。

今天，我就带你用一块叫“实战派S3”的国产开发板，亲手做一个 离线运行、TF卡存储、按键录音 的语音留言器。它不联网、不依赖云服务，按下按钮就开始录，再按一下就保存，连Windows都能直接打开播放。整个过程不需要PC编程介入，烧好系统就能跑，适合创客、教学，甚至可以作为产品原型快速验证。

这可不是什么玩具项目。我会把你在真实工程中可能踩的坑、听到杂音怎么办、文件打不开怎么排查、TF卡老掉线如何解决……全都摊开讲清楚。咱们不玩虚的，只讲能落地的东西。

从麦克风到TF卡：声音是怎么被“抓住”的？

想象一下这个场景：你说一句话，“你好”，声波在空气中传播，被一个小麦克风捕捉到。这时候的声音还是 模拟信号 ——连续变化的电压。但它没法直接写进TF卡，因为TF卡只认0和1。

所以第一步，得有个“翻译官”：把模拟信号变成数字数据。这个角色，就是 AC101L 音频Codec芯片 。

实战派S3板载了AC101L，支持立体声输入输出，通过I2C配置参数，再通过I2S总线传数据。它的核心任务是ADC（模数转换）和DAC（数模转换）。当我们录音时，它负责将MIC输入的模拟信号以指定采样率（比如16kHz）、位深（16bit）转成PCM数据流。

那这些数据怎么传给主控CPU呢？靠的就是 I2S（Inter-IC Sound）接口 。

I2S是一种专为音频设计的串行通信协议，有三根主要信号线：

BCLK（Bit Clock） ：每一位数据传输的节拍
LRCLK / WS（Word Select） ：指示当前是左声道还是右声道
SDIN / SDOUT（Serial Data In/Out） ：实际的数据通道

全志D1芯片内置了I2S控制器，我们可以把它设为Slave RX模式，由Codec提供时钟信号，自己专心收数据就行。

但问题来了：如果每来一个样本都让CPU去读一次，那CPU很快就会累死——毕竟每秒要处理16000个样本 × 2字节 = 32KB的数据量，还不算中断开销。

怎么办？答案是 DMA（Direct Memory Access） 。

DMA就像是一个自动搬运工。我们提前划出一块内存当缓冲区，告诉DMA：“你盯着I2S口，只要有新数据进来，就往这个buffer里塞。” CPU只需要隔一段时间过来检查一下搬了多少，然后打包写入文件即可。这样一来，CPU负载大幅降低，录音也更稳定。

整个流程走通之后，大概是这样子的：

声音 → MIC → 模拟信号 → AC101L（ADC）→ I2S → D1芯片 → DMA写入内存buffer → PCM数据块 → 编码成WAV → 写入TF卡

是不是有点像流水线工厂？每个环节各司其职，最后产出一个标准音频文件。

录音文件为啥打不开？因为你没写对WAV头！

很多人做嵌入式录音的第一个坑，就是录出来的文件双击打不开，或者提示“格式不支持”。别急，大概率不是数据错了，而是 文件头没写对 。

WAV是一种RIFF格式的容器，结构非常清晰。它不是光把PCM数据扔进去就行，必须先写一段描述信息，告诉播放器：“嘿，我是个WAV文件，采样率16k，单声道，16bit，请按这个规则解析。”

下面这个结构体，就是WAV文件的灵魂：

typedef struct {
    char riff[4];           
    uint32_t overall_size;  
    char wave[4];           
    char fmt_chunk_marker[4]; 
    uint32_t length_of_fmt; 
    uint16_t format_type;   
    uint16_t channels;      
    uint32_t sample_rate;   
    uint32_t byte_rate;     
    uint16_t block_align;   
    uint16_t bits_per_sample;
    char data_chunk_header[4]; 
    uint32_t data_size;     
} wav_header_t;

看起来挺复杂？其实关键字段就几个：

字段	值	说明
`format_type`	1	表示PCM未压缩
`channels`	1 或 2	单声道/立体声
`sample_rate`	16000	采样频率，单位Hz
`bits_per_sample`	16	量化精度
`byte_rate`	`sample_rate * channels * (bits/8)`	每秒字节数
`block_align`	`channels * (bits/8)`	每帧字节数

举个例子，如果你录的是16kHz、16bit、单声道，那么：
- byte_rate = 16000 × 1 × 2 = 32000
- block_align = 1 × 2 = 2

注意！这些数值都是 小端格式（Little Endian） ，ARM架构天然支持，不用额外转换。但如果将来要在x86上生成这类文件，记得做字节序处理。

构造完头部后，写文件的操作就很直观了：

int save_to_sdcard(int16_t *pcm_data, int len) {
    int fd = open("/mnt/sdcard/voice_001.wav", O_CREAT | O_WRONLY, 0666);
    if (fd < 0) return -1;

    wav_header_t header;
    create_wav_header(&header, 16000, 16, 1, len * 2);

    write(fd, &header, sizeof(header));
    write(fd, pcm_data, len * 2);  // 每个样本2字节

    close(fd);
    return 0;
}

这里有个细节： len 是PCM样本的数量，不是字节数。所以最终数据大小是 len * 2 。别忘了更新 data_size 和 overall_size ，否则有些播放器会拒绝加载。

我还见过有人忘了写 "data" 标志字段，结果文件虽然能播，但进度条显示异常。这种低级错误，在调试阶段很容易忽略，上线才发现，那就尴尬了 😅。

建议做法：录完一条，拔卡插电脑，用Audacity打开看看波形。能看到干净的声波图，才算真正成功。

TF卡为什么总掉？你以为是驱动问题，其实是卡太烂！

说到存储，大家第一反应都是“TF卡呗，便宜大碗”。可现实是， 市面上70%的所谓‘高速卡’根本达不到标称速度 ，尤其是那些十几块钱一包的“品牌贴牌卡”。

我在测试初期就遇到一个问题：明明刚开始录得好好的，几分钟后突然卡住，日志报错“write failed: No space left on device”。可我这张卡明明还有8GB空闲啊？

查了半天才发现，根本不是空间问题，而是 卡进入了只读模式 。原因很简单：劣质TF卡的控制器扛不住持续写入压力，触发了保护机制。

SD协议规定，当卡检测到异常（如供电不稳、擦除失败），会自动切换到只读状态，防止数据进一步损坏。这时候你再怎么 open() 都写不了东西。

怎么破？三条路：

换卡：买正规品牌，Class10以上，UHS-I速度等级。推荐三星EVO、闪迪High Endurance这类工业级卡。
降速使用 ：不要追求极限写入，适当增加缓存批次间隔。
加检测逻辑 ：程序启动前先尝试创建测试文件，失败则报警提示换卡。

另外，Linux系统下TF卡通常挂载在 /mnt/sdcard 或 /media/sdcard 。你可以通过以下命令确认是否正常识别：

lsblk        # 查看块设备
mount        # 看是否已挂载
df -h        # 查剩余空间

如果发现卡没自动挂载，可能是分区表损坏或文件系统不兼容。FAT32是最稳妥的选择，最大支持32GB（SDHC标准）。超过32GB的卡要用exFAT，但实战派S3默认内核没集成exFAT驱动，得自己编译模块，徒增复杂度。

还有一个隐藏雷区： 热插拔 。

理论上SDIO支持热插拔，但实际上频繁插拔容易导致SPI降速、甚至I/O冲突。最好的做法是在外壳上留个卡槽盖，尽量避免运行中插拔。如果必须支持热插拔，一定要用GPIO监测CD（Card Detect）引脚状态，并注册uevent监听器动态响应。

按键控制怎么做才靠谱？别再裸机轮询了！

最简单的交互方式是什么？当然是按键。

我在板子上接了一个轻触开关，一端接地，另一端接到某个GPIO，启用内部上拉电阻。默认高电平，按下变低，形成一个下降沿。

初学者常写的代码是这样的：

while (gpio_read(BUTTON_PIN) == 1);
// 开始录音

看似没问题，实则隐患重重：

没有消抖，轻轻碰一下可能触发多次
轮询占用CPU，不能干别的事
无法区分短按、长按、双击等复合操作

真正的做法应该是： 用中断 + 定时器消抖 。

不过考虑到实战派S3跑的是Linux，我们可以偷个懒，用sysfs接口实现准事件驱动：

static int export_gpio(int pin) {
    FILE *fp = fopen("/sys/class/gpio/export", "w");
    if (fp) {
        fprintf(fp, "%d", pin);
        fclose(fp);
        return 0;
    }
    return -1;
}

static int set_direction(int pin, const char *dir) {
    char path[64];
    sprintf(path, "/sys/class/gpio/gpio%d/direction", pin);
    FILE *fp = fopen(path, "w");
    if (fp) {
        fprintf(fp, "%s", dir);
        fclose(fp);
        return 0;
    }
    return -1;
}

导出GPIO后，设置为 in 方向，就可以通过 /sys/class/gpio/gpioXXX/value 实时读取状态了。

为了提升响应体验，我封装了一个阻塞式等待函数：

int wait_for_button_press(int pin, int timeout_ms) {
    int state, last_state = 1;
    int count = 0;
    const int DEBOUNCE_TIME = 10000;  // 10ms

    printf("🎙️ 按下录音键开始录制...\n");

    while (timeout_ms <= 0 || count < timeout_ms * 100) {
        state = gpio_read(pin);
        if (state == 0 && last_state == 1) {
            // 下降沿 -> 可能按下
            usleep(DEBOUNCE_TIME);
            if (gpio_read(pin) == 0) {
                printf("✅ 检测到按键按下！\n");
                return 0;  // 成功触发
            }
        }
        last_state = state;
        usleep(10000);  // 10ms轮询一次
        count++;
    }

    return -1;  // 超时
}

加上10ms延时消抖，基本杜绝误触发。而且主循环可以配合超时机制，比如30秒无操作自动休眠，省电又贴心。

更进一步的话，还可以加入LED反馈：

待机：蓝灯慢闪
录音中：红灯常亮
保存完成：绿灯快闪两下
错误状态：红灯呼吸闪烁

这才是用户愿意用的产品级体验 💡。

实战中的那些“玄学”问题，我都替你试过了

你以为照着代码抄一遍就能成功？Too young.

下面这些坑，每一个我都亲自踩过，血泪总结：

🔊 录音有“滋滋”电流声？

优先排查电源！

音频部分对电源噪声极其敏感。如果你共用了电机、WiFi模块的电源，那基本必中招。解决方案有两个：

使用独立LDO给AC101L供电（如AMS1117-3.3V）
在电源入口加π型滤波：10μF电解电容 + 100nF陶瓷电容 + 磁珠 → 地

PCB布局也很关键：MIC走线越短越好，最好用地线包围（guard ring），避免与数字信号平行走线。

📁 文件名重复覆盖？

默认用 voice_001.wav 很方便，但下次再录还是会覆盖。

建议改成时间戳命名：

char filename[64];
time_t now = time(NULL);
struct tm *tm_now = localtime(&now);
sprintf(filename, "/mnt/sdcard/rec_%04d%02d%02d_%02d%02d%02d.wav",
        tm_now->tm_year + 1900,
        tm_now->tm_mon + 1,
        tm_now->tm_mday,
        tm_now->tm_hour,
        tm_now->tm_min,
        tm_now->tm_sec);

这样一来看日期一目了然，也不会冲突。当然前提是你得确保系统时间准确，可以通过RTC模块或首次手动校准。

💾 录着录着断了？

最常见的原因是缓冲区溢出。

DMA虽然减轻了CPU负担，但如果应用层处理不及时，buffer满了就会丢数据。解决办法是启用 双缓冲机制 （Double Buffering）：

分配两个buffer：A 和 B
DMA轮流填充，填满一个就通知CPU处理另一个
处理完交换指针，无缝衔接

在Linux下可以用 mmap 映射DMA区域，结合 poll() 监听事件，效率更高。

🔄 想加个“播放”功能怎么搞？

既然能录，自然也能放。

原理反过来就行：从TF卡读WAV文件 → 解析头部 → 提取PCM数据 → 通过I2S发送给AC101L → DAC转模拟 → 推动扬声器。

难点在于同步控制。你可以用另一个按键长按触发播放，期间禁用录音功能。

播放代码大致如下：

int play_wav(const char *path) {
    FILE *fp = fopen(path, "rb");
    if (!fp) return -1;

    wav_header_t header;
    fread(&header, 1, sizeof(header), fp);

    // 验证格式
    if (strncmp(header.riff, "RIFF", 4) ||
        strncmp(header.wave, "WAVE", 4)) {
        fclose(fp);
        return -1;
    }

    // 配置I2S播放模式
    i2s_set_sample_rate(header.sample_rate);
    i2s_set_word_size(header.bits_per_sample);

    uint8_t *buffer = malloc(1024);
    size_t n;
    while ((n = fread(buffer, 1, 1024, fp)) > 0) {
        i2s_write(buffer, n);  // 阻塞式发送
    }

    free(buffer);
    fclose(fp);
    printf("🎧 播放完成：%s\n", path);
    return 0;
}

当然，真实场景要加进度提示、暂停功能、音量调节……但这已经足够跑通MVP了。