- 博客(195)
- 收藏
- 关注
原创 《外祖母•封家香传》
父封盖梅,原系乡中教书先生,颇有学识,然不幸,于民国二十九年(公元一千九百四十年),英年早逝,留我单亲,吾未能见其颜。与母亲相依为命,母亲周氏,因丧夫之痛,经济拮据,生活无源,待到吾约一岁之时,母携我改嫁至衡南县茅市镇陡山桥,继父全德梅,原家庭有两女,长姐与幼妹。至吾十九岁,阿姨为吾谋得佳婿,姓何名谋利,自公元一千九百六十一年嫁到衡阳市蒸湘区灵山村(今临江村), 初期三年,吾未身孕,未得子,常受婆婆责难,至公元一千九百六三年,喜迎长子何英华。年,第三个孩子出生,这次是个女儿,名叫何微桂。
2025-12-21 02:01:05
356
原创 科研论文写作mathtype公式编辑技巧汇总
文本编辑快捷键指南: 上标格式:Ctrl+H 下标格式:Ctrl+L (注:本摘要仅包含核心快捷键信息,全文共2个操作指令,适用于文档格式快速调整场景。)
2025-12-18 22:36:21
243
原创 Python中类的self与super超级类用法
本文解答了Python类中self和super()的作用问题。self代表类的实例对象,用于访问实例属性和方法。super(BasicBlock,self).__init__()调用父类nn.Module的初始化方法,确保子类继承父类功能。文中通过简单示例说明了self如何操作实例属性,以及super()如何实现父类初始化逻辑的继承。这些概念对理解Python面向对象编程至关重要。
2025-12-14 22:42:33
316
原创 基于Class-Balanced Distillation for Long-Tailed论文复现
摘要:本文讨论了PyCharm编译环境常见错误问题,建议改用WSL Linux环境进行开发。提供了生成的日志(Log3)结果分析,并详细说明了参数运行的具体操作方法。内容涵盖开发环境选择、日志分析和参数配置三个关键技术环节。
2025-12-08 01:05:47
201
原创 结构化知识蒸馏(特征分布+关系知识)
本文提出了一种结构化知识蒸馏方法用于长尾图像分类,通过迁移教师模型内部的结构化知识(如特征空间关系和类间相似性)来提升学生模型对尾类样本的识别能力。核心创新点包括:1)同时优化特征分布对齐和类间关系对齐;2)引入三元组损失保持样本间的相对距离关系;3)采用类平衡采样策略增强尾类特征学习。实验表明,该方法能有效缓解长尾数据中尾类表征不足的问题,使模型学习到更具判别力的特征空间结构。文中提供了完整的PyTorch实现,包括特征投影、原型更新等关键模块,为长尾分类任务提供了实用的解决方案。
2025-12-05 23:39:44
899
原创 CLIP(对比语言-图像预训练)在长尾图像分类应用
本文提出了一种基于CLIP的长尾图像分类方法,通过提示工程微调优化尾类性能。方法核心包括:(1)冻结图像编码器,仅微调可学习的提示模板参数;(2)采用平衡采样策略和类别加权损失函数缓解长尾问题;(3)设计集成多提示模板机制增强尾类鲁棒性。实验表明,该方法能有效提升尾类识别准确率,同时保持头部类别性能。代码实现展示了CLIP损失计算、提示模板优化和评估流程,为长尾分类任务提供了实用解决方案。
2025-12-05 23:11:42
852
原创 面向图像分类的自监督/对比学习辅助的知识蒸馏-类别对比蒸馏(Category Contrastive Distillation, CCD)
本文提出了一种基于类别对比蒸馏(CCD)的知识蒸馏方法,通过维护教师和学生模型的类别原型记忆库来提升特征表示学习。该方法采用动量更新策略动态维护类别原型,计算学生特征与教师原型的相似度分布,并使用KL散度使其逼近教师特征与原型的分布。同时引入原型对齐损失进一步稳定训练。该方法可与传统知识蒸馏结合使用,通过教师模型的EMA参数更新和多项损失加权组合,实现更有效的知识迁移。实验表明,这种基于类别对比的蒸馏方法能有效提升学生模型的性能。
2025-12-05 22:53:39
976
原创 逻辑分析仪出现不显示i2s数据问题原因以及解决方法
摘要:逻辑分析仪在接收I2S数据时出现异常,显示20bit数据而非预期的32bit格式,但PCM数据正常。问题可能出在逻辑分析仪的设置上。解决方法包括:1)检查并修改采样速率;2)重新建立解码器配置。该问题与软件版本无关,需通过调整硬件参数解决。
2025-12-05 16:56:14
147
原创 BES2800接入VPU数据获取方法
本文介绍了BES2800接入VPU的数据获取方法。针对5mic原设计,分析了PDM接口的引脚映射(图1-1)、时钟数据线连接(图1-2)及电源配置(图1-3)。重点讨论了VPU的PDM接口选择问题:由于PDM01和PDM2已被占用,建议优先选择PDM3,若不可用则考虑模拟VPU方案。最后提出了模拟MIC数据获取方法的探讨需求。全文围绕硬件接口配置展开,为系统设计提供参考。
2025-12-05 13:35:47
521
原创 BES2800的VAD功能实现方法
BES2800的VAD(语音活动检测)模块能有效识别音频中的语音段和非语音段,具有三大核心功能:1)提升处理效率,通过过滤静音/噪音减少计算量和存储空间;2)增强通信质量,抑制背景噪音并实现语音激活功能;3)优化交互体验,提高唤醒灵敏度并实现自然对话响应。该技术广泛应用于语音识别、通信设备和智能交互系统中,显著提升系统性能和用户体验。
2025-12-04 20:12:44
153
原创 AIGlass的智能眼镜项目
AIGlass智能眼镜是一款多功能嵌入式设备,主要提供视频录制、拍照和AI识别功能。系统支持H.264/H.265视频编码、AAC音频录制,具备HDR合成、AI降噪、镜头校正等图像处理能力。采用多线程架构实现视频流处理、音频采集和传感器数据同步,支持MP4文件封装和JPEG图像存储。硬件层面集成了图像传感器、ISP处理器和NPU加速单元,可配置分辨率、帧率等参数。系统提供三种工作模式:视频录制模式、高质量HDR拍照模式和快速识别拍照模式,适用于不同场景需求。整体设计注重实时性处理和硬件资源优化,展现了完整的
2025-11-21 15:15:38
922
原创 AI智能眼镜应用的主程序
本文介绍了AI智能眼镜的主程序架构,详细阐述了四个核心功能模块的流程设计。视频模式包含参数解析、流媒体处理和资源管理;拍照模式实现参数配置、快门控制和图像保存;识别模式完成目标检测与结果处理;低功耗线程采用任务队列机制实现能效优化。系统支持多工作模式切换,具备硬件控制、文件存储和智能资源管理功能,通过回调机制实现视频流处理、图像采集和识别任务。该架构实现了AI眼镜在多媒体处理、计算机视觉和低功耗运行方面的综合需求。
2025-11-21 14:55:11
542
原创 长尾识别BBN方法
本文介绍了BBN(Bilateral-Branch Network)模型,该模型针对视觉识别中的长尾分布问题,通过双边分支结构和累积学习策略实现平衡。模型包含常规学习分支(专注通用表征)和再平衡分支(侧重尾部类别),并通过自适应参数α进行动态调整:初期侧重通用表征,后期逐渐关注尾部数据。这种设计在提升尾类识别效果的同时保持了整体表征能力,有效解决了传统再平衡方法可能损害特征质量的问题。
2025-11-06 23:01:56
478
原创 ARS45开发板原始启动log
摘要:ARS45开发板启动日志显示两种模式:1.正常启动 2.进入下载模式。该记录简明扼要地描述了开发板的基本启动状态,为系统调试和维护提供关键信息。(30字)
2025-11-05 16:38:57
429
原创 SSD面向长尾图像分类的自监督自蒸馏方法原理与代码实现
SSD方法通过三阶段训练解决长尾数据问题:1)自监督引导的特征学习,结合分类和自监督任务;2)中间软标签生成,冻结骨干网络并采用类别均衡采样训练分类器;3)联合训练与自蒸馏,学生模型同时利用硬标签和教师模型生成的软标签。该方法通过自监督学习和知识蒸馏,有效改善尾部类别的识别性能。
2025-10-31 00:43:45
608
原创 i2s的LRCK时钟有毛刺以及BCLK数据在高采样率有变形数据解析错误问题原因以及解决方法
【摘要】I2S接口在32bit/96K采样率下工作正常,但在192K高采样率时出现LRCLK毛刺和BCLK时钟变形问题,导致数据解析错误。可能原因包括时钟信号完整性不足、时序裕量不足或硬件设计缺陷。解决方法建议:1)优化时钟走线设计;2)增加信号端接匹配;3)降低传输距离或使用更高质量时钟源;4)检查主从设备时序规格是否匹配。需重点关注高采样率下的信号质量要求。
2025-10-29 15:39:59
235
原创 i2s封装成自己定义8路音频数据发送方法
该文讨论了I2S音频数据封装问题,涉及8路音频数据发送方法(L/R声道和多个麦克风通道)在382K采样率下的数据格式。主要问题包括:1)出现死机现象;2)16K采样率下LRCLK时钟出现毛刺;3)384K采样率数据无法解析,BCLK变形;4)44.1K采样率情况;5)32K采样率数据解析正常。文章着重分析了不同采样率下的数据传输异常情况,特别是时钟信号质量问题对数据解析的影响。
2025-10-29 15:38:52
426
原创 BES2800 的nuttx audio运行流程分析
BES2800芯片的Nuttx音频系统运行流程分析:首先完成板级后期初始化,随后应用层传递参数(但结构体实现不可见)。系统依次执行Nuttx音频驱动打开、音频流处理与播放流程,最后向AW88166音频芯片传入配置参数完成音频系统初始化。该流程展现了从系统初始化到音频播放的完整链路,其中参数传递与硬件配置是关键环节。
2025-10-28 19:32:35
169
原创 在BES中自己添加#ifdef CONFIG_AUDIO_ZK编译没有起到作用问题原因以及解决方法
BES中添加#ifdef CONFIG_AUDIO_ZK编译未生效的问题通常源于配置方式不当。解决方法:1)确认配置在正确位置;2)检查Makefile是否通过.o方式包含相关模块;3)宏定义需export使其全局生效;4)实际起作用的是Makefile中CFLAGS的定义;5)可使用grep命令查询宏定义是否生效。注意:宏定义仅影响特定模块,正确配置后需重新编译验证。
2025-10-28 15:28:09
336
原创 BES提示音播放音频流程分析研究
本文分析了BES提示音播放的完整流程,主要包括:1)通过接口触发媒体播放;2)请求提示音音频数据;3)调用播放接口解码SBC为PCM格式;4)启动音频框架进行混音播放。研究提出了两个实验方向:1)调整采样率等参数测试音效变化;2)将SBC数据以数组形式存储并加载,测试中断播放与混音播放效果。该流程揭示了从调用接口到最终播放的实现路径,为音频处理优化提供了实验思路。
2025-10-27 19:35:17
312
原创 ES7243E ADC模拟音频转i2S到 BES I2S1 Master输出播放到SPK精准分析
本文分析了ES7243E ADC模拟音频转I2S到BES I2S1 Master输出的实现过程。主要内容包括:1)初始化流程和音频管理开启;2)音频线程处理与AUX中断处理机制;3)LINEIN音频流处理的关键函数app_play_linein_onoff实现,详细说明了音频缓冲区的获取、配置和播放流程;4)重点描述了ADC捕获I2S数据并传输到I2S1 FIFO的过程,以及将音频持续输出到SPK的PCM数据获取机制。代码中涉及音频采样率(44.1kHz/24bit)、缓冲区管理、EQ处理等关键配置,支持从
2025-10-27 17:59:44
785
原创 DiVE长尾识别的虚拟实例蒸馏方法
DiVE方法通过知识蒸馏改进长尾识别,核心是将教师模型的预测作为虚拟样本,并调整其分布以提升尾类性能。关键点包括:1)利用软标签构建虚拟样本传递类别间关系;2)通过分布平坦化提高尾类权重;3)结合交叉熵损失和蒸馏损失优化模型。相比传统方法,DiVE通过知识迁移缓解了长尾数据中头类主导的问题。代码实现展示了如何计算类别权重、调整分布并进行联合训练。该方法无需生成新数据,而是从模型预测中挖掘隐含知识来改善尾类识别。
2025-10-25 23:36:56
748
原创 ES7243E 模拟音频转I2S输入给BES I2S_Master数据运行流程分析
本文分析了ES7243E模拟音频转换为I2S信号输入给BES主控的数据处理流程。主要内容包括:1) 通过LINE-IN接口接入模拟音频信号;2) 系统首先关闭蓝牙SBC音频流,启动AUX音频流处理;3) 详细阐述了音频捕获和播放的初始化过程,包括内存池分配、缓冲区设置和采样参数配置;4) 重点说明了I2S1主设备模式的配置,以及音频输入路径设置为LINEIN;5) 展示了音频流的打开、启动和关闭操作流程。整个处理过程实现了模拟音频到数字I2S信号的转换和传输。
2025-10-24 21:26:09
732
1
原创 tlv32aic32 外部DAC的I2S音频流运行过程分析
本文分析了TLV32AIC32外部DAC通过I2S接口的音频流处理过程。代码实现了音频流配置、DMA设置和I2S接口控制,包含流打开(tlv32aic32_open)、设置(hal_i2s_setup_stream)和启动(hal_i2s_start_stream)等关键操作。通过加锁机制保证线程安全,并配置DMA中断处理音频数据传输。整个流程采用统一I2S底层接口,增加了音频引擎框架的DMA缓冲更新和状态管理功能,确保外部编解码器的稳定运行。
2025-10-24 20:34:28
718
原创 BES2800的ESHELL命令添加方法
BES2800芯片通过ESHELL命令添加I2S配置的方法:在ESHELL环境中直接输入"eshelli2s"命令即可完成配置。该命令提供了一种快速设置I2S接口的方式,操作简单,无需复杂参数设置。使用时需确保芯片已进入ESHELL命令模式,执行后系统将自动完成I2S相关参数加载。
2025-10-24 19:36:35
143
原创 基于WSL BES2710编译环境搭建方法
文章摘要:该指令涉及SDK编译过程,包含两个关键操作:1)使用build_besfd_glass_1502p.sh脚本进行特定配置的编译;2)通过rm -rf out命令清除输出目录。这两个步骤展示了嵌入式开发中典型的编译前清理工作流程,确保每次编译都从干净的环境开始。指令路径表明这是针对1502P型号眼镜设备的定制化编译方案。
2025-09-19 17:29:33
165
原创 恒玄BES2800智能眼镜项目实战
恒玄BES2800智能眼镜项目探索了多功能集成方案,涵盖音频眼镜、拍照眼镜及光波导眼镜三大类型。该项目创新性地融合了嵌入式蓝牙音频、拍照录像、WiFi视频传输以及大模型语音交互等核心技术,实现了视听交互的全场景覆盖。通过BES2800芯片的高效处理能力,项目突破了传统智能眼镜的功能局限,为可穿戴设备的多模态交互提供了实践范例,展现了智能眼镜在消费电子领域的广阔应用前景。
2025-09-13 11:28:16
207
原创 顶会顶刊图像分类的云服务器训练方法
摘要:使用ImageNet、iNaturalist2018、Places-LT数据集和ResNet-152网络进行长尾图像训练时,建议云服务器配置:16核3.0GHz+CPU、128GB内存、1TB SSD存储、4张32GB显存NVIDIA V100/A100 GPU,并配备1Gbps网络。需支持CUDA/cuDNN及主流深度学习框架。
2025-08-29 15:41:36
469
原创 基于瑞芯微 RK3308音频算法开发方法
瑞芯微RK3308芯片凭借其高性能处理器核心、内置音频编解码模块和DSP,能够支持多种音频算法处理。开发者可通过搭建交叉编译环境(如arm-linux-gnueabihf工具链),基于RK3308的SDK进行音频算法开发。实现流程包括:选择音频算法(如降噪、回声消除)、开发优化算法代码、通过ALSA框架采集处理音频数据,最后将程序部署到开发板测试优化。该芯片的硬件能力和完善软件生态为音频处理提供了可靠支持。
2025-08-27 16:19:27
832
原创 基于NXP iMXRT600音频算法开发方法
iMXRT600音频算法开发指南摘要: 环境搭建:准备iMXRT600开发板及音频I/O接口,安装MCUXpresso IDE和SDK工具包。 音频基础:掌握采样率、位数及PCM编码格式,合理配置参数。 数据采集与输出:通过I2S接口实现音频输入(麦克风)和输出(扬声器)功能。 算法开发:从基础音量调节到复杂算法(如降噪),可借助Speex等开源库优化移植。 调试优化:利用IDE调试工具验证功能,优化算法效率以降低CPU负载。 测试验证:通过Audacity等工具测试兼容性与稳定性,覆盖不同采样参数和设备。
2025-08-27 16:09:07
648
原创 蓝牙耳机连接不成功或者突发断连问题分析思路方法
本文系统介绍了蓝牙耳机断连问题的专业分析方法。首先提出系统性分析思路:问题复现、模块隔离和底层分析,强调区分Host端和Controller端问题。其次详细介绍了日志分析、空中包抓取、射频性能测试、电源分析等诊断工具与方法。然后列举了常见软件原因及解决措施,如连接参数优化、协议栈BUG修复、资源管理优化等。最后提出实战排查流程,强调系统视角、交叉验证和协议理解的重要性。全文为工程师提供了从问题定位到解决的完整技术框架,具有较强实践指导价值。
2025-08-22 10:50:47
1753
原创 CEVA-BX, Cadence HiFi, ARM ,TI, ADI 这5种音频DSP选型
本文对比了CEVA-BX、Cadence HiFi和ARM Cortex-M三类音频DSP的核心特性及应用场景。CEVA-BX是通用混合DSP/控制器,适合需要兼顾信号处理与控制的IoT、汽车等应用;Cadence HiFi专精音频处理,在降噪、编解码等场景性能突出;带DSP扩展的ARM Cortex-M系列则平衡控制与处理,适合轻量音频任务。选型需综合考量性能需求、开发资源、功耗成本等因素:专业音频选HiFi,复杂混合任务选CEVA-BX,简单音频处理优先ARM方案。
2025-08-20 00:24:39
1450
原创 音频算法工程师技能1
摘要:AI音频算法工程师岗位需系统化准备核心技术能力、项目经验和面试策略。核心技术包括RTC/VOIP全链路、3A算法、编解码器和DSP开发优化;项目经验需用STAR法则展示实际案例;面试应答需深入技术细节和解决方案。差异化竞争力体现在全链路视角和AI融合能力,紧急补缺可通过CEVA开发、声学测试等专项训练实现。重点关注算法选型案例,体现技术判断与商业思维结合。
2025-08-18 14:26:31
423
原创 物奇平台耳机开发常用修改配置和c文件
本文摘要:系统配置指南涵盖多个功能模块,包括回连时间设置、充电参数、提示音管理(需确保提示音数量匹配),以及IO接口配置(触控、LED、I2C)。特别提醒注意用户事件中self与both模式的区别,LED状态与事件的应用场景区分,以及音频调试中的3A处理、EQANC等声学参数设置。此外还涉及射频、码率等通信配置,并提供常用开发C文件参考。各模块需注意参数同步与场景适配。
2025-08-14 16:20:04
139
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅