自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 AI 时代的软件工程师:从“知识存量”到“思维与执行力”的价值跃迁

AI时代重塑软件工程师的核心价值:从知识储备转向高阶思维能力。随着AI能快速生成代码、解答技术问题,单纯记忆知识已不再构成竞争力。工程师的核心价值在于:1)抽象与问题建模能力,将模糊需求转化为可执行方案;2)系统性思维,权衡架构设计与长期演进;3)实战落地能力,解决AI无法处理的"最后一公里"问题;4)框架意识,有效指导AI工作。未来优秀的工程师将成为会思考、决策并驾驭AI的工程专家,其价值体现在逻辑深度而非知识存量。AI放大的是人的判断力,而非替代人的工程智慧。

2025-12-27 11:03:56 242

原创 嵌入式 Linux 与其他嵌入式操作系统对比

本文系统比较了嵌入式Linux与其他嵌入式操作系统的差异。裸机系统资源占用最小但功能有限;RTOS在实时性和多任务调度方面表现优异,适合工业控制等场景;嵌入式Linux功能最强大,支持完整网络和文件系统,但对硬件要求较高。选择依据主要取决于项目需求:极低延迟用裸机,实时多任务选RTOS,复杂功能则采用嵌入式Linux。三种系统在架构、资源占用、开发模式和适用场景上各有特点,开发者需权衡实时性、功能性和资源成本进行选择。

2025-12-18 22:20:49 280

原创 嵌入式设备芯片特性与软件栈全览

本文系统梳理了嵌入式设备芯片的架构特性与软件栈支持。从8位MCU到64位高性能CPU,分析了8051、AVR、Cortex-M、DSP及Cortex-A等典型芯片的架构特点、应用场景和软件生态。8/16位MCU通常采用哈佛架构,需要扩展C语言关键字;32位MCU支持标准C/C++和RTOS;DSP侧重信号处理优化;高性能CPU可运行完整操作系统。文章通过对比表总结各类芯片在架构、OS能力、语言支持和工具链等方面的差异,指出芯片选择需匹配应用场景和软件需求。

2025-12-18 21:55:26 683

原创 PTX VM 未仿真的硬件特性分析

PTX VM 硬件特性仿真分析摘要 本文档系统分析了PTX VM对NVIDIA GPU硬件特性的仿真实现情况: 已实现特性 基本SIMT架构(Warp组织、线程掩码) 寄存器系统(整数/浮点/谓词寄存器) 内存层次(全局/共享/局部内存) 基础指令集(算术/逻辑/内存/控制流指令) 简化版分支分歧处理 未实现特性 高级计算单元:Tensor Core、RT Core 完整缓存体系(L1/L2/纹理/常量缓存) 真实Warp调度策略 寄存器重命名和物理映射 仿真限制 线程串行执行(非并行) 内存访问无延迟模拟

2025-12-17 15:08:28 382

原创 ONNXRuntime 自定义算子开发实战:基于 Virtual NPU 的 FastGelu 实现

ONNXRuntime 自定义算子开发实战 本文详细介绍了在ONNXRuntime中开发FastGelu自定义算子的完整流程: 架构设计: 使用自定义域名"com.my_virtual_npu"避免冲突 通过Schema定义算子接口规范 在ONNXRuntime初始化时完成注册 内核实现: 基于FastGelu数学公式(0.5x(1+tanh(√(2/π)(x+0.044715x³)))) 提供模板化内核实现支持多种数据类型 使用显式实例化确保类型安全 关键特性: 静态注册标志保证幂等性

2025-11-19 11:26:18 1016

原创 NPU 软件栈介绍

本文介绍了NPU(神经网络处理单元)软件栈的构成与运行机制。主要内容包括:NPU的定义及其针对神经网络计算的优化特性;图编译器将AI模型转换为NPU可执行二进制文件的流程;图运行时库负责模型加载、调度执行的核心功能;算子库封装底层计算指令;Linux驱动作为硬件接口的功能;以及完整的执行流程和工作原理。通过软件栈的分层架构,开发者只需调用顶层API即可实现高效的神经网络加速计算。该框架为理解端侧AI芯片的整体技术体系提供了系统性的认知基础。

2025-11-17 10:33:33 592

原创 Auto-Pointer: C++ 自动内存管理的 GCC 扩展开源实验项目

Auto-Pointer: C++自动内存管理的GCC扩展 摘要:Auto-Pointer是为GCC开发的新型扩展,通过编译器和运行时库的深度集成,为C++提供自动内存管理功能。其核心特性包括:1)自动内存分配与释放,无需手动调用new/delete;2)指针别名追踪,内存重分配时自动同步所有别名;3)引用计数管理,自动跟踪对象引用;4)循环引用检测,提供编译时__weak_ref标记和运行时DFS检测两种解决方案。该扩展通过g++ -fauto-pointer选项启用,支持别名同步、引用计数等默认功能,并

2025-11-14 22:21:36 551

原创 AI Trip Planner 设计与实现

本文介绍了一个AI智能行程规划项目的完整设计与实现方案。项目采用前后端分离架构,前端基于纯HTML+ES模块,后端使用Python FastAPI框架。系统支持AI生成多日行程规划,集成高德地图和Leaflet地图服务,提供景点、餐饮、酒店等POI联动功能,并具备聊天协作和分享能力。项目注重用户体验和可用性,设计了完善的功能回退机制,确保在国内网络环境下稳定运行。后端采用SQLite KV存储方案,支持后续扩展至MySQL/Redis。项目遵循安全合规要求,提供隐私条款等必要页面。文章详细阐述了系统架构、关

2025-10-21 23:21:23 791

原创 CUDA C生成PTX

本文介绍了如何从CUDA C代码生成PTX文件的方法。PTX是NVIDIA GPU的虚拟汇编语言,作为CUDA编译流程中的中间表示。文章详细说明了使用nvcc编译器的-ptx选项生成PTX文件的基本命令,包括如何指定目标架构(如sm_50)。同时提供了示例CUDA代码和生成的PTX文件内容,展示了高级选项如保留中间文件和使用dryrun模式。最后介绍了PTX文件在虚拟机中的使用方法,并给出生成PTX文件的最佳实践建议,包括架构选择、版本控制和优化验证。

2025-09-07 23:43:15 748

原创 CUDA PTX虚拟机Smoke测试介绍

摘要:PTX虚拟机测试用例TestBasicProgramExecution验证了虚拟机基本功能的正确性。该测试加载并执行了一个包含基础数学运算的PTX程序(simple_math_example.ptx),通过检查寄存器分配配置、指令执行计数和性能计数器(如寄存器读写次数)来验证虚拟机各模块的协作。测试过程包括虚拟机初始化、PTX文件解析、指令解码和执行等关键步骤,涉及寄存器组、内存子系统、执行器等核心组件。测试结果表明虚拟机能够正确加载、解码和执行PTX程序。

2025-09-07 23:39:33 727

原创 Introducing the NVIDIA PTX Virtual Machine: A Deep Dive into GPU Execution Simulation

摘要: NVIDIA推出开源PTX虚拟机器项目,完整实现了执行NVIDIA PTX(并行线程执行)中间代码的虚拟环境。PTX作为CUDA与GPU硬件指令间的中间表示,支持SIMT执行模型、分层内存架构等关键特性。该虚拟机采用C++20开发,具备SIMT执行、分层内存系统、先进调试工具等核心功能,支持断点调试、性能分析和内存访问模式可视化。其模块化架构包含解析器、执行引擎、内存子系统等组件,为教育、调试和研究提供灵活平台,填补了GPU代码执行分析的空白,助力开发者深入理解GPU工作原理。(150字)

2025-08-27 00:10:47 1713 1

原创 ChatGPT-易编程 V3.0.0:工程级工作支持、智能代码生成、智能代码导读以及更多功能介绍

增加工程级工作支持:获取工程概览,获取模块概览。增强带领使用者阅读和分析代码:剖析函数调用栈,分析类或结构体的实现和使用。增加代码生成功能:根据注释实现代码,根据代码片段继续实现代码,支持使用快捷键使工作更流畅。优化显示和使用体验。ChatGPT-易编程 账号 在通用,一次注册,多终端多场景使用。快来跟着作者一起了解它的具体功能吧。🛠️ 命令(图示见本节末尾)使用ChatGPT易编程: 工程概览—— 当工作在打开的工程文件中时,使用该命令可获取工程概览信息。

2023-06-02 18:21:46 665

原创 ChatGPT易编程:你的AI编程助手使用指南

提供设计方案灵感规划程序框架设计方案生成程序完整代码(温馨提示:GPT3.5-turbo 单次问答不超过 4096 tokens,请多次提问以获取各模块和子模块的细化代码)针对已有代码进行询问,如让 ChatGPT 用清晰的逻辑解释复杂代码重构低质量代码,分析潜在漏洞,并给出修复建议为代码编写单元测试用例针对代码生成文档。

2023-05-15 22:17:09 2566 1

原创 软件开发者的新助手:ChatGPT易编程 VSCode 插件

ChatGPT易编程是一款强大的编程工具,无论您是专业的开发人员,还是编程初学者,它都能为您提供强大的支持。我强烈推荐您尝试使用它,相信您会发现它的强大功能和便捷性。如果您在使用过程中遇到任何问题,欢迎通过电子邮件与我交流。期待与您共同行,共同探索 ChatGPT易编程 的深度和广度。随着 AI 技术的发展,我们可以预见,像 ChatGPT易编程 这样的工具将成为未来软件开发的重要组成部分。它们不仅可以帮助我们更有效地编写代码,还可以帮助我们更好地理解和改进我们的代码。

2023-05-12 22:58:23 1721 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除