- 博客(648)
- 资源 (22)
- 收藏
- 关注
原创 OpenGL进阶系列22 - OpenGL SuperBible - bumpmapping 例子学习
法线贴图是一种通过改变表面光照效果来模拟细节的技术,它不会增加模型的多边形数量。通过在贴图中存储表面法线信息,它能制造凹凸、划痕等视觉细节,使简单模型看起来更精细。这种"视觉欺骗"技术既能保持性能,又能提升画面真实感,广泛应用于游戏和图形渲染中,是效果与效率兼顾的优化方案。
2025-07-28 22:06:20
27
原创 linux 内核: 遍历当前所有进程
本文介绍了在Linux内核中安全遍历进程链表的方法。由于传统的tasklist_lock机制已被废弃,建议使用RCU(Read-Copy-Update)机制来实现并发安全的进程遍历。核心实现包括:1)使用rcu_read_lock()/rcu_read_unlock()保护进程链表;2)通过for_each_process宏遍历所有进程;3)使用get_task_struct()/put_task_struct()确保进程结构安全;4)打印进程信息(名称、TGID、PID、UID、EUID)。文章提供了完整
2025-07-15 23:31:38
211
原创 驱动开发系列61- Vulkan 驱动实现-SPIRV到HW指令的实现过程(2)
本文介绍了SPIR-V到LLVMIR转换的核心机制,重点分析了关键转换步骤。主要内容包括:1)创建llvm::Module模块,初始化LLVM上下文;2)定义目标架构,详细说明了LLVMTargetMachine、TargetSubtargetInfo和TargetLibraryInfoImpl三个辅助类的作用,分别用于表示目标架构配置、子架构特征描述和内置函数支持。这些步骤为后续SPIR-V到LLVMIR的语义转换奠定了基础。
2025-07-15 21:47:58
193
原创 linux 内核: 访问当前进程的 task_struct
文章摘要:本文介绍了在Linux内核模块中如何通过current宏获取当前进程信息。Linux采用单内核架构,所有模块运行在内核态,current宏指向task_struct结构体,可获取进程上下文信息。示例代码展示了如何显示进程名称、PID、TGID、UID、EUID、状态等关键信息,并区分进程上下文和中断上下文。模块初始化时打印进程信息,退出时再次显示。该技术可用于内核开发中的进程状态监控和调试。
2025-07-14 23:52:31
209
原创 驱动开发系列60- Vulkan 驱动实现-SPIRV到HW指令的实现过程(1)
1. vkCreateShaderModule 作用: 将已编译好的SPIR-V着色器代码加载到Vulkan中供GPU使用/*参数:device Vulkan 逻辑设备句柄(VkDevice)pCreateInfo 指向 VkShaderModuleCreateInfo 结构体,描述 SPIR-V 数据和大小pAllocator 自定义内存分配器(通常传 nullptr 使用默认分配器)pShaderModule 返回创建好的 VkShaderModule 句柄*/
2025-07-14 22:30:56
227
原创 C++ dijkstra 最短路径算法
Dijkstra算法是荷兰科学家Edsger W. Dijkstra于1956年提出的单源最短路径算法。该算法采用贪心策略,通过优先队列选择当前距离起点最近的节点,更新其邻居的最短路径。文章详细介绍了算法步骤:初始化距离、使用最小堆、松弛操作等,并提供了C++实现代码,包括邻接表构建、Dijkstra核心算法和测试用例。代码展示了如何计算两点间最短路径,处理不可达情况,并通过三个测试案例验证了算法的正确性(可达路径计算、更优路径选择及不可达情况处理)。
2025-07-08 21:59:39
332
翻译 AI论文阅读-注意力就是你所需的一切(Attention Is All You Need)
《Attention Is All You Need》 翻译 + 自己的理解
2025-07-07 20:37:47
51
1
原创 C++ 基于广度优先搜索(BFS)的拓扑排序算法
Kahn拓扑排序算法通过广度优先搜索处理有向无环图,时间复杂度O(V+E)。该算法不断选择入度为0的节点加入结果序列,若最终节点数不足则检测到环。摘要代码实现了一个Graph类,包含添加边和拓扑排序方法,并通过多个测试用例验证功能:包括多路径合并、复杂DAG、独立链合并及环检测。测试结果显示算法正确实现了拓扑排序,并能有效识别环结构。
2025-07-06 21:49:24
198
原创 C++ 语言特性31 - 协程介绍(2)
摘要:协程是一种可挂起与恢复执行的"高级函数",用于处理异步操作和数据生成等复杂场景。C++20引入协程支持,通过co_await和co_yield关键字实现非阻塞等待和生成器功能。协程概念早在1963年提出,现已被Python、JavaScript等现代语言广泛采用。C++函数的演进从基础函数到模板、lambda,最终在C++20迎来协程,实现了惰性求值和更灵活的流程控制能力。协程为C++带来了资源友好的异步编程方式,特别适合系统级开发需求。
2025-07-05 21:00:08
892
原创 C++ 基于深度优先搜索(DFS)的拓扑排序算法
本文介绍了基于深度优先搜索(DFS)的拓扑排序算法实现。算法通过递归遍历有向图的节点,在回溯时将节点压入栈中,最终获得拓扑排序的逆序。同时使用onstack数组检测图中是否存在环(回边)。文章提供了C++实现代码,包括Graph类、DFS函数和拓扑排序函数,并通过三个测试案例验证了算法的正确性:前两个测试展示了正常有向无环图的拓扑排序结果,第三个测试验证了环检测功能。当检测到环时,算法会抛出"cycle detected in graph"异常。
2025-07-05 11:25:57
150
原创 C++26 下一代C++标准
摘要:C++26作为下一代C++标准,将延续C++20的革新步伐,带来三大核心特性:反射(Reflection)增强元编程能力,契约(Contracts)规范接口设计,以及std::execution框架统一异步编程。从C++98的模板基础到C++11的现代特性,再到C++20的四大革新(范围库/协程/概念/模块),C++26有望成为继C++11和C++20之后又一里程碑式版本。该标准计划2025年完成,将显著提升C++在编译时编程、系统设计和并发处理方面的表现。
2025-07-04 23:38:58
1000
原创 驱动开发系列59- 再述如何处理硬件中断
本文探讨了设备驱动开发中硬件中断的处理方法。硬件中断是外设请求操作系统响应的电信号,会迫使处理器执行相应的中断处理程序。文章介绍了Linux操作系统处理中断的基本流程,重点讲解了驱动开发者需掌握的关键技术:如何分配IRQ中断号、编写中断处理函数(包括注意事项)、线程化中断模型的使用、IRQ中断的启用/禁用方法,以及通过/proc查看中断信息。此外还解释了中断上半部与下半部机制,并解答了相关常见问题。这些知识对于开发高效稳定的设备驱动程序至关重要。
2025-07-04 22:37:41
301
原创 驱动开发系列58 - 揭开内核IRQ框架的神秘面纱
本文介绍了Linux系统中的中断管理机制。硬件设备通过中断请求(IRQ)线路向CPU发送处理请求,CPU会暂停当前任务处理中断,完成后恢复原任务执行。文章重点阐述了内核提供的IRQ管理API、中断复用方法以及中断控制器驱动的实现原理。其中,中断控制器作为关键设备,负责管理CPU与中断线路间的交互。通过分析各组件间的协作过程,展现了Linux系统高效处理硬件中断的机制。
2025-06-29 22:01:44
75
原创 驱动开发系列57 - Linux Graphics QXL显卡驱动代码分析(四)显示区域更新
前面在介绍了显示模式设置(分辨率,刷新率)之后,本文继续分析下,显示区域的绘制,详细看看虚拟机的画面是如何由QXL显卡绘制出来的。// 当前启用的显示器数量(head 数量)// 驱动允许的最大显示器数量,如果为 0,表示没有固定限制,由驱动动态决定// 每个显示器的配置数组(实际大小为 count)// 显示头(显示器)ID// 绑定的 QXLSurface ID// 显示区域的宽度(像素)// 显示区域的高度(像素)uint32_t x;
2025-05-06 23:52:25
568
原创 驱动开发系列56 - Linux Graphics QXL显卡驱动代码分析(三)显示模式设置
如之前介绍,在qxl_pci_probe 中会调用 qxl_modeset_init 来初始化屏幕分辨率和刷新率,本文详细看下 qxl_modeset_init 的实现过程。即QXL设备的显示模式设置,是如何配置CRTC,Encoder,Connector 的以及创建和更新帧缓冲区的。
2025-05-02 14:31:12
760
原创 驱动开发系列55 - Linux Graphics QXL显卡驱动代码分析(二)显存管理
前面介绍了当内核检测到匹配的PCI设备后,会调用 qxl_pci_probe 初始化设备,其中会调用qxl_device_init 来初始化设备,为QXL设备进行内存映射,资源分配,环形缓冲区初始化,IRQ注册等操作,本文展开说说这些细节,并介绍下QXL的显存管理。
2025-05-01 09:40:33
360
原创 驱动开发系列54 - Linux Graphics QXL显卡驱动代码分析(一)设备初始化
QXL 是QEMU支持的一种虚拟显卡,用于虚拟化环境中的图形加速,旨在提高虚拟机的图形显示和远程桌面的用户体验;QEMU 也称 Quick Emulator,快速仿真器,是一个开源通用的仿真和虚拟化工具,可以模拟不同架构的计算机以及运行虚拟机。本文介绍下QXL 虚拟显卡驱动,即Linux 内核代码中QXL显卡驱动部分。看看它是如何支持QEMU虚拟显卡的。QXL代码分析基于v6.15-rc2内核版本。
2025-04-30 20:31:05
883
原创 linux 内核 debugfs 使用介绍
debugfs是 Linux 内核提供的一个特殊的虚拟文件系统,用于 暴露内核模块(如驱动)内部的调试信息或控制接口,供开发者、调试人员实时查看和排查问题。即debugfs就是一个“调试专用的 /proc 或 /sys”,方便你在不重启或不修改代码的情况下,查看内核模块的运行状态、统计信息,甚至直接向内核模块传递调试指令。
2025-04-29 21:46:13
457
原创 C++编程指南40 - 避免不经意间写出不通用的代码
在编写代码时,应尽量使用更通用、更抽象的方式,而不是绑定到具体实现细节,以提高代码的可重用性和适用性。以下规则有助于提升代码的通用性、可维护性与可扩展性:迭代器比较:用!替代,因为!更广泛适用于非有序容器。类型使用:如果函数只使用基类接口,就应接受基类引用,而不是派生类,避免对具体类型的无必要依赖。空判断方式:使用empty()而不是,因为某些容器没有size(),但支持判断是否为空。强制执行建议:编译器或代码分析工具应能发现并提示这些不通用的用法,避免影响泛型和复用能力。
2025-04-29 21:35:04
219
原创 OpenGL进阶系列21 - OpenGL SuperBible - blendmatrix 例子学习
颜色输出阶段是 OpenGL 渲染管线中最后一个阶段。它决定了片段在离开发片段着色器之后,最终显示在用户屏幕上的颜色值。颜色输出阶段最重要的一个操作就是混合。本例子重点介绍下OpenGL中的混合操作。对于每个通过片段测试(per-fragment tests)的片段,会执行混合操作。混合允许你将传入的源颜色与颜色缓冲区中已有的颜色进行组合;
2025-04-28 22:13:29
348
原创 C++编程指南39 - 不要特化函数模板
应避免特化函数模板,而应通过重载来实现不同类型或参数的处理。对函数模板进行特化会引入一些不容易察觉的问题,因为特化是针对特定类型提供一个具体实现。对于函数模板,如果你对某个类型进行了特化,那么编译器仅仅使用那个特化版本,其他版本不再参与选择。而重载是指定义多个函数模板,它们的参数类型,个数或顺序有所不同,编译器会根据传入的参数选择合适的版本。特化模板的坏处:它不参与重载解析,一旦你进行了模板特化,编译器会优先选择与特化版本完全匹配的函数,不会参与其他重载模板的选择。推荐使用重载。
2025-04-28 21:13:18
274
原创 驱动开发系列53 - 一个OpenGL应用程序是如何调用到驱动厂商GL库的
一个 OpenGL 应用程序调用 GPU 驱动的过程,主要是通过动态链接库(libGL.so)来完成的。本文从上到下梳理一下整个调用链,包含GLVND、Mesa 或厂商驱动之间的关系。
2025-04-24 19:05:55
338
原创 如何检查浏览器是否启用了WebGL2.0硬件加速
打开 Chrome 或 Edge(推荐使用 Chromium 内核浏览器)。点击浏览器右上角的 Spector.js 图标,出现浮动工具栏。捕获成功后,会弹出一个新的 Spector.js 分析窗口。按钮,会自动刷新页面并截取当前一帧的 WebGL 调用。安装完成后,在浏览器工具栏看到绿色的 S 图标。打开你要分析的 Web3D 网站(比如。
2025-04-23 13:11:48
557
原创 C++编程指南38 - 使用 static_assert 检查类是否符合某个 concept
如果我们打算让一个类符合某个 concept,那么尽早验证可以避免给使用者带来麻烦。C++20 引入了 Concepts(概念),用来对类型(类、结构体等)进行语义约束,例如是否可复制、是否可迭代、是否可调用等等。是一种编译时断言,它可以在编译期间验证某个条件是否为真,如果为假,编译器就会报错。
2025-04-21 21:24:21
333
原创 C++编程指南37 - 使用 concept 限制模板参数类型
concept是C++20 引入的语言特性,concept 是一种用于约束模板参数的编译期布尔表达式(谓词),它描述了一个类型应该具有的某些性质(比如是否可比较、是否可拷贝、是否支持某种操作等)。// 如果 T 没有 size(),编译器报个几十行的模板错误报错晦涩难懂,用户根本不知道为什么错,引入 Concept 之后,我们可以提前限制参数类型,并提供更清晰的错误信息:假设定义一个 concept 要求类型T有一个size()成员函数,且能返回可以转换为的值。
2025-04-21 21:17:37
326
原创 NVIDIA显卡 和 AMD 显卡
消费级显卡(如 4090)虽然训练性能强,不支持 ECC(错误校验),训练稳定性稍逊,NVLink/多卡扩展能力不如数据中心级。数据中心卡通常无法用于游戏/图形渲染。
2025-04-17 21:24:44
362
原创 linux 内核 container_of 宏的原理
宏是 Linux 内核中一个非常经典、非常强大的 “结构体逆推”技巧,用于从某个结构体成员的指针,反推出这个成员所在的结构体指针。内核中的很多子系统(如 device、list、ttm)都使用一个通用结构(比如), 然后通过在需要时把它转换为“更具体”的结构体。所有结构体“嵌套”在一起,方便管理;用能轻松回到“容器结构体”。
2025-04-17 16:33:46
542
原创 Linux 6.15-rc2 发布,包含一系列修复内容
本周合入 Linux 6.15-rc2 的修复包括一些针对 AMD/Intel 处理器的 Spectre RSB(Return Stack Buffer)缓解措施的清理工作,以及多个图形驱动的修复,其中包括修复 Intel 平台上的屏幕闪烁问题。是的,这次合并窗口比往常大一些,但至少目前来看,rc2 在提交数量和 diffstat(代码变动统计)方面都基本符合常规水平。换句话说,各方面都有一点更新。此外,还有来自 Linux 6.15 内核早期测试的大量其他杂项修复,分布在代码库的各个部分。
2025-04-14 08:47:04
629
原创 C++ 编程指南36 - 使用Pimpl模式实现稳定的ABI接口
C++ 的类布局(尤其是私有成员变量)直接影响它的 ABI(应用二进制接口)。如果你在类中添加或修改了私有成员,即使接口不变,编译器生成的二进制布局也会变,从而导致 ABI 不兼容。这意味着使用这个类的代码需要重新编译,严重破坏了库的二进制兼容性。为避免这种情况,Pimpl(Pointer to Implementation) 模式应运而生。Pimpl将类的实际实现细节封装在另一个类中(impl),对外只暴露一个指向实现的智能指针(如。
2025-04-13 22:42:13
353
原创 C++ 编程指南35 - 为保持ABI稳定,应避免模板接口
模板在 C++ 中是编译期展开的,不同模板参数会生成不同的代码,这使得模板类/函数天然不具备 ABI 稳定性。为了保持ABI稳定,接口不要直接用模板,先用普通类打个底,模板只是“外壳”,这样 ABI 才稳定。这样做有两个好处:所有模板实例共享一个实现代码(避免为每个List<T>生成一份几乎相同的add_frontunlink等函数)。核心逻辑只定义一次,因此更容易保持 ABI 稳定性,并且编译速度更快。
2025-04-13 22:31:15
429
原创 C++ 编程指南34 - C++ 中 ABI 不兼容的典型情形
ABI(Application Binary Interface)是二进制层面的接口规范。如果一个库的 ABI 发生了变化,那么基于旧 ABI 编译的代码可能在运行时与新库不兼容(即使接口名字都一样也不行)。那么在C++中编程中,哪些情形会导致ABI不兼容呢?下面逐一列举一下。
2025-04-13 22:17:23
1026
原创 驱动开发系列52 - Linux xorg-server 解析(三)- xorg-server 代码结构
1. randr, composite, render, glx, xkb 扩展模块。├── xfree86/ ← 主流 x86 平台入口,内含所有驱动加载与初始化代码。├── kdrive/ ← 轻量级 X 服务器实现(很少用了)2. hw/xfree86 中的设备初始化(输入输出驱动加载)├── vfb/ ← 虚拟帧缓冲,常用于测试或 VNC。3. fb,glamore,exa 图形绘制,图形加速。├── dummy/ ← 虚拟显卡(如 Xvfb)
2025-04-13 10:50:43
99
原创 驱动开发系列51 - Linux xorg-server 解析(二)- 如何调试 xorg-server
Xorg-server简称Xorg,它是Linux窗口系统的核心组件,它是用户态应用程序,但它的调试方法和普通用户态应用程序有所不同,因为Xorg是系统的核心组件,负责图形显示和输入设备的管理,所以在单台机器上调试Xorg可能会面临一些困难和限制,如果在同一台机器上调试它,可能会导致显示服务中断,导致调试界面卡住或屏幕黑屏,影响正常使用。下面以Ubuntu 24.04 系统下为例,介绍下Xorg的调试方法。
2025-04-12 21:42:24
687
原创 驱动开发系列50 - Linux xorg-server 解析(一)- 编译安装Debug版本的xorg-server
1. 配置源,以Ubuntu24.04 为例( /etc/apt/sources.list.d/ubuntu.sources):2."-g -O0"-rfakeroot-us -uc sudo apt install ./*.deb 如果中间出现什么问题,或想还原到系统默认的xorg-server,可以执行:
2025-04-12 21:35:12
207
原创 Vulkan进阶系列10 - 向着色器传递常量数据(完整代码)
在 GLSL(OpenGL Shading Language)中,uniform是一种非常常用的变量类型,用于 在主机(CPU)和着色器之间传递常量数据。它是图形管线中从 CPU 向 GPU 传递“每帧/每绘制调用”数据的主要方式之一。uniform变量是 只读的,由 CPU 端的应用程序设置。在 一个 draw call 内部不会改变,但可以在多个 draw call 之间更新。所有处理该 draw call 的顶点或片元之间是 共享的。举个例子,这个例子中我们用了一个(UBO),叫做。
2025-04-12 11:00:13
433
OpenGL Programming Guide (Red Book) 9th Edition Source Code
2024-10-07
Learn LLVM 17 A beginners guide to learnin - Kai Nacke.pdf
2024-07-08
Power and Performance Software Analysis and Optimization pdf
2024-04-09
计算机图形学经典书籍资料-建模部分
2014-11-06
计算机图形学经典书籍资料-渲染部分
2014-11-06
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人