- 博客(663)
- 资源 (83)
- 收藏
- 关注
原创 A JIT for packet filters
BPF(伯克利数据包过滤器)是Linux网络协议栈中用于高效过滤网络数据包的关键机制。最新补丁通过引入JIT编译器,将BPF程序直接转换为x86汇编指令,使单次过滤操作提速50纳秒。该技术虽目前仅支持x86-64架构,但其成功验证了内核级JIT编译的可行性。文章还探讨了将类似优化应用于iptables的可能性,并指出基于BPF理念的nftables可能更具发展潜力。这一突破性改进为高流量场景下的数据包处理提供了显著的性能提升。
2025-07-30 05:28:44
296
原创 Dynamic DMA mapping using the generic device
本文介绍了Linux内核中的DMA API,分为基础API(Part I)和针对非一致性内存平台的扩展(Part II)。基础API包含:1)一致性内存分配dma_alloc_coherent/free;2)小型缓冲区的DMA内存池管理dma_pool_create/alloc/free;3)地址限制检查dma_set_mask;4)流式DMA映射dma_map_single等。特别说明了不同DMA方向(TO_DEVICE/FROM_DEVICE/BIDIRECTIONAL)的同步要求,以及物理连续性和对齐
2025-07-29 05:44:04
532
原创 Allowing BPF programs more access to the network
在Linux峰会上,Mahé Tardy讨论了开发Tetragon(基于BPF的安全监控软件)时遇到的挑战,主要聚焦两个方向:1)探索让BPF程序直接通过网络发送数据以消除用户空间拷贝,提出了vmsplice()或io_uring等实现方案;2)为BPF防火墙添加发送TCP reset包的能力,以更优雅地终止连接。虽然讨论未形成最终结论,但展示了BPF在安全监控领域的技术潜力,包括可能完全移除用户空间组件以增强安全性。与会者就技术可行性展开探讨,提出了netconsole等替代方案,总体上对扩展BPF功能持
2025-07-27 10:30:19
727
原创 Virtual machine scheduling with BPF
Vineeth Pillai在2024 Linux峰会上提出利用BPF优化虚拟机性能的方案,通过宿主机与客户机共享调度信息来减少"双重调度"开销。该方案使用共享内存和BPF程序进行调度决策,引发了关于实现方式的讨论,包括是否使用tracepoint或struct_ops回调、如何避免死锁等问题。虽然对BPF干预调度器存在担忧,但与会者普遍认可解决双重调度问题的价值。该补丁集已更新至第二版,正在开发第三版以回应维护者反馈。
2025-07-27 01:42:15
708
原创 Enforcement (or not) for module-specific exported symbols
Linux 6.16内核引入新的模块特定符号导出机制EXPORT_SYMBOL_GPL_FOR_MODULES,允许将符号仅导出给指定GPL许可的内建模块。该机制旨在解决内核开发者既不愿广泛导出关键符号,又需要支持某些内建模块的特殊需求。虽然最初计划加入强制验证机制确保仅限内建模块使用,但因可能影响开发者工作流而取消,最终仅保留宏名称变更。目前该机制尚无实际用例,但已有多个潜在应用场景准备中。该变更延续了Linux社区通过许可声明而非技术强制来规范符号使用的传统,在保持开放性的同时明确开发意图。
2025-07-26 05:03:48
1136
原创 SFrame-based stack unwinding for the kernel
摘要:内核开发社区正通过SFrame项目解决perfevents子系统在用户空间调用栈展开的效率问题。传统方法依赖帧指针或复杂的DWARF格式,前者影响性能,后者难以在内核实现。SFrame作为轻量级ORC格式的衍生方案,通过紧凑的ELF区段存储调用帧信息,支持高效栈展开。目前补丁系列分三部分推进:1) 添加延迟展开基础设施;2) 集成perfevents支持;3) 实现SFrame解析。尽管仍需完善共享库跟踪等细节,这项持续多年的工作已接近完成,未来将实现跨越内核/用户空间的高效统一性能分析。
2025-07-24 13:05:44
608
原创 A RDRAND followup
摘要:x86 CPU硬件随机数生成器(RDRAND/RDSEED)的可靠性问题引发讨论,Intel确认RDRAND在正常设备中不会故障,而RDSEED可能在高压下失效。保密计算应用依赖RDRAND即可确保安全。Linux内核维护者提交补丁优化错误处理,包括启动时用RDRAND播种失败则系统panic,但移除重试机制的修改因兼容旧CPU暂被搁置。相关补丁获开发者认可,标志着该问题阶段性解决。(149字)
2025-07-24 01:05:15
362
原创 Pitchforks for RDSEED
硬件随机数生成器(如x86的RDSEED和RDRAND指令)的安全性问题引发讨论。测试显示,多线程环境下RDSEED失败率高达97%,RDRAND也可能被耗尽管概率较低。这对依赖硬件熵源的机密计算(CoCo)构成重大威胁——若宿主机可耗尽随机数源,虚拟机安全将崩溃。内核开发者建议:1)添加重试机制;2)启动失败时警告;3)机密计算模式下直接panic。普通系统受影响较小,因内核能整合其他熵源。CPU厂商正评估是否需要微代码更新或架构调整。该问题再次引发对机密计算可行性的质疑。
2025-07-22 11:53:41
1158
原创 Cleaning up after BPF exceptions
摘要:Kumar Kartikeya Dwivedi自2023年开始为BPF添加异常支持,其工作分为两个阶段:2023年7月实现基本栈回溯,2024年2月新增资源释放机制。BPF异常机制独特之处在于无法被捕获且无类型区分,但会执行栈回溯。最新补丁通过创建栈映射表来跟踪和释放资源,解决了验证器原有漏洞。虽然存在对编译器变更影响合并的担忧,但Dwivedi认为运行时跟踪方案开销过大。该补丁集将整合现有栈检查代码进行优化,未来计划扩展支持更多资源类型。(150字)
2025-07-21 12:20:49
800
原创 Fixing a corner case in asymmetric CPU packing
Linux系统支持处理器架构中存在不同处理能力的CPU,如Arm的big.LITTLE系统和SMT架构。近期Ricardo Neri提交的补丁显示,在混合架构中调度器可能低效分配任务。SMT通过共享物理核心提高资源利用率,但性能提升有限。Linux通过降低SMT线程优先级来优化调度,5.16内核合并的补丁针对非对称CPU(如Intel Core+Atom组合)优化了调度策略,优先使用高性能核心而非SMT线程。测试显示性能有小幅提升,但个别场景出现下降。这标志着Linux对异构计算架构的持续优化。
2025-07-20 01:46:16
823
原创 Linux RDMA Maillist patchsets (Jul. 14 - Jul. 19, 2025)
本文介绍了Linux内核中的三项重要技术改进:1) GPU设备私有内存的P2P DMA访问支持,通过扩展内存管理接口和驱动程序回调,实现GPU与NIC等设备间的直接数据传输;2) PTP硬件时钟原始周期计数器的暴露机制,新增ioctl命令支持周期值与系统时间的关联转换;3) devlink健康报告器的可配置宽限期延迟机制,允许在用户定义的时间窗口内处理关联错误。这些改进分别优化了GPU计算性能、高精度时间同步和硬件错误恢复流程,显著提升了系统在特定场景下的运行效率。
2025-07-20 01:17:41
808
原创 Toward the unification of kselftests and KUnit
内核测试框架整合:KUnit与kselftests的融合之路 Linux内核长期存在两套独立测试框架:用户态的kselftests(2012年引入)和内核态的KUnit(2019年添加)。前者通过系统调用测试用户空间ABI,后者以内核模块形式验证内部函数。Thomas Weißschuh提出的补丁系列旨在将两者整合,使kselftests能以内核模块形式运行。关键技术包括:利用user-mode-helper功能创建隔离环境,采用内核自带的nolibc替代系统C库,并通过新增的EXPORT_SYMBOL_G
2025-07-17 12:34:24
916
原创 Kernel API specification and validation
摘要: 内核开发者承诺保持ABI稳定性以避免破坏用户空间代码,但缺乏明确的ABI定义和测试方法。Sasha Levin提出的"内核API规范框架"(第二版)试图通过宏定义系统调用、sysfs属性等接口的详细规范(如参数、返回值、错误码等),但当前方案仍不完整且会增加内核体积(每个API约4KB)。框架支持通过debugfs导出JSON/XML格式的规范数据,并引入Rust工具kapi进行版本差异检测,但自动化验证能力有限,主要依赖开发者主动维护规范。未来计划整合静态分析和模糊测试,但需社
2025-07-17 10:15:24
703
原创 Linux RDMA Maillist patchsets (Jul. 7 - Jul. 13, 2025)
摘要:该系列补丁对mlx5驱动的DMABUF内存管理进行了多项优化:1)动态选择最优页大小替代固定4KB配置,提升内存注册效率;2)修复页大小掩码处理缺陷,确保大页注册有效性;3)通过减少HCA的页表遍历次数降低缓存访问开销。同时引入RDMA新特性:统一CQ用户内存接口(支持虚拟地址/DMA-BUF)、标准化DMA句柄对象(支持TPH等扩展功能),并在mlx5驱动中实现完整DMAH基础设施。此外新增了AMDPensandoRDMA驱动支持,以及PCIe拥塞事件监测功能,通过ethtool计数器提供带宽压力可
2025-07-14 06:33:56
884
原创 Supporting kernel development with large language models
摘要:在2025北美开源峰会上,Sasha Levin展示了LLM在内核开发中的应用。他指出LLM作为概率性状态机,擅长处理小型明确任务,如自动生成内核补丁(如6.15版本中的哈希API修改)和辅助工具(如git-resolve脚本)。虽然LLM无法开发复杂模块,但能提升效率,尤其帮助非英语开发者撰写提交说明。通过"嵌入"技术实现语义搜索,以及"检索增强生成"(RAG)技术防止虚构内容,LLM正成为新一代开发工具。Levin认为LLM不会取代开发者,而是像高级语言一样
2025-07-14 01:14:25
902
原创 Improved load balancing with machine learning
Linux 6.12引入的可扩展调度器框架sched_ext,通过BPF机制实现了自定义CPU调度器的动态加载,为应对现代异构计算系统的复杂调度需求提供了创新解决方案。在2025北美开源峰会上,Ching-Chun Huang展示了如何利用机器学习优化5G网络处理等复杂场景的调度决策,其研发的调度器通过收集15维参数训练神经网络模型,在内核中采用定点运算实现智能负载均衡,相比EEVDF调度器将内核编译时间提升10%,任务迁移减少77%,标志着Linux调度机制从"通用最优"到"
2025-07-13 01:58:34
626
原创 Yet another way to configure transparent huge pages
摘要(149字): 透明大页(THP)性能优化方案引发内核社区争议。5月15日,Usama Arif提交的prctl()补丁试图为进程设置默认THP策略,但Lorenzo Stoakes认为这会破坏现有机制。讨论中出现了三种方案分歧:1)扩展prctl();2)创建全新系统调用;3)改进madvise()接口。Stoakes随后提交了支持进程级默认值的madvise()补丁,引入四个新标志。尽管存在API设计争议,双方同意继续完善提案。最终方案虽未确定,但进程级THP调优功能很可能即将进入内核。
2025-07-13 01:21:38
449
原创 Who are kernel defconfigs for?
内核配置系统长期以来被视为开发者入门的主要障碍,其数千个相互依赖的选项常导致构建失败或臃肿内核。尽管存在localmodconfig等辅助工具,但社区对合理默认值始终缺乏共识。近期x86维护者Ingo Molnar试图通过补丁使默认配置更贴近现代发行版需求,新增了虚拟化、BPF等特性支持,却遭到Linus Torvalds强烈反对,认为默认配置应服务"普通用户"而非云提供商。这场争论暴露出内核构建系统更深层的问题:由单一开发者维护的脆弱生态,在缺乏广泛共识的情况下难以实现实质性改进。最终
2025-07-13 01:14:19
635
原创 LLVM improvements for BPF verification
摘要:Alan Jowett在2024 Linux峰会上探讨如何改进LLVM对BPF程序的支持。当前LLVM优化生成的BPF代码常因校验器无法理解而失败,开发者不得不使用汇编代码规避。Jowett提出将MIT授权的PREVAIL校验器集成到LLVM流程中,但存在IR与字节码的转换难题。会议还讨论了代码覆盖率、分支提示保留等改进方向,但与会者在JIT优化复杂度等问题上存在分歧。由于BPF的特殊校验要求与传统编译器目标存在矛盾,解决方案仍需持续探索。
2025-07-10 13:21:41
883
原创 A plan to make BPF kfuncs polymorphic
摘要(149字) David Vernet在2024年Linux峰会上提出"多态kfuncs"机制,允许内核函数根据调用上下文动态选择实现。以sched_ext调度框架为例,当前scx_bpf_dispatch()函数通过per-CPU变量区分不同场景的实现,效率较低。新方案建议在BPF验证阶段通过子系统回调确定具体函数ID,将上下文判断从运行时移至加载时。讨论中,与会者探讨了该机制与现有helper函数的兼容性,以及基于参数类型实现多态的可能性。尽管存在实现复杂度问题,该机制有望提升B
2025-07-04 13:07:08
727
原创 How to write Rust in the kernel: part 1
Linux内核逐步引入Rust支持,本文是系列文章首篇,指导开发者配置Rust开发环境并融入内核构建系统。主要内容包括: 工具链要求:需rustc 1.78.0+、Clang、LLVM等,推荐完整安装Rust生态工具; 构建集成:内核采用Makefile直接调用rustc,不使用Cargo,通过配置选项CONFIG_RUST控制编译; 测试支持:集成Clippy静态检查、KUnit单元测试和文档测试(doctest),保持代码质量; 开发辅助:提供rustfmt格式化、rust-analyzer语言服务等工
2025-06-22 08:13:08
646
原创 A distributed filesystem for archival systems: ngnfs
Zach Brown在2025年LSFMM+BPF峰会上介绍了ngnfs文件系统,这是一个面向大规模离线数据集的新型分布式文件系统。与名字暗示的"下一代NFS"不同,ngnfs专为存储海量离线数据(如磁带归档)而设计,其核心特点是: 采用元数据为中心的架构,通过扩展属性记录文件位置; 分布式设计以应对高带宽需求; 创新的块级事务机制取代传统文件锁; 支持原子写入和在线修复功能。 该系统源自Brown在GlusterFS等分布式文件系统中的经验,旨在简化存储架构,目前已实现基础客户端和服务
2025-06-22 08:08:21
627
原创 Asterinas: a new Linux-compatible kernel project
Asterinas是一项基于Rust语言的创新操作系统内核项目,采用"框架内核"(framekernel)架构,巧妙融合单体内核的高效性与微内核的安全性优势。该项目将所有需要使用Rust不安全特性的代码封装在核心库中,其余内核服务则采用安全抽象开发,既保持了共享内存架构的性能优势,又显著提升了系统安全性。Asterinas兼容Linux ABI,支持x86和RISC-V架构,目前已完成206个系统调用实现。项目由中国多所高校研究人员和蚂蚁集团共同推进,近期目标聚焦云计算领域,计划构建具备
2025-06-20 22:19:24
775
原创 The hierarchical constant bandwidth server scheduler
摘要:Linux内核的POSIX实时模型面临多实时任务竞争CPU资源的效率问题。Yuri Andriaccio等人提出的分层恒定带宽服务器(CBS)补丁系列,通过改进调度算法,实现更确定性的多任务资源配置。该方案基于2001年Lipari和Baruah的理论研究,利用控制组层级结构(每个组配置周期和CPU时间参数)和重构的deadline服务器机制,在保证资源隔离的同时简化了调度器代码。相比现有实时组调度方案,新方法具有更强理论基础和更少代码量。该补丁已在2025年Linux调度峰会上讨论,但距离合入主线仍
2025-06-19 11:59:43
713
原创 Getting Lustre upstream
摘要: Lustre文件系统正在寻求重新进入Linux内核主线,在2025年LSFMM+BPF峰会上讨论了相关计划。这个高性能并行文件系统曾在2013-2018年间存在于staging树,但因开发模式不兼容被移除。目前开发者已提交1000多个适配补丁,并计划将核心代码与兼容代码分离,仅将前者纳入内核。主要挑战包括:1)开发流程需改用邮件列表而非Gerrit;2)需完全采用现代内核API(如folio);3)考虑先仅合并客户端代码以避免与ext4的耦合问题。社区建议通过公开代码审查和建立镜像仓库来建立信任,但
2025-06-19 11:46:46
482
原创 Parallelizing filesystem writeback
Linux内核写回机制改进:从单线程到并行化 在2025年LSFMM+BPF峰会上,Anuj Gupta介绍了针对Linux文件系统单线程写回(writeback)瓶颈的改进方案。当前bdi_writeback的单线程设计在多线程写入场景下成为性能瓶颈。改进方案通过引入bdi_writeback_ctx结构体实现高层并行性,依据文件系统结构(如XFS的AG)划分写回任务。讨论中,专家们就实现细节展开辩论:Hellwig建议采用XArray替代全局链表,Kara提醒低层并行性可能引发数据一致性问题,Mason
2025-06-14 23:50:16
1003
原创 Finding locking bugs with Smatch
Smatch是一款基于GPL许可的C语言静态分析工具,专注于Linux内核代码检查。在LinaroConnect2025大会上,主要开发者DanCarpenter介绍了其最新改进:重构插件系统以增强模块化,特别是针对锁机制的检查能力。该工具通过控制流和跨函数分析追踪锁状态,能检测错误路径未解锁、重复加锁等常见问题。相比其他开源工具(如Cppcheck、Coccinelle),Smatch在流程分析方面具有优势,但存在速度较慢、主要适配内核代码等局限。最新版本已改用类型而非名称追踪锁对象,有效解决了多名称引用
2025-06-12 23:50:26
739
原创 Improving iov_iter
摘要:在2025年LSFMM+BPF峰会上,David Howells主持讨论了iov_iter接口的改进方案。该接口用于内核缓冲区管理,但存在类型复杂、内存生命周期管理困难等问题。会议重点探讨了: 现有9种iov_iter类型(如ITER_IOVEC、ITER_BVEC等)的局限性,特别是废弃的ITER_XARRAY类型存在RCU锁问题; folio世界带来的新挑战,底层组件无法假设所有缓冲区都可获取页引用; 加密API从scatter-gather列表迁移到iov_iter的分歧,Hellwig反对添加
2025-06-12 23:44:13
633
原创 An end to uniprocessor configurations
摘要:Linux内核最初仅支持单处理器(UP),随着1995年引入SMP支持后一直保留双代码路径。Ingo Molnar近期提交补丁系列(43个)提议彻底移除UP支持,删减约1000行代码并简化调度器结构。虽然这会导致单处理器系统性能下降约5%,但目前实际UP用户极少,多数发行版已默认使用SMP内核。该改动标志着内核开发重点的根本转变,将维护负担从SMP转移到UP支持者身上。尽管补丁尚需更多测试,但社区暂未出现反对声音,反映30年来硬件生态的深刻变迁。
2025-06-12 23:38:31
829
原创 The second half of the 6.16 merge window
GPIO 和引脚控制:联发科 MT6893 和 MT8196 SoC、瑞萨 RZ/V2N SoC、联发科天玑 1200(MT6893)I2C、Sophgo SG2044 I2C、瑞萨 RZ/V2N R9A09G056 I2C、瑞芯微 RK3528 I2C,以及 NXP Freescale i.MX943 SoC。用于生成崩溃报告的 crash dump 内核(在主内核崩溃后运行的特殊内核)现在可以复用现有的 LUKS 密钥,从而支持将崩溃转储写入加密文件系统,这在此前是不可能实现的。
2025-06-12 23:32:29
1023
原创 io_uring, SCM_RIGHTS, and reference-count cycles
本文介绍了Linux内核中io_uring机制的最新进展及其与虚拟文件系统(VFS)引用计数问题的关联。io_uring机制经过多轮安全审查后,被发现存在因SCM_RIGHTS文件描述符传递导致的循环引用问题。VFS维护者Al Viro详细解释了文件引用计数管理机制,特别是当Unix域套接字通过SCM_RIGHTS传递文件描述符时可能形成的引用循环。文章重点描述了当进程将两端套接字注册到io_uring后又互相传递描述符时,会导致无法释放的内核内存泄漏。最终通过借鉴SCM_RIGHTS的处理逻辑,Jens
2025-06-07 19:27:29
664
原创 Slowing the flow of core-dump-related CVEs
Linux 6.16内核将对coredump(核心转储)处理机制进行重大改进,以解决长期以来存在的安全漏洞问题。开发者Christian Brauner指出,现有的coredump API存在严重缺陷,导致频繁出现CVE漏洞。 当前coredump机制的主要问题包括:用户空间helper程序以root权限运行、PID重利用引发的竞态条件,以及可能被攻击者利用来获取特权进程内存数据。Qualys近期就发现了Ubuntu和systemd的coredump处理工具中存在的漏洞。 6.16内核引入两项关键改进:1)
2025-06-07 17:57:55
559
原创 Zero-copy for FUSE
当一个使用 io_uring 的应用程序需要对其缓冲区执行读写操作时,内核会对这些缓冲区进行两次封装:首先封装为 iov_iter(类型为 ITER_UBUF),然后再封装为 bio_vec,后者用于描述一个块 I/O 请求的各个部分。然后,应用程序就可以使用 io_uring 的“固定”读写操作,重用内核已创建的对象,而不是每次调用都重新创建。Linux 6.15 对 ublk 做出了改进,允许服务器使用前面提到的 io_uring 缓冲区注册机制,这样就可以执行固定的读写操作,从而避免了数据复制。
2025-06-06 17:25:42
491
原创 Fending off unwanted file descriptors
有趣的是,在这一功能漫长的发展历史中,似乎从未有人认真考虑过接收方是否真的希望获得一个新的文件描述符。开发者通常会仔细管理程序中的打开文件表,关闭不再需要的文件,并确保不必要地将文件描述符传递到新的进程或程序中。如果传入的文件描述符处于某种挂起状态——例如一个攻击者控制的 FUSE 文件系统或一个挂起的 NFS 文件——被安装到某个进程中后,接收方在尝试关闭它时可能会被无限期阻塞。但如果接收方并不想要一个新的文件描述符呢?Iwashima 的解决方案是在套接字上提供一个新选项,以禁用接收文件描述符的能力。
2025-06-06 17:11:13
755
原创 Device-initiated I/O
摘要 在2025年Linux存储、文件系统、内存管理与BPF峰会上,Stephen Bates主持了关于设备发起I/O的讨论,重点关注点对点DMA(P2PDMA)技术的演进。P2PDMA自2018年Linux 4.20内核版本引入,允许PCIe设备间直接传输数据而无需经过系统内存。当前该技术已支持Arm64架构,并解决了早期与IOMMU兼容的问题。 会议探讨了设备发起I/O作为P2PDMA的下一步发展方向,目标是减少CPU在高速I/O操作中的负载。随着NVMe SSD的IOPS突破千万级,传统CPU处理方式
2025-06-05 15:42:52
1604
原创 Two sessions on faster networking
文章摘要: 2025年Linux峰会上,Cong Wang和Daniel Borkmann分别提出优化Linux内核网络性能的方案。Wang探讨通过BPF加速socket操作,包括使用sk_msg结构简化消息传递、绕过TCP栈实现本地通信,以及优化短消息处理性能。Borkmann则聚焦虚拟机网络开销问题,提出基于AF_XDP和netkit的新架构,使流量直接从物理网卡经QEMU进入VM内核,减少中间环节。两项方案均致力于消除网络协议栈中不必要的操作,但针对不同场景:Wang优化本地通信,Borkmann提升
2025-06-05 15:37:45
750
原创 Hardening fixes lead to hard questions
摘要:内核开发者Kees Cook因使用b4工具修改提交历史时意外重写了39个包含Linus Torvalds署名的提交,导致其kernel.org账户被暂时封禁。事件引发了对恶意活动的猜测,但最终确认是操作失误。b4维护者Konstantin Ryabitsev承认工具应增加防护机制,Torvalds要求禁止重写他人提交。该事件凸显了强大开发工具潜在的破坏性,促使相关工具改进安全措施。(149字) 核心要点: 操作失误引发安全警报 git历史重写导致身份混淆 开发工具缺乏必要防护 事件推动工具链安全改进
2025-06-03 05:38:31
1004
原创 The first half of the 6.16 merge window
音频支持:支持 AMD ACP 7.x、Cirrus Logic 的 CS35L63 放大器和 CS48L32 音频处理器、Everest Semiconductor 的 ES8375 与 ES8389、龙芯一号 AC'97 编解码器、NVIDIA Tegra264 SoC、Richtek 的 ALC203 与 RT9123 编解码器、瑞芯微 SAI 控制器、Intel WCL 以及 DJM-V10 混音器。现在,它已被一个更易维护、并与 Sphinx 构建系统集成得更好的 Python 脚本所取代。
2025-05-30 15:45:32
779
原创 Block-layer bounce buffering bounces out of the kernel
因此,Hellwig 提交了一组补丁,使得在启用了高端内存支持的系统上,这四个驱动全部无法加载,从而将 bounce buffer 的用户数量归零。将这些内存分配给用户空间确实缓解了燃眉之急,但不久之后,内核无法将高端内存用于自身操作的问题也暴露出来:可用于内核的低端内存实在太少,难以支撑系统高效运行。有趣的是,添加到 2.3.27 的 bounce buffering 代码中曾留有一条注释,说它将在 2.5 版本中“移动到块层”,因为当时计划对块设备代码进行一次大规模重构。在某些情况下它仍是不可避免的。
2025-05-30 02:50:26
757
原创 Verifying the BPF verifier‘s path-exploration logic
摘要:Srinivas Narayana在Linux峰会提出扩展Agni工具验证BPF验证器的路径探索逻辑。路径探索是BPF验证器的核心功能,通过选择性裁剪重复路径来提升效率,但实现复杂且曾引发安全问题。Narayana计划结合形式化方法和穷举测试来验证八项关键条件,重点解决"状态包含性"和"健全泛化"两个特性。虽然该项目面临挑战,但得到BPF开发者支持,有望为验证器最复杂的部分提供正确性保障。
2025-05-28 04:35:34
937
人工智能面向企业AI推理与微调的多Arc GPU解决方案:中国市场的性能优化与TCO优势分析
2025-07-10
人工智能OpenVINO 2024.1发布:增强生成式AI工作负载与大语言模型性能优化及广泛支持
2025-07-10
### 文章总结:Intel以太网产品路线图与技术进展
2025-07-10
【密码学与硬件加速】基于SMx算法的QAT-Engine性能优化:中国国家标准加密算法在Intel平台上的实现与应用
2025-07-10
加州驾驶手册中文版:加州交通法规与安全驾驶指南
2025-07-07
【信息技术应用创新】中国信创CPU架构与生态发展分析:自主可控计算平台关键技术及应用前景综述
2025-07-09
Intel vPro in Edge Applications - Sell high with OOB management and more premium features.pdf
2025-07-07
【网络与边缘计算】基于英特尔技术的绿色数字基础设施解决方案:硬件、软件及应用层面的可持续性优化设计
2025-07-07
【网络与边缘计算】CES定制代码发布流程详解:从开发到发布的全流程管理及工具使用培训介绍了CES(客户
2025-07-10
【深度学习优化】OpenVINO定制扩展性实现:模型推理工作流与自定义操作优化在推荐系统的应用
2025-07-07
【OpenVINO定制扩展性】基于OpenVINO的模型推理工作流与自定义操作优化:多场景应用案例分析及性能提升OpenVINO的
2025-07-07
【视频协作技术】基于Intel SDK的智能视频会议解决方案:混合办公模式下的远程协作与技术创新
2025-07-09
【边缘计算与网络】英特尔融合边缘媒体平台:优化多服务部署及资源调度的融合边缘媒体
2025-07-09
IB Specification Vol 1-Release-2.0-Draft-2025-07-23 - 2
2025-07-29
IB Specification Vol 1-Release-2.0-Draft-2025-07-23 - 4
2025-07-30
IB Specification Vol 1-Release-2.0-Draft-2025-07-23 - 3
2025-07-30
通信技术Intel CPU在5G基站中的应用与优化:从RAN架构到功耗管理的全面解析
2025-07-20
【人工智能大模型训练】大规模LLM系统并行计算与网络挑战分析:Gaudi系列芯片及IPU解决方案设计了大规模语言模型
2025-07-20
### 【视频处理领域】Intel VPP SDK与SVET 2.0技术概述:加速视频处理应用开发与优化Intel VPP SDK
2025-07-20
### 文章总结:Intel CCID 平台解决方案与产品路线图(2023-2024)
2025-07-20
【云计算安全】多租户云环境中的内存DoS攻击:危害与防御机制设计
2025-07-15
硬件设计Mackay Peak PCIe IPU适配器技术详解:网络与存储加速功能综述
2025-07-12
【5G通信技术】基于AIML的英特尔平台优化:动态无线资源管理与节能方案设计
2025-07-14
【网络与边缘计算】CES定制代码发布流程解析:组件变更与新组件创建的合规性管理及应用
2025-07-10
网络安全ReDMArk:绕过RDMA安全机制的攻击与防御策略分析-针对InfiniBand和RoCE架构的深入研究
2025-07-15
【电信基础设施】OTII标准演进与应用:边缘计算服务器在5G和AI场景下的部署与发展综述
2025-07-14
【工业自动化】开放过程自动化(OPA)标准与英特尔边缘控制技术:推动工业控制系统互操作性和安全性发展
2025-07-14
边缘计算英特尔实时边缘解决方案:工业控制与混合关键性工作负载优化设计英特尔在实时边缘
2025-07-14
【OpenVINO性能优化】性能提示与线程调度设置:CPU推理优化配置及应用场景分析
2025-07-14
【数据中心存储】基于Intel IPU的Cassandra集群优化:Apple大规模分布式数据库性能提升与成本降低方案探讨
2025-07-11
【网络硬件加速】96M精确匹配规则卸载方案:状态网关中大规模会话状态管理与硬件加速设计
2025-07-10
硬件管理基于Redfish协议的IPU服务器实现规划:IMC与ACC更新及安全管理接口设计
2025-07-10
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人