- 博客(689)
- 资源 (83)
- 收藏
- 关注
原创 BPF at Facebook (and beyond)
摘要:Facebook积极开发内核BPF技术并坚持"上游优先"理念,但其实际BPF应用细节鲜为人知。KernelRecipes 2019会议上,BPF开发者Alexei Starovoitov透露,Facebook每台服务器运行约40个BPF程序,涉及性能监控、网络调度和安全监控等领域。虽然BPF功能强大,但也带来性能挑战,如1%的系统性能下降和数据库延迟问题。解决方案包括"编译一次,到处运行"技术(5.4内核支持)和验证器改进。未来BPF发展将更多依赖BTF数据,预
2025-08-19 11:29:45
239
原创 BPF: what‘s good, what‘s coming, and what‘s needed
2019年Linux存储、文件系统和内存管理峰会首次设立BPF专题分会场。Dave Miller在主题演讲中剖析了BPF的成功要素:它通过沙盒机制在内核中安全运行程序,使开发者无需修改源码即可实时观测和调整内核行为。BPF当前仍存在诸多限制(如循环支持不足、代码复用困难),但正在快速发展,包括指令上限提升至100万条、引入有界循环支持等。未来需改进调试能力、访问控制和内存管理,并建立类似Arduino的简易开发环境。尽管BPF与内核ABI兼容性问题引发讨论,其安全机制(如校验器)已能有效防御多数漏洞。特别值
2025-08-19 03:03:46
777
原创 Managing sysctl knobs with BPF
摘要:Linux内核的sysctl机制通过/proc/sys暴露系统参数,但缺乏细粒度访问控制。Andrey Ignatov提出的补丁引入BPF_PROG_TYPE_CGROUP_SYSCTL程序类型,通过控制组实现容器环境下对sysctl的精确管控。该方案允许BPF程序根据名称、当前值和新值进行访问决策,甚至修改待写入值。相比传统LSM安全模块,BPF方案具有控制组粒度的策略灵活性,体现了BPF在内核策略控制方面的优势。这反映了内核通过BPF替代复杂策略框架的趋势,在保持性能的同时提供更强的可定制性。(1
2025-08-18 13:22:51
328
原创 Concurrency management in BPF
摘要:eBPF引入了maps功能,使BPF程序之间及与用户空间进程共享数据成为可能,但也带来了并发问题。为此,BPF开发者增加了XADD指令和自旋锁机制来管理并发访问。自旋锁只能保护map中的单个结构体,且使用受到严格限制(如一次只能持有一个锁)。用户空间通过bpf()系统调用的BPF_F_LOCK标志间接使用自旋锁。与此同时,关于BPF内存模型的讨论仍在进行,开发者对是否采用与内核相同的内存模型存在分歧,主要争议点在于性能与可移植性的权衡。随着BPF在并发环境中的广泛应用,明确其内存模型变得日益重要。
2025-08-17 09:57:05
580
原创 Binary portability for BPF programs
摘要: BPF程序虽基于通用虚拟机设计,但在不同架构间的可移植性仍受限,尤其是依赖内核结构体偏移量的跟踪程序。当前解决方案需即时编译并携带完整工具链,效率低下。为解决这一问题,开发者提出将结构体偏移信息嵌入BTF格式,通过libbpf在加载时动态重定位,并引入运行时变量替代预处理分支。此外,还需处理全局变量、只读数据及类型匹配等复杂问题。虽然部分极端情况仍无法解决,但该方案有望显著提升常用BPF工具(如BCC集合)的跨平台兼容性,降低嵌入式场景的部署成本。(149字) 关键点: 问题核心:内核结构体偏移量差
2025-08-16 09:47:24
805
原创 Improving control over transparent huge page use
摘要:透明大页(THP)能提升性能但也可能因内存碎片降低效率,当前内核提供了多种控制机制但仍有不足。最新补丁为prctl()添加了PR_THP_DISABLE_EXCEPT_ADVISED选项,允许进程禁用THP同时保留特定区域的启用能力。此外,开发者正探索通过BPF程序动态控制THP分配,包括页面大小选择,但担心过早固化接口会影响后续改进。目前相关补丁仍在评审中,BPF方案虽具前景但需谨慎推进以避免长期支持负担。内存管理开发者寻求在灵活性与稳定性间取得平衡的解决方案。
2025-08-15 23:01:40
565
原创 6.17 Merge window, part 1
Linux 6.17合并窗口进展:已合并4000+非合并更改集,主要涉及核心内核和文件系统优化。重点更新包括:x86架构安全增强、Arm系统新功能支持、Btrfs大页实验性功能、EROFS元数据压缩、ext4缓冲I/O改进等。硬件支持新增多款设备驱动,安全方面引入新的完整性保护API。目前仍有7500+提交待处理,预计合并窗口将于8月10日关闭。
2025-08-15 06:28:43
621
原创 Some advanced BCC topics
BPF虚拟机正逐步应用于更多内核子系统。BCC(BPF编译器集合)不仅提供管理工具,还支持开发者创建自定义BPF工具。文章详细介绍了BCC开发环境,演示如何通过TRACEPOINT_PROBE宏将程序附加到内核tracepoint(如kmalloc调用),并利用BPF_HASH映射统计函数调用次数。同时探讨了BCC的调试功能,包括编译控制、字节码输出和运行时日志,并对比了trace_pipe与BPF_PERF_OUTPUT两种输出方式的优劣。最后预告将介绍用户态USDT探针的应用。全文通过具体代码示例(如k
2025-08-14 10:57:12
862
原创 Warning about WARN_ON()
内核开发中关于错误处理机制的争议:多年来开发者被建议用WARN_ON()替代会导致系统崩溃的BUG_ON(),但如今WARN_ON()也面临质疑。当系统启用panic_on_warn时,WARN_ON()实际效果等同于BUG_ON(),可能引发大规模宕机。最新编码规范修改建议改用dev_warn*()等不会导致崩溃的警告方式,但这引发核心开发者分歧——有人认为该修改"比错误更错误",而维护者Greg K-H则支持减少WARN_ON()使用。这场争论折射出内核开发在系统稳定性与错误可见性之
2025-08-13 22:55:44
799
原创 Using user-space tracepoints with BPF
本文介绍了用户静态定义跟踪(USDT)探针的技术原理和应用方法。USDT探针源自Sun的DTrace工具,为用户空间代码提供了一种低开销的动态插桩方式。文章详细讲解了如何在Linux系统中使用BPF编译器集合(BCC)工具来操作USDT探针,包括tplist查看可用探针、trace工具跟踪探针数据等。通过实际示例,展示了如何为自定义C程序添加USDT探针,并利用BCC工具进行监控和分析。USDT探针技术已广泛应用于MySQL、Java、Node.js等主流软件中,帮助开发者以极低性能损耗诊断生产环境中的应用
2025-08-12 03:06:08
519
原创 An introduction to the BPF Compiler Collection
本文介绍了BPF编译器集合(BCC)项目,它解决了eBPF开发中的关键痛点:无需内核源码即可编写、编译和加载eBPF程序。BCC提供Python/Lua前端、丰富的工具链和100多个示例,显著降低了eBPF开发门槛。通过"Hello World"示例展示了BCC的高效工作流程:用Python编写简短程序,自动完成编译加载,并实时输出内核跟踪信息。文章还演示了argdist.py和btrfsdist.py等实用工具,它们能统计函数调用次数、绘制延迟直方图等。预告下篇将深入探讨eBPF数据结
2025-08-11 10:35:44
939
原创 A thorough introduction to eBPF
摘要: eBPF(扩展伯克利数据包过滤器)是Linux内核中的虚拟机技术,最初用于网络包过滤,现已发展为通用内核编程工具。其核心优势在于安全性和高性能:通过严格的内核验证器确保程序无循环、内存安全,并利用JIT编译提升执行效率。eBPF程序可挂载到多种内核事件(如网络流量、系统调用、性能事件),实现实时监控、调试和网络优化。数据结构上,eBPF通过多种Map类型(哈希表、数组等)实现内核与用户空间的数据交互。开发工具链(如LLVM、BCC)支持C语言编写eBPF程序,降低了使用门槛。典型应用包括XDP高性能
2025-08-11 04:18:06
912
原创 Notes from the LPC tracing microconference 2017
2017年Linux Plumbers大会举行的"跟踪和BPF"微型会议探讨了多项内核和用户空间跟踪技术。会议讨论了BPF映射自省方案、堆栈跟踪优化、kprobes改进建议、uprobes性能问题解决方案,以及通用跟踪格式(CTF)的应用前景。Facebook工程师分享了全天候跟踪中遇到的堆栈转换和kprobes管理问题,提出了通过内核直接解析地址、改进perf事件子系统等解决方案。会议还探讨了BPF工具集的扩展,包括BCC工具专业化存储需求。这些讨论反映了Linux跟踪技术在实际大规模
2025-08-10 03:27:58
495
原创 Extending run-time verification for the kernel
Linux内核运行时验证系统迎来重大升级,通过引入线性时序逻辑(LTL)支持来扩展属性检查能力。开发人员Nam Cao提交的补丁系列经过11次迭代后进入linux-next树,即将合入主线内核。新方案采用Büchi自动机将LTL表达式编译为状态机,相比手工编写更高效,能表达"始终"、"最终"等时序约束。典型应用包括检测实时任务优先级反转、验证锁的正确释放等。虽然当前代码生成器功能基础,但已显著简化复杂属性的实现难度,有望推动内核各子系统开发更精细的运行时验证机制。该优
2025-08-09 13:51:41
1025
原创 A proxy-execution baby step
Linux代理执行技术取得重大进展 摘要:Linux内核开发团队为解决优先级反转问题,在6.17版本中推进了代理执行技术的关键进展。该技术允许被阻塞的高优先级任务将CPU时间"借给"锁持有者执行,比传统的优先级继承方法更全面。当前补丁实现了同一CPU上的代理执行逻辑,包含任务状态跟踪、时间片计算等核心机制,但仍需解决跨CPU执行等复杂情况。后续将通过"捐赠者迁移"实现不同CPU间的代理执行。这项持续多年的开发工作已进入最后阶段,待完善后将显著提升系统调度效率。 (字数
2025-08-07 22:46:07
709
原创 Rethinking the Linux cloud stack for confidential VMs
摘要: 公有云存在隐私性局限,Linux虚拟机隔离无法完全阻止云服务商访问内存。机密计算技术通过加密内存保护客户数据,但需重构Linux云栈以平衡性能与安全。虚拟化依赖硬件隔离机制(如x86特权等级、IOMMU)和软件层(KVM、cgroups),机密计算新增隔离层防止主机入侵。性能优化中,I/O直通技术(如DPDK、vDPA)加速网络却削弱安全审计,体现虚拟化根本矛盾。解决方案如AMD SEV-TIO通过加密DMA避免跳板缓冲区,TDISP标准实现设备与VM的互信认证,但需全栈改造且面临厂商支持不足。启动
2025-08-07 11:02:56
896
原创 Last-minute control-group BPF ABI concerns
Linux 4.10合并的BPF控制组过滤功能引发争议。该特性允许将BPF程序附加到控制组来过滤进程网络流量,但其设计存在三个主要问题:1) 使用bpf()系统调用而非控制组接口实现;2) 层级过滤语义不符合预期(仅执行最底层过滤器);3) 缺乏安全模型,可能成为攻击向量。尽管开发者Andy Lutomirski等提出质疑,但维护者Alexei Starovoitov认为当前实现足够合理,安全改进可后续进行。若不修改就在4.10发布,这些设计缺陷可能永久固化,为未来埋下兼容性和安全隐患。
2025-08-06 07:56:20
477
原创 Persistent BPF objects
Linux内核4.4版本引入了BPF对象的持久化机制,通过创建特殊的/sys/fs/bpf虚拟文件系统,使BPF程序和maps能够超越创建进程的生命周期而持续存在。该方案采用bpf()系统调用的BPF_PIN_FD和BPF_GET_FD命令来管理持久化对象,取代了之前依赖守护进程保持文件描述符的临时方案。设计过程中考虑了FUSE文件系统、特殊命名空间和设备文件等多种实现方式,最终选择了更安全高效的内核虚拟文件系统方案。虽然当前未支持将BPF maps直接映射为文件系统对象,但该特性为网络流量控制和系统追踪等
2025-08-05 02:10:07
421
原创 The BPF system call API, version 14
摘要:BPF补丁集已更新至第14版,核心功能趋于稳定。新版本改用包含所有参数的单一union类型,简化了系统调用。主要功能包括map管理(创建/更新/查询/删除条目)和程序加载(需通过严格验证)。程序加载时移除了早期版本中的"fixup"数组,改为专用指令。虽然当前版本尚不支持将程序绑定到事件,但代码已进入net-next树,预计将随3.18内核发布。开发者持续优化API设计,两个月内迭代12个版本,展现了将其纳入主线的决心。
2025-08-04 10:21:20
476
原创 A report from the networking miniconference 2014
2014年内核峰会第二天举行了网络子系统开发者会议,重点讨论了多个技术议题。SCTP协议正计划重构以减少代码重复,网络层已实现支持动态调整大小的RCU保护哈希表以节省内存。eBPF开发引发争议,开发者被要求放慢提交速度以确保安全性。Netfilter研讨会上报告了连接跟踪代码去中心锁优化和小包处理性能提升的进展。nftables防火墙兼容层开发取得进展,但与iptables将长期共存。封装卸载技术中引入源端口号分流和远程校验和卸载等创新方案。会议还讨论了发送批处理优化、无线网络ARP代理节能方案、网络功能卸
2025-08-03 12:28:16
899
原创 A reworked BPF API
本文介绍了Linux内核中BPF虚拟机的重大改进。最新补丁集移除了全局ID机制,改用文件描述符管理BPF程序和映射,解决了资源泄漏和ID冲突问题。核心变化包括:1)通过单一bpf()系统调用加载程序,返回文件描述符而非数字ID;2)映射创建同样采用文件描述符机制;3)引入"修正数组"解决程序与映射的引用问题。虽然新方案使加载器需感知映射细节,但整体设计获得社区认可,预计将在3.17内核版本中合并。这些改进使BPF从单纯包过滤扩展到更广泛的内核编程场景。
2025-08-02 12:12:59
902
原创 Extending extended BPF
BPF(伯克利数据包过滤器)正从网络子系统扩展为通用的内核虚拟机。最新补丁集将BPF解释器移出网络代码,创建独立目录(kernel/bpf),并引入扩展BPF(eBPF)功能。关键改进包括:1)新增bpf()系统调用支持用户空间直接加载eBPF程序;2)严格的验证器机制确保程序安全性;3)引入共享键值存储"maps"实现内核-用户空间通信;4)支持将程序附加到socket和tracepoint。争议点包括GPL许可证强制要求及全局命名空间设计。该改动将BPF转变为更通用的内核内虚拟机,但
2025-08-02 07:04:01
841
原创 QUIC for the kernel
QUIC传输协议旨在解决TCP在现代互联网中的性能问题,如连接延迟、队头阻塞和协议僵化。尽管已承载大量网络流量,QUIC的Linux内核支持进展缓慢。最新补丁首次尝试将QUIC集成到内核,通过IPPROTO_QUIC协议类型提供类似TCP的接口,但TLS握手仍由用户空间处理。基准测试显示当前内核实现性能显著落后于TCP和内核TLS,主要由于缺乏硬件卸载支持和额外数据拷贝。随着硬件优化和代码完善,性能有望提升。虽然9000多行的初始补丁已提交,完整实现和审查仍需较长时间,预计最快2026年才能进入主线内核。该
2025-08-01 08:40:59
765
原创 How to write Rust in the kernel: part 3
摘要: 本文是内核Rust编程系列文章的第三部分,重点介绍了内核中Rust与C的通用绑定接口。主要内容包括: 内存分配:通过kernel::alloc模块实现堆分配,支持Kmalloc、Vmalloc和KVmalloc三种方式,提供Box和Vec等智能指针封装,确保安全性和灵活性。 自引用结构:通过Pin机制处理内核中的自引用结构(如双向链表),避免移动导致的内存损坏,并简化初始化流程(如pin_init!宏)。 锁机制:支持Rust风格的锁(如Mutex、自旋锁和RCU锁),利用生命周期系统确保访问数据时
2025-08-01 03:45:03
802
原创 Scheduler medley: time-slice extension, sched_ext deadline servers, and LRU batching.
Linux调度器近期迎来多项重要改进:1. 用户空间关键区抢占延迟机制(Prakash Sangappa补丁系列)允许线程持锁时获得额外30μs执行时间,通过rseq结构实现,支持按进程配置;2. sched_ext调度类将引入deadline server(Joel Fernandes实现),确保自定义调度器任务至少获得5%CPU时间,避免被实时任务完全抢占;3. 内存管理优化(Frederic Weisbecker方案)禁止对隔离CPU远程触发LRU批处理,改为在系统调用返回时处理,保障CPU隔离承诺。
2025-07-31 23:19:06
1326
原创 BPF: the universal in-kernel virtual machine
本文探讨了Linux内核中BPF(Berkeley Packet Filter)技术的演进与应用扩展。BPF最初作为网络数据包过滤工具,经过多次迭代已发展为支持JIT编译、64位寄存器和内核函数调用的通用虚拟机(internal BPF)。3.15内核将其分为经典BPF和内部BPF两个版本,后者性能显著提升且正向网络子系统外扩展,如用于安全计算(seccomp)和追踪过滤(tracepoint)。Alexei Starovoitov的补丁显示,用BPF替代原有追踪过滤器可使执行效率提升20倍以上。虽然当前B
2025-07-31 09:08:07
603
原创 A JIT for packet filters
BPF(伯克利数据包过滤器)是Linux网络协议栈中用于高效过滤网络数据包的关键机制。最新补丁通过引入JIT编译器,将BPF程序直接转换为x86汇编指令,使单次过滤操作提速50纳秒。该技术虽目前仅支持x86-64架构,但其成功验证了内核级JIT编译的可行性。文章还探讨了将类似优化应用于iptables的可能性,并指出基于BPF理念的nftables可能更具发展潜力。这一突破性改进为高流量场景下的数据包处理提供了显著的性能提升。
2025-07-30 05:28:44
508
原创 Dynamic DMA mapping using the generic device
本文介绍了Linux内核中的DMA API,分为基础API(Part I)和针对非一致性内存平台的扩展(Part II)。基础API包含:1)一致性内存分配dma_alloc_coherent/free;2)小型缓冲区的DMA内存池管理dma_pool_create/alloc/free;3)地址限制检查dma_set_mask;4)流式DMA映射dma_map_single等。特别说明了不同DMA方向(TO_DEVICE/FROM_DEVICE/BIDIRECTIONAL)的同步要求,以及物理连续性和对齐
2025-07-29 05:44:04
1186
原创 Allowing BPF programs more access to the network
在Linux峰会上,Mahé Tardy讨论了开发Tetragon(基于BPF的安全监控软件)时遇到的挑战,主要聚焦两个方向:1)探索让BPF程序直接通过网络发送数据以消除用户空间拷贝,提出了vmsplice()或io_uring等实现方案;2)为BPF防火墙添加发送TCP reset包的能力,以更优雅地终止连接。虽然讨论未形成最终结论,但展示了BPF在安全监控领域的技术潜力,包括可能完全移除用户空间组件以增强安全性。与会者就技术可行性展开探讨,提出了netconsole等替代方案,总体上对扩展BPF功能持
2025-07-27 10:30:19
753
原创 Virtual machine scheduling with BPF
Vineeth Pillai在2024 Linux峰会上提出利用BPF优化虚拟机性能的方案,通过宿主机与客户机共享调度信息来减少"双重调度"开销。该方案使用共享内存和BPF程序进行调度决策,引发了关于实现方式的讨论,包括是否使用tracepoint或struct_ops回调、如何避免死锁等问题。虽然对BPF干预调度器存在担忧,但与会者普遍认可解决双重调度问题的价值。该补丁集已更新至第二版,正在开发第三版以回应维护者反馈。
2025-07-27 01:42:15
735
原创 Enforcement (or not) for module-specific exported symbols
Linux 6.16内核引入新的模块特定符号导出机制EXPORT_SYMBOL_GPL_FOR_MODULES,允许将符号仅导出给指定GPL许可的内建模块。该机制旨在解决内核开发者既不愿广泛导出关键符号,又需要支持某些内建模块的特殊需求。虽然最初计划加入强制验证机制确保仅限内建模块使用,但因可能影响开发者工作流而取消,最终仅保留宏名称变更。目前该机制尚无实际用例,但已有多个潜在应用场景准备中。该变更延续了Linux社区通过许可声明而非技术强制来规范符号使用的传统,在保持开放性的同时明确开发意图。
2025-07-26 05:03:48
1153
原创 SFrame-based stack unwinding for the kernel
摘要:内核开发社区正通过SFrame项目解决perfevents子系统在用户空间调用栈展开的效率问题。传统方法依赖帧指针或复杂的DWARF格式,前者影响性能,后者难以在内核实现。SFrame作为轻量级ORC格式的衍生方案,通过紧凑的ELF区段存储调用帧信息,支持高效栈展开。目前补丁系列分三部分推进:1) 添加延迟展开基础设施;2) 集成perfevents支持;3) 实现SFrame解析。尽管仍需完善共享库跟踪等细节,这项持续多年的工作已接近完成,未来将实现跨越内核/用户空间的高效统一性能分析。
2025-07-24 13:05:44
623
原创 A RDRAND followup
摘要:x86 CPU硬件随机数生成器(RDRAND/RDSEED)的可靠性问题引发讨论,Intel确认RDRAND在正常设备中不会故障,而RDSEED可能在高压下失效。保密计算应用依赖RDRAND即可确保安全。Linux内核维护者提交补丁优化错误处理,包括启动时用RDRAND播种失败则系统panic,但移除重试机制的修改因兼容旧CPU暂被搁置。相关补丁获开发者认可,标志着该问题阶段性解决。(149字)
2025-07-24 01:05:15
388
原创 Pitchforks for RDSEED
硬件随机数生成器(如x86的RDSEED和RDRAND指令)的安全性问题引发讨论。测试显示,多线程环境下RDSEED失败率高达97%,RDRAND也可能被耗尽管概率较低。这对依赖硬件熵源的机密计算(CoCo)构成重大威胁——若宿主机可耗尽随机数源,虚拟机安全将崩溃。内核开发者建议:1)添加重试机制;2)启动失败时警告;3)机密计算模式下直接panic。普通系统受影响较小,因内核能整合其他熵源。CPU厂商正评估是否需要微代码更新或架构调整。该问题再次引发对机密计算可行性的质疑。
2025-07-22 11:53:41
1177
原创 Cleaning up after BPF exceptions
摘要:Kumar Kartikeya Dwivedi自2023年开始为BPF添加异常支持,其工作分为两个阶段:2023年7月实现基本栈回溯,2024年2月新增资源释放机制。BPF异常机制独特之处在于无法被捕获且无类型区分,但会执行栈回溯。最新补丁通过创建栈映射表来跟踪和释放资源,解决了验证器原有漏洞。虽然存在对编译器变更影响合并的担忧,但Dwivedi认为运行时跟踪方案开销过大。该补丁集将整合现有栈检查代码进行优化,未来计划扩展支持更多资源类型。(150字)
2025-07-21 12:20:49
817
原创 Fixing a corner case in asymmetric CPU packing
Linux系统支持处理器架构中存在不同处理能力的CPU,如Arm的big.LITTLE系统和SMT架构。近期Ricardo Neri提交的补丁显示,在混合架构中调度器可能低效分配任务。SMT通过共享物理核心提高资源利用率,但性能提升有限。Linux通过降低SMT线程优先级来优化调度,5.16内核合并的补丁针对非对称CPU(如Intel Core+Atom组合)优化了调度策略,优先使用高性能核心而非SMT线程。测试显示性能有小幅提升,但个别场景出现下降。这标志着Linux对异构计算架构的持续优化。
2025-07-20 01:46:16
839
原创 Linux RDMA Maillist patchsets (Jul. 14 - Jul. 19, 2025)
本文介绍了Linux内核中的三项重要技术改进:1) GPU设备私有内存的P2P DMA访问支持,通过扩展内存管理接口和驱动程序回调,实现GPU与NIC等设备间的直接数据传输;2) PTP硬件时钟原始周期计数器的暴露机制,新增ioctl命令支持周期值与系统时间的关联转换;3) devlink健康报告器的可配置宽限期延迟机制,允许在用户定义的时间窗口内处理关联错误。这些改进分别优化了GPU计算性能、高精度时间同步和硬件错误恢复流程,显著提升了系统在特定场景下的运行效率。
2025-07-20 01:17:41
821
原创 Toward the unification of kselftests and KUnit
内核测试框架整合:KUnit与kselftests的融合之路 Linux内核长期存在两套独立测试框架:用户态的kselftests(2012年引入)和内核态的KUnit(2019年添加)。前者通过系统调用测试用户空间ABI,后者以内核模块形式验证内部函数。Thomas Weißschuh提出的补丁系列旨在将两者整合,使kselftests能以内核模块形式运行。关键技术包括:利用user-mode-helper功能创建隔离环境,采用内核自带的nolibc替代系统C库,并通过新增的EXPORT_SYMBOL_G
2025-07-17 12:34:24
929
原创 Kernel API specification and validation
摘要: 内核开发者承诺保持ABI稳定性以避免破坏用户空间代码,但缺乏明确的ABI定义和测试方法。Sasha Levin提出的"内核API规范框架"(第二版)试图通过宏定义系统调用、sysfs属性等接口的详细规范(如参数、返回值、错误码等),但当前方案仍不完整且会增加内核体积(每个API约4KB)。框架支持通过debugfs导出JSON/XML格式的规范数据,并引入Rust工具kapi进行版本差异检测,但自动化验证能力有限,主要依赖开发者主动维护规范。未来计划整合静态分析和模糊测试,但需社
2025-07-17 10:15:24
716
原创 Linux RDMA Maillist patchsets (Jul. 7 - Jul. 13, 2025)
摘要:该系列补丁对mlx5驱动的DMABUF内存管理进行了多项优化:1)动态选择最优页大小替代固定4KB配置,提升内存注册效率;2)修复页大小掩码处理缺陷,确保大页注册有效性;3)通过减少HCA的页表遍历次数降低缓存访问开销。同时引入RDMA新特性:统一CQ用户内存接口(支持虚拟地址/DMA-BUF)、标准化DMA句柄对象(支持TPH等扩展功能),并在mlx5驱动中实现完整DMAH基础设施。此外新增了AMDPensandoRDMA驱动支持,以及PCIe拥塞事件监测功能,通过ethtool计数器提供带宽压力可
2025-07-14 06:33:56
893
【人工智能领域】OpenVINO 2023.2生成式AI优化:多框架集成与大模型支持推动现实场景应用
2025-07-20
### 【视频处理领域】Intel VPP SDK与SVET 2.0技术概述:加速视频处理应用开发与优化Intel VPP SDK
2025-07-20
【云计算安全】多租户云环境中的内存DoS攻击:危害与防御机制设计
2025-07-15
硬件设计Mackay Peak PCIe IPU适配器技术详解:网络与存储加速功能综述
2025-07-12
【5G通信技术】基于AIML的英特尔平台优化:动态无线资源管理与节能方案设计
2025-07-14
【网络与边缘计算】CES定制代码发布流程解析:组件变更与新组件创建的合规性管理及应用
2025-07-10
人工智能面向企业AI推理与微调的多Arc GPU解决方案:中国市场的性能优化与TCO优势分析
2025-07-10
人工智能OpenVINO 2024.1发布:增强生成式AI工作负载与大语言模型性能优化及广泛支持
2025-07-10
### 文章总结:Intel以太网产品路线图与技术进展
2025-07-10
【密码学与硬件加速】基于SMx算法的QAT-Engine性能优化:中国国家标准加密算法在Intel平台上的实现与应用
2025-07-10
网络安全ReDMArk:绕过RDMA安全机制的攻击与防御策略分析-针对InfiniBand和RoCE架构的深入研究
2025-07-15
【电信基础设施】OTII标准演进与应用:边缘计算服务器在5G和AI场景下的部署与发展综述
2025-07-14
【工业自动化】开放过程自动化(OPA)标准与英特尔边缘控制技术:推动工业控制系统互操作性和安全性发展
2025-07-14
边缘计算英特尔实时边缘解决方案:工业控制与混合关键性工作负载优化设计英特尔在实时边缘
2025-07-14
【OpenVINO性能优化】性能提示与线程调度设置:CPU推理优化配置及应用场景分析
2025-07-14
【数据中心存储】基于Intel IPU的Cassandra集群优化:Apple大规模分布式数据库性能提升与成本降低方案探讨
2025-07-11
【网络硬件加速】96M精确匹配规则卸载方案:状态网关中大规模会话状态管理与硬件加速设计
2025-07-10
硬件管理基于Redfish协议的IPU服务器实现规划:IMC与ACC更新及安全管理接口设计
2025-07-10
【网络与边缘计算】CES定制代码发布流程详解:从开发到发布的全流程管理及工具使用培训介绍了CES(客户
2025-07-10
PF42-Keysight VNA-Summary-(rev1)-2025-07-16c-CIWG.xlsx
2025-08-17
C语言面试题汇总:涵盖数据结构、算法及编程技巧
2025-08-17
IB Specification Vol 2-Release-2.0-Final-2025-07-31
2025-08-12
IB Specification Vol 2-Release-2.0-Final-2025-07-31 - 3
2025-08-12
IB Specification Vol 2-Release-2.0-Final-2025-07-31 - 4
2025-08-12
IB Specification Vol 2-Release-2.0-Final-2025-07-31 - 2
2025-08-12
IB Specification Vol 2-Release-2.0-Final-2025-07-31 - 1
2025-08-12
【网络通信领域】2025年IBTA NDR VNA合规电缆性能参数汇总:多厂商高速数据传输线缆规格对比分析
2025-08-11
IB Specification Vol 1-Release-2.0-Draft-2025-07-23 - 1
2025-07-29
IB Specification Vol 1-Release-2.0-Draft-2025-07-23 - 7
2025-07-30
IB Specification Vol 1-Release-2.0-Draft-2025-07-23 - 6
2025-07-30
IB Specification Vol 1-Release-2.0-Draft-2025-07-23 - 5
2025-07-30
【InfiniBand架构】InfiniBandTM架构规范第1卷:2.0版本发布-通用规范最终版(2025年7月31日)
2025-07-31
网络通信IBTA 2025 NDR VNA合规电缆规格与接口类型汇总:各类厂商产品参数对比分析
2025-07-30
IB Specification Vol 1-Release-2.0-Draft-2025-07-23 - 2
2025-07-29
IB Specification Vol 1-Release-2.0-Draft-2025-07-23 - 4
2025-07-30
IB Specification Vol 1-Release-2.0-Draft-2025-07-23 - 3
2025-07-30
通信技术Intel CPU在5G基站中的应用与优化:从RAN架构到功耗管理的全面解析
2025-07-20
【人工智能大模型训练】大规模LLM系统并行计算与网络挑战分析:Gaudi系列芯片及IPU解决方案设计了大规模语言模型
2025-07-20
### 文章总结:Intel CCID 平台解决方案与产品路线图(2023-2024)
2025-07-20
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人