编译器
文章平均质量分 57
luoganttcc
微信:luogantt2
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
什么是Triton
Triton是OpenAI开发的GPU编程语言和编译器工具链,它允许开发者使用Python编写高性能GPU内核,简化了传统CUDA编程的复杂性。Triton专注于深度学习领域,特别适合加速矩阵计算、注意力机制等常见操作。其核心优势在于:1)Python友好的编程接口;2)自动优化GPU内核性能;3)支持PyTorch自定义扩展。Hugging Face、Meta等公司已将其用于实际加速场景,显著降低了深度学习自定义算子的开发门槛。原创 2025-09-09 13:29:12 · 541 阅读 · 0 评论 -
总结一下 Triton: An Intermediate Language and Compiler for Tiled Neural Network Computation Triton
Triton是OpenAI开发的面向分块神经网络计算的中间语言和编译器,通过抽象分块操作和自动优化技术简化了高性能深度学习算子的开发。其核心设计包括Triton-C中间语言、基于LLVM的IR架构、分块级优化策略以及跨平台编译能力,支持NVIDIA、AMD等多厂商硬件。实际应用表明,Triton在矩阵乘法、卷积运算等任务上性能接近手工优化库,已被Meta、智源研究院等机构用于优化注意力机制和大模型训练。相比TVM等框架,Triton在灵活性、硬件亲和性和开发效率方面具有优势,仅需少量代码即可实现高效算子,同原创 2025-09-09 12:20:15 · 1442 阅读 · 0 评论 -
LLVM架构简介
然而,我们知道,一个平台最终运行的二进制可执行文件,实际上就是在运行与之等价的汇编代码。之所以说是「模拟」这一过程,是因为在真正的编译器中,必然是直接通过链接LLVM库的形式进行开发,上述的LLVM IR生成、优化、汇编代码生成,都是通过调用相应的函数来实现的,而非手动使用相应的程序来完成。介绍怎样通过LLVM的API来实现一个编译器(这个往往已经有了非常多的教程介绍),而是从LLVM IR的层面,让我们对LLVM有一个大致的认识,以方便我们之后真正实现编译器时,快速开发、调试相应的过程。原创 2025-04-25 08:26:18 · 778 阅读 · 0 评论 -
LLVM架构简介
然而,我们知道,一个平台最终运行的二进制可执行文件,实际上就是在运行与之等价的汇编代码。之所以说是「模拟」这一过程,是因为在真正的编译器中,必然是直接通过链接LLVM库的形式进行开发,上述的LLVM IR生成、优化、汇编代码生成,都是通过调用相应的函数来实现的,而非手动使用相应的程序来完成。介绍怎样通过LLVM的API来实现一个编译器(这个往往已经有了非常多的教程介绍),而是从LLVM IR的层面,让我们对LLVM有一个大致的认识,以方便我们之后真正实现编译器时,快速开发、调试相应的过程。原创 2025-04-24 08:58:17 · 1075 阅读 · 0 评论 -
【编译器】传统编译器和AI/ML编译器总结
本文总结了传统编译器和AI/ML编译器,可作为学习、研究、研发的参考资料。原创 2024-12-15 17:58:34 · 1350 阅读 · 0 评论 -
机器学习系统:设计和实现
给大家推荐一本非常好的书《 机器学习系统:设计和实现》双击这里 《 机器学习系统:设计和实现》特别是 AI编译器那一章写的非常好原创 2024-12-15 16:35:31 · 303 阅读 · 0 评论 -
gdb中x命令查看内存中内容
x是gdb提供的一个内置指令,用于灵活查看和操作内存内容。它的功能来源于调试器对符号表解析和目标内存访问的能力,通过直接访问程序的运行时内存,帮助用户检查数据结构、指针和变量内容等。后面的参数是为了让x命令更加灵活,支持指定数量、格式和单位大小。这种设计使得x命令不仅可以查看内存,还能以符合数据实际存储方式的格式来显示它,非常适合调试和分析内存内容。link。原创 2024-12-15 14:37:17 · 1494 阅读 · 0 评论 -
AI芯片软件栈--最近感悟
而对于选择riscv的公司,就省事很多,基于开源的riscv加上一堆intrinsic的支持,做少量的优化,就差不多了。4)基于tensor的ai编译器,工作在这个领域已经5-6年了,感觉没什么特别的东西了,可能新的idea还在出来(例如基于micro kernel),但要解决的就是那些问题。关键是基于芯片体系结构去解决问题,最终衡量标准是模型和程序的性能,如果基于达到手写或者硬件性能的90%以上了,应该也无所谓是基于tvm,还是mlir,或者是完全自研了。2)理解了1),算子库的状态就很好理解了。原创 2024-11-17 16:37:57 · 410 阅读 · 0 评论 -
ubuntu install qemu ERROR: Dependency “pixman-1“ not found, tried pkgconfig
【代码】ubuntu install qemu ERROR: Dependency "pixman-1" not found, tried pkgconfig。原创 2023-01-28 13:54:22 · 2202 阅读 · 0 评论 -
gdb qemu
印象中,甚至于明末崇祯,也动过抄勋贵肥国库以资军费的念头,而李自成攻破北京城后,帮他完成了这种想法。至于满清入主中原后,这种手法更是屡试不爽,杀一批,赏一批,明朝政府指挥不动的国家蛀虫们,被。送贾元春入宫、修大观园,在皇帝眼皮子底下蹦跶不够,还要摆阔炫富,生怕皇帝不反腐,不杀他们立典型。一旦上升到富人与蝼蚁,官僚与蝼蚁,官僚与富人,大官与小官。金字塔顶端的蛋糕,在没有科技爆炸时,还不进行对外扩张掠夺,那数量就几乎是恒定,你吃下一块,别人就少一块。死,贾元春薨,权力渐去的贾家,在某些高层人物的眼里,不也是。原创 2023-01-28 13:30:19 · 196 阅读 · 0 评论 -
LLVM_Ubuntu安装
【代码】LLVM_Ubuntu安装o。原创 2023-01-26 18:51:48 · 118 阅读 · 0 评论 -
x86各种jump
jmp x86原创 2022-09-21 09:36:40 · 171 阅读 · 0 评论 -
寄存器名称
:http://www.intel.com/products/processor/manuals/原创 2022-09-21 09:23:50 · 183 阅读 · 0 评论 -
Chris Lattner‘s Homepage LLVM 大神主页
网站链接As a high level summary, I am a well-known leader who is distinguished by ahands-on approach to building systems.For more information, please see:In January 2022, Tim Davis and I launched Modular AI to rebuild globalML infrastructure from the bott转载 2022-09-20 18:57:47 · 604 阅读 · 0 评论 -
详解三大编译器:gcc、llvm 和 clang
回顾 GCC 的历史,虽然它取得了巨大的成功,但开发 GCC 的初衷是提供一款免费的开源编译器,仅此而已。可后来随着 GCC 支持了越来越多的语言,GCC 架构的问题也逐渐暴露出来。但 GCC 到底有什么问题呢?LLVM 的优点也正是 GCC 的缺点。传统编译器工作的时候前端负责解析源代码,检查语法错误,并将其翻译为抽象的语法树(Abstract Syntax Tree)。优化器对这一中间代码进行优化,试图使代码更高效。转载 2022-09-20 18:52:52 · 1389 阅读 · 0 评论 -
LLVM基本概念入门
LLVM基本概念入门_c/c++_SiberiaBear的专栏-优快云博客LLVM目前的更新很活跃,请注意跟踪项目最新变更。转载 2022-09-20 18:22:31 · 1404 阅读 · 0 评论
分享