随着 AI 模型规模不断攀升,开发者和工程团队对计算性能、资源利用率和执行效率的要求也愈发严格。也正因如此,AI 编译器正在成为硬件与应用之间的关键枢纽,为训练与推理提供高效执行和智能算力调度。
在这一趋势下,业内对前沿技术交流与最佳实践分享的需求也随之升温。越来越多的团队希望通过面对面的深入讨论,探索算力优化的新方法、验证落地路径、并从真实场景中汲取经验。
一直以来,由 HyperAI超神经主办的 Meet AI Complier 技术沙龙,汇聚科研机构、企业内的专家学者与一线工程师,从技术创新聊到应用攻坚,为大家搭建了交流平台。今年 7 月,北京站的第 7 期 Meet AI Compiler 技术沙龙圆满落幕,现场热烈讨论不断,技术干货引发持续互动!****
12 月 27 日,第 8 期 Meet AI Compiler 如约而至。 本期我们邀请了来自上海创智学院、TileAI 社区、华为海思、先进编译实验室等的多位专家,他们将带来从软件栈设计、算子开发到性能优化的全链路分享,内容涵盖 TVM 的跨生态互操作、PyPTO 的融合算子优化、TileRT 的低延迟系统、Triton 的多架构加速,呈现从理论到落地的完整技术路径。
报名已开启,席位有限~快来现场蹭干货,我们在上海等你!🫶
活动详情
⏰ 时间:12 月 27 日(周六)13:30-17:30
📍 地点:上海市徐汇区华发路 699 弄 3 号上海创智学院
👬 人数:150(现场座位有限,请尽早报名)
🙌🏻 报名链接:https://hdxu.cn/1CupU
扫码备注「AI 编译器」加入活动群:

嘉宾及议程
分享嘉宾
13:40-17:20

冯思远
上海创智学院助理教授、Apache TVM PMC
分享主题: TVM FFI: Open ABI and FFI for Machine Learning Systems
内容简介: TVM FFI 旨在解决机器学习系统生态割裂与互操作性难题。通过定义开放的 ABI 和 FFI 标准,该项目利用稳定的 C ABI 及 DLPack 实现零拷贝数据传递,打通了 PyTorch 等框架与底层编译器的连接。它支持跨语言高效调用,显著降低了多平台适配的工程成本。
观看本场分享,你将了解:
-
学习 TVM-FFI 通用标准,大幅降低跨语言 Mlsys 开发维护成本
-
了解并构建兼容未来的模块化 ML 生态

薛继龙
Tile-AI社区创始成员
分享主题: TileRT:面向低延迟大模型推理的软硬件探索
内容简介: 随着大模型跨入万亿参数,处理序列跨过百万 token,模型能力正在不断打破各项记录。然而,人们对模型极致计算速度的追求从未停止。一方面许多低延迟场景需要在秒级甚至毫秒级得到响应,如实时决策、博弈等场景;另一方面大模型训练进入 Agent 时代,超长序列的 rollout 时间成为主要瓶颈。
本报告介绍 TileRT 项目,从 AI 编译器、runtime、到架构设计的角度,思考如何构建针对极低延迟的大模型计算软件栈。
观看本场分享,你将了解:
-
了解大模型低延迟推理场景背景、重要性和未来展望
-
TileRT 的技术挑战与实践分享

汪超
华为海思软件工程师
分享主题: PyPTO:基于白盒编译的融合算子开发框架
内容简介: 本次分享聚焦华为新推出的融合算子开发框架 PyPTO。它基于 Tensor/Tile 编程范式,通过聚焦核内 SRAM 管理、跨平台 PTO 指令集和 MPMD 运行时等技术,结合 Human-In-The-Loop 调优,以白盒编译方式实现高性能与易用性的统一。
观看本场分享,你将了解:
-
掌握原生为 SIMD 架构设计的融合算子开发框架 PyPTO 的设计理念与核心架构
-
掌握 PyPTO 聚焦于发挥用户的专家经验的白盒编译思想与 Human-In-The-Loop 调优精髓
-
掌握利用 PyPTO 提供的可视化工具,快速在昇腾平台开发出高性能融合算子的完整流程

李嘉楠****
先进编译实验室研究员
分享主题: 面向 Triton 编译器的编译优化实践
内容简介: 本次分享聚焦面向 Triton 编译器的优化实践,系统介绍 Triton 的语言与编译器结构、生态演进与算子库开发方法,并深入覆盖 CPU、NPU、GPU 等多架构的关键优化技巧,展示构建高性能统一算子体系的完整路径。
观看本场分享,你将了解:
-
Triton 生态的最新进展
-
Triton 编译器在多架构(CPU/NPU/GPU)上的关键优化技术

神秘嘉宾 敬请期待
主办方及合作伙伴

HyperAI超神经(hyper.ai)作为国际领先的人工智能及高性能计算社区, 旨在通过提供行业资讯报道、数据集加速下载、在线教程演示、热门模型性能评测、前沿论文推荐、高价值成果解读、顶会日历集成等一系列服务,助力全球数据科学及⼈⼯智能⾏业的开发者及爱好者学习、理解、实践,与社区⼀起构建⼈⼯智能的未来。
访问官网: https://hyper.ai/

OpenBayes贝式计算是国内领先的高性能计算服务提供商,通过为新一代异构芯片嫁接经典软件生态及机器学习模型,进而为工业企业及高校科研提供更加快速、易用的数据科学计算产品,其产品已被数十家大型工业场景或头部科研院所所采用。
访问官网: https://openbayes.com/

上海创智学院是汇聚顶尖大学、头部企业和科研机构联袂建设的新型人才培养机构。学院坚持「以学生为中心、以前沿为牵引」的培养理念,通过超高规格的师资、超常措施的培养、超凡条件的保障,探索具有中国特色的 AI 领军人才培养方案,致力于培养中国 AI 领军人才,打造世界人工智能创新高地。

MLC.AI 社区成立于 2022 年 6 月,并由 Apache TVM 主要发明者、机器学习领域著名的青年学者陈天奇,带领团队上线了 MLC 线上课程,系统介绍了机器学习编译的关键元素以及核心概念。
2022 年 11 月,在 MLC.AI 社区志愿者的共同努力下,首个完整的 TVM 中文文档上线,并成功托管至 HyperAI超神经官网,进一步为对机器学习编译感兴趣的国内开发者,提供了接触并学习一门新技术的基础设置——文档。
MLC 线上课程: https://mlc.ai/
TVM 中文文档: https://tvm.hyper.ai/
活动支持

活动行:

扫码备注「AI 编译器」加入活动群

考虑到本场活动的场地空间情况,我们仅开放了 150 个到场名额,建议大家尽早报名锁定席位。
12 月 27 日 13:30-17:30,我们不见不散!
2223

被折叠的 条评论
为什么被折叠?



