活动预告丨上海创智/TileAI/华为/先进编译实验室齐聚上海，TVM/TileRT/PyPTO/Triton各显神通

原创于 2025-12-03 14:55:01 发布 · 239 阅读

5 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能 #AI #编译器 #线下活动

人工智能专栏收录该内容

112 篇文章

订阅专栏

随着 AI 模型规模不断攀升，开发者和工程团队对计算性能、资源利用率和执行效率的要求也愈发严格。也正因如此，AI 编译器正在成为硬件与应用之间的关键枢纽，为训练与推理提供高效执行和智能算力调度。

在这一趋势下，业内对前沿技术交流与最佳实践分享的需求也随之升温。越来越多的团队希望通过面对面的深入讨论，探索算力优化的新方法、验证落地路径、并从真实场景中汲取经验。

一直以来，由 HyperAI超神经主办的 Meet AI Complier 技术沙龙，汇聚科研机构、企业内的专家学者与一线工程师，从技术创新聊到应用攻坚，为大家搭建了交流平台。今年 7 月，北京站的第 7 期 Meet AI Compiler 技术沙龙圆满落幕，现场热烈讨论不断，技术干货引发持续互动！****

12 月 27 日，第 8 期 Meet AI Compiler 如约而至。 本期我们邀请了来自上海创智学院、TileAI 社区、华为海思、先进编译实验室等的多位专家，他们将带来从软件栈设计、算子开发到性能优化的全链路分享，内容涵盖 TVM 的跨生态互操作、PyPTO 的融合算子优化、TileRT 的低延迟系统、Triton 的多架构加速，呈现从理论到落地的完整技术路径。

报名已开启，席位有限～快来现场蹭干货，我们在上海等你！🫶

活动详情

⏰ 时间：12 月 27 日（周六）13:30-17:30

📍 地点：上海市徐汇区华发路 699 弄 3 号上海创智学院

👬 人数：150（现场座位有限，请尽早报名）

🙌🏻 报名链接：https://hdxu.cn/1CupU

扫码备注「AI 编译器」加入活动群：

在这里插入图片描述

嘉宾及议程

分享嘉宾

13:40-17:20

在这里插入图片描述

冯思远

上海创智学院助理教授、Apache TVM PMC

分享主题： TVM FFI: Open ABI and FFI for Machine Learning Systems

内容简介： TVM FFI 旨在解决机器学习系统生态割裂与互操作性难题。通过定义开放的 ABI 和 FFI 标准，该项目利用稳定的 C ABI 及 DLPack 实现零拷贝数据传递，打通了 PyTorch 等框架与底层编译器的连接。它支持跨语言高效调用，显著降低了多平台适配的工程成本。

观看本场分享，你将了解：

学习 TVM-FFI 通用标准，大幅降低跨语言 Mlsys 开发维护成本
了解并构建兼容未来的模块化 ML 生态

薛继龙

Tile-AI社区创始成员

分享主题： TileRT：面向低延迟大模型推理的软硬件探索

内容简介： 随着大模型跨入万亿参数，处理序列跨过百万 token，模型能力正在不断打破各项记录。然而，人们对模型极致计算速度的追求从未停止。一方面许多低延迟场景需要在秒级甚至毫秒级得到响应，如实时决策、博弈等场景；另一方面大模型训练进入 Agent 时代，超长序列的 rollout 时间成为主要瓶颈。

本报告介绍 TileRT 项目，从 AI 编译器、runtime、到架构设计的角度，思考如何构建针对极低延迟的大模型计算软件栈。

观看本场分享，你将了解：

了解大模型低延迟推理场景背景、重要性和未来展望
TileRT 的技术挑战与实践分享

在这里插入图片描述

汪超

华为海思软件工程师

分享主题： PyPTO：基于白盒编译的融合算子开发框架

内容简介： 本次分享聚焦华为新推出的融合算子开发框架 PyPTO。它基于 Tensor/Tile 编程范式，通过聚焦核内 SRAM 管理、跨平台 PTO 指令集和 MPMD 运行时等技术，结合 Human-In-The-Loop 调优，以白盒编译方式实现高性能与易用性的统一。

观看本场分享，你将了解：

掌握原生为 SIMD 架构设计的融合算子开发框架 PyPTO 的设计理念与核心架构
掌握 PyPTO 聚焦于发挥用户的专家经验的白盒编译思想与 Human-In-The-Loop 调优精髓
掌握利用 PyPTO 提供的可视化工具，快速在昇腾平台开发出高性能融合算子的完整流程

在这里插入图片描述

李嘉楠****

先进编译实验室研究员

分享主题： 面向 Triton 编译器的编译优化实践

内容简介： 本次分享聚焦面向 Triton 编译器的优化实践，系统介绍 Triton 的语言与编译器结构、生态演进与算子库开发方法，并深入覆盖 CPU、NPU、GPU 等多架构的关键优化技巧，展示构建高性能统一算子体系的完整路径。

观看本场分享，你将了解：

Triton 生态的最新进展
Triton 编译器在多架构（CPU/NPU/GPU）上的关键优化技术

在这里插入图片描述

神秘嘉宾 敬请期待

主办方及合作伙伴

在这里插入图片描述

HyperAI超神经（hyper.ai）作为国际领先的人工智能及高性能计算社区， 旨在通过提供行业资讯报道、数据集加速下载、在线教程演示、热门模型性能评测、前沿论文推荐、高价值成果解读、顶会日历集成等一系列服务，助力全球数据科学及⼈⼯智能⾏业的开发者及爱好者学习、理解、实践，与社区⼀起构建⼈⼯智能的未来。

访问官网： https://hyper.ai/

在这里插入图片描述