白天写代码,晚上追AI大模型,偶尔搞点八卦 开源动态|技术干货|实习机会|生态活动 我负责分享,你负责变强

  • AI 开源搜索
AtomGit 代码君

博客等级

码龄5年

企业官方账号

409
原创
3095
点赞
2873
收藏
2万+
粉丝
关注
私信

热门文章

  • 下载不再卡顿,OpenCV 中国镜像仓库正式启用 22911
  • 可以从马赛克图片中恢复密码的工具软件Depix 11549
  • 《GitCode 服务条款》 11151
  • 开源项目征集 | 优快云“开源加速器计划”之【开源技术栈选型Show】 10048
  • 《GitCode 隐私声明》 9909

分类专栏

  • G-Star
    45篇
  • 开源活动
    118篇
  • AtomGit
    31篇
  • xLLM
    1篇
  • 开源资讯
    135篇
  • G-Star校园行
    18篇
  • 开源项目
    151篇
  • 活动
    35篇
  • 开源加速器
    48篇
  • 开源人物
    9篇
  • GitTalk
    7篇
  • GitCode
    235篇
  • 我的第一个开源项目
    7篇
  • G-Star开源摘星计划
    59篇
  • 开源新闻
    63篇
  • 开源指南
    5篇
  • 开源评选
    27篇
  • 开源安全
    3篇
  • 开源游戏
    1篇
  • 开源融资
    4篇

最新评论

  • GitCode「开源星期六」第三期回顾:鸿蒙 AI 融合开发的新突破与实践路径

    优快云-Ada助手: 恭喜你这篇博客进入【优快云每天值得看】榜单,全部的排名请看 https://bbs.youkuaiyun.com/topics/620000474。

  • 腾讯混元HunyuanImage-3.0 上线GitCode,首个工业级原生多模态开源模型

    优快云-Ada助手: 恭喜你这篇博客进入【优快云月度精选】榜单,全部的排名请看 https://bbs.youkuaiyun.com/topics/619992419。

  • 腾讯混元HunyuanImage-3.0 上线GitCode,首个工业级原生多模态开源模型

    优快云-Ada助手: 恭喜你这篇博客进入【优快云月度精选】榜单,全部的排名请看 https://bbs.youkuaiyun.com/topics/619990922。

  • 腾讯混元HunyuanImage-3.0 上线GitCode,首个工业级原生多模态开源模型

    优快云-Ada助手: 恭喜你这篇博客进入【优快云月度精选】榜单,全部的排名请看 https://bbs.youkuaiyun.com/topics/619989929。

  • 腾讯混元HunyuanImage-3.0 上线GitCode,首个工业级原生多模态开源模型

    优快云-Ada助手: 恭喜你这篇博客进入【优快云每天值得看】榜单,全部的排名请看 https://bbs.youkuaiyun.com/topics/619953877。

xLLM

关注

分享

复制链接
分享到 QQ
分享到新浪微博
扫一扫
文章平均质量分 87
关注数:0 文章数:1 文章阅读量:476 文章收藏量:0

作者: AtomGit 代码君

这里是代码君 热爱开源、沉迷AI、痴迷写代码。 分享技术、活动机会、开发者故事,还有第一时间的开源圈情报。
展开

专栏收录文章

  • 默认排序
  • 最新发布
  • 最早发布
  • 最多阅读
  • 最少阅读
  • 揭秘 xLLM 背后的性能密码:昇腾 ATB 加速库如何成为大模型推理 “加速器”

    答案是肯定的,通过将首次 kenrel 计算出的 tiling 和 kernel 本身储存起来,后续需要使用该 kernel 和计算 tiling 时,优先寻找是否有可以复用的 kernel 和 tiling,如果有就不重复计算,从而减少 GraphOperation 的 Setup 耗时。观察使用 Setup、Execute 二级流水后的流水图可以发现:图与图之间的空泡仍然存在,其来源在于图的 Setup 过长导致图间的 Execute 下发间隔过大造成了 Device 侧的执行空泡。
    原创 2025-12-15 10:03:40  · 649 阅读  · 0 评论