TextFlux重磅发布：告别复杂控制信号！多语种高保真场景文本编辑新时代

原创

于 2025-09-19 12:00:00 发布 · 830 阅读

15 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能

前言

在文本编辑领域，设想一种技术：无需复杂控制信号，只靠字形图像和少量训练数据，就能把文字“无缝”嵌入真实场景——中文招牌、日文海报、韩文标语，多语言统统适用。这就是 TextFlux 带来的全新体验，由bilibili人工智能平台部，联合北京大学王选所提出。

TextFlux 不再依赖 OCR 编码器和繁复的监督信号，而是把渲染好的字形直接贴进场景，让模型型专注学习“如何与周围环境自然融合”。思路直观，架构简洁，却能生成更真实、更快捷、更通用的多语言场景文本编辑效果。相关代码、权重和数据集均已开源。截至目前，该项目已支持ComfyUI，能够在消费级显卡上部署和运行。