2025 年,AIGC 热度再冲新高:从社交头像、电商海报到影视分镜,AI 生成内容已全面渗透日常创作。在这股浪潮中,Nano Banana、Qwen Edit 等通用图像编辑大模型功能强大,涵盖了广泛的图像编辑场景。特别是最新爆火的 Nano Banana Pro 能将文字指令转化为高精度图像,精准呈现复杂场景。但是上述图像编辑大模型在一些细分领域的表现仍有不足,并且用于简单任务性价比不高。
上海交通大学牛力团队自 2018 年底起便投身于图像合成(image composition)领域的研究。图像合成或者物体插入(object insertion),在 AIGC 社区中也被称为融图,是图像编辑领域的常用操作。基础用法是将一个前景物体插入到一张背景图片中,得到一张合成图。然而,通过简单的剪切粘贴得到的合成图往往存在很多问题,例如边缘出现锯齿状伪影、光照不和谐、缺失阴影和反光、透视角度不合理等。图像合成领域的研究工作致力于解决上述问题,将不同图片的元素有机融合,实现逼真的合成效果。
从 2018 年到 2025 年,牛力团队在图像合成领域积累了丰富的资源和成果。团队构建了 10 + 数据集,开发了 30 + 原创模型,并发表了 25 + 高质量学术论文。2023 年底,团队推出了 Libcom 工具箱(github.com/bcmi/libcom),无需进行训练微调,能够对任意图片实现开箱即用的图像合成功能。2025 年,团队将 Libcom 全面升级,并围绕 Libcom 的功能开发了便于用户使用的 Libcom 图像合成工作台。和通用图像编辑大模型不同,Libcom 工作台专注于图像合成领域,包括生成、检测、评估共计 12 项功能。
工作台界面如下,用户简单注册后即可登录。工作台配有详细的功能介绍和说明文档。

Libcom 工作台访问链接:http://libcom.ustcnewly.com/
进入工作台后可以看到 12 项功能,大致分成 6 组:
- 基础合成:alpha 混合、泊松融合
- 图像和谐化:颜色迁移、图像和谐化、艺术图像和谐化
- 背景效果生成:阴影生成、倒影生成
- 分析工具:不和谐区域检测、物体放置合理性热力图
- 打分工具:和谐度分数、物体放置合理性分数
- 高级合成:集成了 FLUX-Kontext 和 InsertAnything 两个模型

接下来我们以 Labubu 为前景主人公,探索一下 Libcom 工作台的功能,并和 Nano Banana Pro 过过招吧。
Labubu 首次出场,惬意地躺在水里。Libcom 将 Labubu 无缝融入水中。Banana Pro 表现很不稳定,通过调节提示词得到的最接近结果如下。

Labubu 来到森林公园,发现自己和背景的光照不太和谐。先用 Libcom 检测不和谐的区域,Libcom 认为 Labubu 和背景不和谐。然后让 Banana Pro 检测一下,Banana Pro 也是这么认为的。和 Banana Pro 的结果相比,Libcom 结果少了两条胳膊,可能是因为两条胳膊和路面颜色比较接近。

再让 Libcom 输出和谐度评分,进行 double check! Libcom 打分 0.391,分数很低,Harmony level poor。然后让 Banana Pro 给和谐度打个分,0.24 分,英雄所见略同!

既然不和谐,就用图像和谐化调整 Labubu 的光照,让它与背景和谐。Libcom 结果中,前景和背景看起来更加和谐了。Banana Pro 的结果背景色调有些变化,前景好像和谐化过头了。

Labubu 来到艺术世界,感觉和周围更不和谐了。干脆疯狂一点,来个疯狂涂鸦!调整 Labubu 的艺术风格,让 Labubu 也变成画作的一部分。下面是 Libcom 的结果和 Banana Pro 的结果,孰优孰劣,见仁见智吧。似乎 Libcom 更疯狂一点,Banana Pro 更保守一点。

Labubu 来到草原上,看着骏马奔驰,在草地上留下了长长的影子。Banana Pro 生成的影子复刻了前景物体的形状,但方向好像不对?

Labubu 来到小河边,想和小鹿们一起喝水,低头一看,水中倒映着自己的盛世美颜。Banana Pro 生成的倒影似乎太大太清晰了。

Labubu 之旅结束了,Banana Pro 的表现确实非常强悍,但仍有美中不足的地方。Libcom 图像合成工作台的更多功能,欢迎访问 http://libcom.ustcnewly.com/。学术合作和商务合作均可洽谈!
如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线科技企业深耕十二载,见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我们整理出这套 AI 大模型突围资料包:
- ✅ 从零到一的 AI 学习路径图
- ✅ 大模型调优实战手册(附医疗/金融等大厂真实案例)
- ✅ 百度/阿里专家闭门录播课
- ✅ 大模型当下最新行业报告
- ✅ 真实大厂面试真题
- ✅ 2025 最新岗位需求图谱
所有资料 ⚡️ ,朋友们如果有需要 《AI大模型入门+进阶学习资源包》,下方扫码获取~

① 全套AI大模型应用开发视频教程
(包含提示工程、RAG、LangChain、Agent、模型微调与部署、DeepSeek等技术点)

② 大模型系统化学习路线
作为学习AI大模型技术的新手,方向至关重要。 正确的学习路线可以为你节省时间,少走弯路;方向不对,努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划,带你从零基础入门到精通!

③ 大模型学习书籍&文档
学习AI大模型离不开书籍文档,我精选了一系列大模型技术的书籍和学习文档(电子版),它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。

④ AI大模型最新行业报告
2025最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

⑤ 大模型项目实战&配套源码
学以致用,在项目实战中检验和巩固你所学到的知识,同时为你找工作就业和职业发展打下坚实的基础。

⑥ 大模型大厂面试真题
面试不仅是技术的较量,更需要充分的准备。在你已经掌握了大模型技术之后,就需要开始准备面试,我精心整理了一份大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。

以上资料如何领取?

为什么大家都在学大模型?
最近科技巨头英特尔宣布裁员2万人,传统岗位不断缩减,但AI相关技术岗疯狂扩招,有3-5年经验,大厂薪资就能给到50K*20薪!

不出1年,“有AI项目经验”将成为投递简历的门槛。
风口之下,与其像“温水煮青蛙”一样坐等被行业淘汰,不如先人一步,掌握AI大模型原理+应用技术+项目实操经验,“顺风”翻盘!


这些资料真的有用吗?
这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。
资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。


以上全套大模型资料如何领取?

1495

被折叠的 条评论
为什么被折叠?



