Midjourney的对手来了?深度体验Banana Pro+Libcom,看国产AI如何“玩转”Labubu!

2025 年,AIGC 热度再冲新高:从社交头像、电商海报到影视分镜,AI 生成内容已全面渗透日常创作。在这股浪潮中,Nano Banana、Qwen Edit 等通用图像编辑大模型功能强大,涵盖了广泛的图像编辑场景。特别是最新爆火的 Nano Banana Pro 能将文字指令转化为高精度图像,精准呈现复杂场景。但是上述图像编辑大模型在一些细分领域的表现仍有不足,并且用于简单任务性价比不高。

上海交通大学牛力团队自 2018 年底起便投身于图像合成(image composition)领域的研究。图像合成或者物体插入(object insertion),在 AIGC 社区中也被称为融图,是图像编辑领域的常用操作。基础用法是将一个前景物体插入到一张背景图片中,得到一张合成图。然而,通过简单的剪切粘贴得到的合成图往往存在很多问题,例如边缘出现锯齿状伪影、光照不和谐、缺失阴影和反光、透视角度不合理等。图像合成领域的研究工作致力于解决上述问题,将不同图片的元素有机融合,实现逼真的合成效果。

从 2018 年到 2025 年,牛力团队在图像合成领域积累了丰富的资源和成果。团队构建了 10 + 数据集,开发了 30 + 原创模型,并发表了 25 + 高质量学术论文。2023 年底,团队推出了 Libcom 工具箱(github.com/bcmi/libcom),无需进行训练微调,能够对任意图片实现开箱即用的图像合成功能。2025 年,团队将 Libcom 全面升级,并围绕 Libcom 的功能开发了便于用户使用的 Libcom 图像合成工作台。和通用图像编辑大模型不同,Libcom 工作台专注于图像合成领域,包括生成、检测、评估共计 12 项功能。

工作台界面如下,用户简单注册后即可登录。工作台配有详细的功能介绍和说明文档。

Libcom 工作台访问链接:http://libcom.ustcnewly.com/

进入工作台后可以看到 12 项功能,大致分成 6 组:

  1. 基础合成:alpha 混合、泊松融合
  2. 图像和谐化:颜色迁移、图像和谐化、艺术图像和谐化
  3. 背景效果生成:阴影生成、倒影生成
  4. 分析工具:不和谐区域检测、物体放置合理性热力图
  5. 打分工具:和谐度分数、物体放置合理性分数
  6. 高级合成:集成了 FLUX-Kontext 和 InsertAnything 两个模型

接下来我们以 Labubu 为前景主人公,探索一下 Libcom 工作台的功能,并和 Nano Banana Pro 过过招吧。

Labubu 首次出场,惬意地躺在水里。Libcom 将 Labubu 无缝融入水中。Banana Pro 表现很不稳定,通过调节提示词得到的最接近结果如下。

Labubu 来到森林公园,发现自己和背景的光照不太和谐。先用 Libcom 检测不和谐的区域,Libcom 认为 Labubu 和背景不和谐。然后让 Banana Pro 检测一下,Banana Pro 也是这么认为的。和 Banana Pro 的结果相比,Libcom 结果少了两条胳膊,可能是因为两条胳膊和路面颜色比较接近。

再让 Libcom 输出和谐度评分,进行 double check! Libcom 打分 0.391,分数很低,Harmony level poor。然后让 Banana Pro 给和谐度打个分,0.24 分,英雄所见略同!

既然不和谐,就用图像和谐化调整 Labubu 的光照,让它与背景和谐。Libcom 结果中,前景和背景看起来更加和谐了。Banana Pro 的结果背景色调有些变化,前景好像和谐化过头了。

Labubu 来到艺术世界,感觉和周围更不和谐了。干脆疯狂一点,来个疯狂涂鸦!调整 Labubu 的艺术风格,让 Labubu 也变成画作的一部分。下面是 Libcom 的结果和 Banana Pro 的结果,孰优孰劣,见仁见智吧。似乎 Libcom 更疯狂一点,Banana Pro 更保守一点。

Labubu 来到草原上,看着骏马奔驰,在草地上留下了长长的影子。Banana Pro 生成的影子复刻了前景物体的形状,但方向好像不对?

Labubu 来到小河边,想和小鹿们一起喝水,低头一看,水中倒映着自己的盛世美颜。Banana Pro 生成的倒影似乎太大太清晰了。

Labubu 之旅结束了,Banana Pro 的表现确实非常强悍,但仍有美中不足的地方。Libcom 图像合成工作台的更多功能,欢迎访问 http://libcom.ustcnewly.com/。学术合作和商务合作均可洽谈!

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线科技企业深耕十二载,见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我们整理出这套 AI 大模型突围资料包

  • ✅ 从零到一的 AI 学习路径图
  • ✅ 大模型调优实战手册(附医疗/金融等大厂真实案例)
  • ✅ 百度/阿里专家闭门录播课
  • ✅ 大模型当下最新行业报告
  • ✅ 真实大厂面试真题
  • ✅ 2025 最新岗位需求图谱

所有资料 ⚡️ ,朋友们如果有需要 《AI大模型入门+进阶学习资源包》下方扫码获取~
在这里插入图片描述

① 全套AI大模型应用开发视频教程

(包含提示工程、RAG、LangChain、Agent、模型微调与部署、DeepSeek等技术点)
在这里插入图片描述

② 大模型系统化学习路线

作为学习AI大模型技术的新手,方向至关重要。 正确的学习路线可以为你节省时间,少走弯路;方向不对,努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划,带你从零基础入门到精通!
在这里插入图片描述

③ 大模型学习书籍&文档

学习AI大模型离不开书籍文档,我精选了一系列大模型技术的书籍和学习文档(电子版),它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。
在这里插入图片描述

④ AI大模型最新行业报告

2025最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。
在这里插入图片描述

⑤ 大模型项目实战&配套源码

学以致用,在项目实战中检验和巩固你所学到的知识,同时为你找工作就业和职业发展打下坚实的基础。
在这里插入图片描述

⑥ 大模型大厂面试真题

面试不仅是技术的较量,更需要充分的准备。在你已经掌握了大模型技术之后,就需要开始准备面试,我精心整理了一份大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余

图片

以上资料如何领取?

在这里插入图片描述

为什么大家都在学大模型?

最近科技巨头英特尔宣布裁员2万人,传统岗位不断缩减,但AI相关技术岗疯狂扩招,有3-5年经验,大厂薪资就能给到50K*20薪!

图片

不出1年,“有AI项目经验”将成为投递简历的门槛。

风口之下,与其像“温水煮青蛙”一样坐等被行业淘汰,不如先人一步,掌握AI大模型原理+应用技术+项目实操经验,“顺风”翻盘!
在这里插入图片描述
在这里插入图片描述

这些资料真的有用吗?

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。
在这里插入图片描述
在这里插入图片描述

以上全套大模型资料如何领取?

在这里插入图片描述

将 `.lib`(通常为 Synopsys Design Constraints 格式的时序和逻辑描述文件)转换为 ATPG(自动测试图样生成)可接受的 Verilog `.v` 文件,通常需要借助 EDA 工具链中的特定工具来完成。在 Mentor Graphics 的 Tessent 工具套件中,可以通过 `libcomp` 工具进行此类转换。以下是一个标准流程,用于将 `.lib` 文件转换为适用于 ATPG 的 Verilog 模型。 ### 转换流程 #### 1. 使用 `libcomp` 生成 Verilog 模型 `libcomp` 是一个用于将 `.lib` 文件转换为 Verilog 或 VHDL 模型的工具,生成的模型可以用于仿真和 ATPG 分析。 基本命令如下: ```bash libcomp -f verilog -o output_file.v input_file.lib ``` 此命令将 `input_file.lib` 转换为 Verilog 格式,并保存为 `output_file.v`。生成的 Verilog 文件将包含标准单元的逻辑功能和时序信息,适合用于功能仿真和 ATPG 流程 [^1]。 #### 2. 生成适用于 ATPG 的库(ATPG lib) 为了使生成的 Verilog 模型适用于 ATPG 工具,可能需要进一步处理,包括添加扫描链支持、测试模式定义等。可以使用 Tessent 的 `model_shell` 或 `tessent` 命令进行 ATPG 模型的构建。 例如: ```bash tessent -model_shell -input_library output_file.v -output_library atpg_ready.v ``` 该步骤将生成一个适用于 ATPG 工具的 Verilog 模型,其中包含必要的 DFT(可测性设计)属性。 #### 3. 验证生成的 Verilog 文件 生成的 `.v` 文件可以使用 Verilog 仿真器(如 VCS、ModelSim、Incisive)进行功能验证,确保其逻辑行为与原始 `.lib` 文件一致。 ### 注意事项 - 在运行 `libcomp` 之前,确保已正确设置环境变量(如 `LM_LICENSE_FILE` 和 `PATH`)以指向 Tessent 工具的安装目录。 - `.lib` 文件应包含完整的逻辑和时序描述,以确保生成的 Verilog 模型能够准确反映实际单元的行为。 - 生成的 Verilog 模型可能需要额外的 DFT 插入(如扫描触发器替换)以支持 ATPG,这可以通过 Tessent 的 DFT 工具完成。 ### 示例脚本(Tessent Shell 脚本) ```tcl # 设置输入库 set_input_library my_stdcell.lib # 生成 Verilog 模型 generate_verilog_model -output my_stdcell.v # 构建 ATPG 模型 build_atpg_model -output my_stdcell_atpg.v ``` ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值