SCREENCODER: ADVANCING VISUAL-TO-CODE GENERATION FOR FRONT-END AUTOMATION VIA MODULAR MULTIMODAL AGE

在这里插入图片描述

文章主要内容总结

本文提出了一个名为ScreenCoder的模块化多智能体框架,旨在解决将用户界面(UI)设计自动转换为前端代码(HTML/CSS)的问题。该框架通过三个可解释的阶段实现UI到代码的生成:

  1. ** grounding阶段**:利用视觉-语言模型(VLM)检测并标记UI组件(如侧边栏、页眉、导航栏等);
  2. ** planning阶段**:结合前端工程知识构建层级布局树,明确组件的空间关系和结构;
  3. ** generation阶段**:通过自适应提示合成生成HTML/CSS代码,并支持用户自然语言指令的交互设计。

此外,该框架还扩展为一个可扩展的数据引擎,能自动生成大规模图像-代码对,用于对开源VLM(如Qwen2.5-VL)进行冷启动监督微调与强化学习,显著提升其UI理解和代码生成能力。实验表明,ScreenCoder在布局准确性、结构一致性和代码正确性上达到了当前最优性能。

创新点

  1. 系统分析现有VLM的局限性:明确指出现有视觉-语言模型在UI到代码生成任务中存在的两大失效模式——理解错误(组件遗漏或误分类)和规划错误(组件位置错误或违反布局约束)。
  2. 模块化多智能体框架:将UI到代码生成任务分解为grou
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值