
Diffusion专门研究-SAM专门研究
文章平均质量分 77
本专栏针对大模型(Diffusion和SAM进行研究)
计算机视觉-Archer
专注于计算机视觉的[显著、伪装物体检测][图像分割][扩散模型]方向,分享“读论文-写论文-写代码”过程的爬坑经验~
展开
-
[完美有效] Accelerate的使用说明
后面修改直接找到这个yaml文件进行修改即可。这里写的是0,1但是实际使用的是0卡。终端输入指令,生成问答页面。原创 2023-11-27 12:10:10 · 18056 阅读 · 0 评论 -
[读论文][code运行教程]DiT Scalable Diffusion Models with Transformers
如果您使用train.py(见下文)训练了一个新的DiT模型,那么您可以添加——ckpt参数来使用您自己的检查点。例如,要从自定义256x256 DiT-L/4型号的EMA权重。原创 2023-11-16 13:30:54 · 3121 阅读 · 7 评论 -
[读论文][2s生成] SnapFusion: Text-to-Image Diffusion Model on MobileDevices within Two Seconds
通过改进的Step蒸馏和扩散模型的网络架构开发,我们引入的模型SnapFusion在不到2秒的时间内从移动设备上的文本生成512 × 512的图像,而图像质量与Stable difFusion v1.5[4]相似(参见图1中我们方法的示例图像)。A∈{A+,−Cross-Attention[i,j], A+,−ResNet[i,j]},其中A+,−表示在相应位置(阶段i,块j)移除(−)或添加(+)交叉注意或ResNet块的动作。模型尺寸的优化可以类似地进行,并留给未来的工作。原创 2023-06-13 01:38:30 · 785 阅读 · 0 评论