自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(161)
  • 收藏
  • 关注

原创 Building Bridges across Spatial and Temporal Resolutions: Reference-Based Super-Resolution via Chang

Fi1​γi​Fe​⊕Fi​⋅Fi​βi​Fe​⊕Fi​)Fi1​Fi​Fe​γi​⋅βi​⋅。

2024-10-22 13:57:33 777

原创 Plug-and-Play Diffusion Features for Text-Driven Image-to-Image Translation

IGI∗P。

2024-10-21 22:51:01 384

原创 Prompt-to-Prompt Image Editing with Cross Attention Control

II∗PP∗ϕzt​)QlQ​ϕzt​))KlK​ψP))vlV​ψP))MMij​j−thiEditMt​Mt∗​t。

2024-10-21 22:20:03 736

原创 Imagic: Text-Based Real Image Editing with Diffusion Models

etgt​eopt​eopt​etgt​etgt​eopt​eη⋅etgt​1−η⋅eopt​etgt​。

2024-10-21 21:45:55 1058

原创 DIFFEDIT: DIFFUSION-BASED SEMANTIC IMAGE EDIT- ING WITH MASK GUIDANCE

https://arxiv.org/pdf/2210.11427问题引入针对的问题是输入text prompt完成对图片的编辑,基于的是T2I model;本文的方法不需要额外提供mask来将任务变为inpaint任务,而是可以自动的根据text prompt来提取出需要编辑区域的maskmethods

2024-10-21 21:10:00 320

原创 High-Resolution Image Synthesis with Latent Diffusion Models

Dψ​DEx))qE​z∣xNz;Eμ​Eσ2​)zEμ​xEσ​x⋅ϵϵ∼N01。

2024-10-21 20:39:40 529

原创 Taming Transformers for High-Resolution Image Synthesis

Zzk​k1K​⊂Rnz​nz​EGxzEx∈Rh×w×nz​zij​∈Rnz​zk​zq​qz:=argminzk​∈Z​∣∣zij​−zk​∣∣∈Rh×w×nz​zq​xGzq​GqEx)))qLVQ​EGZ∣∣x−x∣∣2∣∣sgEx)]−zq​∣∣22​β∣∣sgzq​−。

2024-10-19 18:30:30 527

原创 MasaCtrl: Tuning-Free Mutual Self-Attention Control for Consistent Image Synthesis and Editing

Is​Ps​PMs​M。

2024-10-19 15:53:39 761

原创 GLIDE: Towards Photorealistic Image Generation and Editing with Text-Guided Diffusion Models

μθ​xt​∣y)∑θ​xt​∣y)logpϕ​y∣xt​)μ​θ​xt​∣yμθ​xt​∣ys⋅∑θ​xt​∣y∇xt​​logpϕ​y∣xt​)ss↑↓ϵθ​xt​∣yϵθ​xt​∣∅s⋅ϵθ​xt​∣y−ϵθ​xt​∣∅))s≥1fx)gc)fx⋅gc)μ​θ​xt​。

2024-10-18 22:33:15 622

原创 SDEDIT: GUIDED IMAGE SYNTHESIS AND EDITING WITH STOCHASTIC DIFFERENTIAL EQUATIONS

x0∼p0​pdata​xtt∈01xtαtx0σtzz∼N0I)σt01→0∞)αt01→01]xt)pt​αt1σ1)p1​∼N0σ21Iα2tσ2t1t∼1αt∼0p1​∼N0I)t∇x​logpt​x)dxt−dtdσ2t)]​∇x​logpt​xdtdtdσ2t。

2024-10-18 20:59:53 1061

原创 Blended Diffusion for Text-driven Editing of Natural Images

xdmx^x⊙mx⊙1−m≈x⊙1−m)⊙x0​ϵθ​xt​t)x0​αt​​xt​​−αt​​1−αt​​ϵθ​xt​t​x0​DCLIP​xdmDc​CLIPimg​x⊙mCLIPtxt​d))x0​dDbg​x1​x2​mdx1​⊙1−mx2​⊙1−m))dx1​x。

2024-10-18 16:03:35 622

原创 Null-text Inversion for Editing Real Images using Guided Diffusion Models

II∗PP∗zT∗​⋯z0∗​z0∗​z0​{∅t1T​∅t​∅t1​tT⋯1NzT​​zT∗​min∅t​​∣∣zt−1∗​−zt−1​zt​​∅t​C∣∣22​。

2024-10-18 14:27:06 870

原创 Subject-Diffusion: Open Domain Personalized Text-to-Image Generation without Test-time Fine-tuning

La​La​β⋅tanhγ⋅S([La​he])heMLP([vFourierl)])La​βγSvl。

2024-10-18 10:44:22 827

原创 BLIP-Diffusion: Pre-trained Subject Representation for Controllable Text-to-Image Generation and Edi

https://proceedings.neurips.cc/paper_files/paper/2023/file/602e1a5de9c47df34cae39353a7f5bb1-Paper-Conference.pdfhttps://github.com/salesforce/LAVIS/tree/main/projects/blip-diffusion问题引入针对subject driven image generation的任务,首先根据BLIP2的训练方法训练一个multimod

2024-10-17 15:07:39 413

原创 Real-World Image Variation by Aligning Diffusion Inversion Chain

CRXGR{XR0​⋯XRT​}XGT​{XGT​⋯XG0​}⊕XGT​XRT​C∗。

2024-10-17 11:21:47 928 2

原创 ELITE: Encoding Visual Concepts into Textual Embeddings for Customized Text-to-Image Generation

vRN×dNNve∈Rp×p×dKlWKl​⋅e∗mVlWVl​⋅e∗m)∣∣v∣∣1​∣∣Vl∣∣1​。

2024-10-12 20:59:53 703

原创 Taming Encoder for Zero Fine-tuning Image Customization with Text-to-Image Diffusion Models

IxcT。

2024-10-12 20:12:12 396

原创 SSR-Encoder: Encoding Selective Subject Representation for Subject-Driven Generation

Iqcs​ct​Iqzq​∈RNq​×Dq​z0​∈RNi​×Di​WQ​WK​QKAt2p​Softmaxd​QKT​)zI​zk​k0K​kWkV​kVAt2p​cs​csk​At2p​VkT​kcsk​csk​。

2024-10-12 16:33:55 832

原创 FastComposer: Tuning-Free Multi-subject Image Generation with Localized Attention

Pw1​w2​⋯wn​}Ss1​s2​⋯sm​}mIi1​i2​⋯im​ij​∈12⋯nA∈01h×w×nAijk]ijkmMM1​M2​⋯Mm​}Ii1​i2​⋯im​ij​∈12⋯nAi​Ai∈01h×w)iAij​​mj​Lloc​m1​∑j1m​meanAij​​。

2024-10-11 17:07:14 887

原创 MoA: Mixture-of-Attention for Subject-Context Disentanglement in Personalized Image Generation

Lrouter​∣∣1−M⊙1−R∣∣22​R∣L∣1​∑l∈L​R0l​。

2024-10-09 22:03:36 978

原创 ORYX MLLM: ON-DEMAND SPATIAL-TEMPORAL UNDERSTANDING AT ARBITRARY RESOLUTION

H×WN×Np×p(Np×Np)2048×2048ld1​d2​d3​d3​4d2​16d1​fH​fL​fH​kvfL​q。

2024-10-09 10:36:30 739

原创 StoryMaker: Towards Holistic Consistent Characters in Text-to-image Generation

Fface​Fcharacter​Fface​Fcharacter​Ebg​E1​R1​Fface​E2​R2​Fcharacter​Ei​MLPCatE1​E2​Epos​ci​CatEbg​ReshapeEi​N×LD))ci​QZWq​ΔWq​Kt​ct​Wkt​ΔW。

2024-10-08 15:13:32 1209

原创 flow model

GpG​zGxGz)xpG​x)pdata​x){x1x2⋯xm∈pdata​x)G∗argmaxG​∑i1m​logpG​xi)xiGxfzzz1​z2​​xx1​x2​​]Jf​∂x1​∂z1​∂x2​∂z1​​∂x1​∂z2​∂x2​∂z2​​]zf−1x)Jf−1。

2024-09-10 20:45:58 801

原创 SimSwap: An Efficient Framework For High Fidelity Face Swapping

EncDecS​DecT​Enc−Decs​Enc−DecT​FeaT​IS​vS​vs​vr​vs​Di​m。

2024-08-26 14:57:51 765

原创 InstantID: Zero-shot Identity-Preserving Generation in Seconds

https://arxiv.org/pdf/2401.07519#page=9.73https://github.com/instantX-research/InstantID?tab=readme-ov-filehttps://github.com/instantX-research/InstantID/pull/89/files问题引入目标是生成和reference图片相符合的图片,特别是人脸;现在基于微调模型的方法例如dreambooth,text inversion,lora等需

2024-08-26 11:33:21 229

原创 Adversarial Diffusion Distillation

θϕψxs​αs​x0​σs​ϵxθ​​xs​s)Tstudent​τ1​⋯τn​}N4τn​1000sxθ​​x0​FDϕk​Fk​kxθ​​xθt​xψ​xθt​t)sgd。

2024-08-24 14:32:08 773

原创 Prompt-Free Diffusion: Taking “Text” out of Text-to-Image Diffusion Models

CVPR2024 SHI Labshttps://arxiv.org/pdf/2305.16223https://github.com/SHI-Labs/Prompt-Free-Diffusion问题引入在SD模型的基础之上,去掉text prompt,使用reference image作为生成图片语义的指导,optional structure image作为生成图片structure的指导来进行生成;使用SeeCoder来提取参考图片的embedding作为生成条件,且SeeCode

2024-07-04 10:58:30 452

原创 Uni-ControlNet: All-in-One Control to Text-to-Image Diffusion Models

FMGfi​mgi​{concatmfj​concatgi−1​fj​​i1ij132≤i≤12ij13​yF′M′{concatmm′fj​zerofj′​))concatgi−1​fj​zerofj′​))​i1ij132≤i≤12ij13​HFDNr​Zr​cl​normZr。

2024-07-04 10:16:59 874

原创 PixArt-Σ: Weak-to-Strong Training of Diffusion Transformer for 4K Text-to-Image Generation

ON2→OR2N2​。

2024-07-03 22:16:38 343

原创 PIXART-α: FAST TRAINING OF DIFFUSION TRANS- FORMER FOR PHOTOREALISTIC TEXT-TO-IMAGE SYNTHESIS

Siβ1i​β2i​γ1i​γ2i​α1​iα2i​]SSigSEi)Ei)Ei)Si。

2024-07-03 21:48:34 538

原创 T2I-Adapter: Learning Adapters to Dig out More Controllable Ability for Text-to-Image Diffusion Mode

512×51264×64Fc​Fc1​Fc2​Fc3​Fc4​}Fci​。

2024-07-03 21:04:17 557

原创 Pixel-Aware Stable Diffusion for Realistic Image Super-Resolution and Personalized Stylization

xyx′∈Rh∗w×cy′∈Rh∗w×cPACAQKVSoftmaxd​QKT​⋅VQtoQx′KtoKy′VtoVy′。

2024-07-01 20:58:10 1033 1

原创 DiffBIR: Towards Blind Image Restoration with Generative Diffusion Prior

深圳先进研究院&上海ai lab&港中文https://github.com/XPixelGroup/DiffBIRhttps://arxiv.org/pdf/2308.15070问题引入使用一个统一的框架来处理image restoration任务,包含图片超分BSR,图片去噪BID和人脸restoration BFR,分为两个阶段,第一个阶段是degradation removal来去掉与图片无关的退化信息,第二个阶段是generation module for los

2024-07-01 19:58:20 415

原创 SeeSR: Towards Semantics-Aware Real-World Image Super-Resolution

xyyxfxrep​fxlogits​fyrep​fylogits​LDAPE​Lr​fyref​fxrep​λLl​fylogits​fxlogits​)Lr​Ll​。

2024-07-01 17:04:38 1267

原创 IP-Adapter: Text Compatible Image Prompt Adapter for Text-to-Image Diffusion Models

N×dZ′AttentionQKVSoftmaxd​QKT​VQZWq​Kct​Wk​Vct​Wv​ZZ′ct​Z′′AttentionQK′V′Softmaxd​QK′T​V′QZWq​K′ci​Wk′​V′ci​Wv′​Wq​Wk′​Wv′​Wk​Wv​ZnewZ。

2024-06-20 18:01:58 1050

原创 Hierarchical Integration Diffusion Model for Realistic Image Deblurring

z∈RN×C′Xr​∈RHW×CQzKVSoftMaxQKTC​⋅V。

2024-06-19 20:08:23 897

原创 DiffIR: Efficient Diffusion Model for Image Restoration

ZCPENS1​PixelUnshuffleConcatIGT​ILQ​)))Z∈R4C′F′Wl1​Z⊙NormFWl2​ZWl​FF′QWdQ​WcQ​F′KWdK​WcK​F′VWdV​WcV​F′Wd​Wc​Q​∈RHW×CK∈RC×HWV∈RHW×CFWc​V。

2024-06-19 19:23:52 1143

原创 Humans in 4D: Reconstructing and Tracking Humans with Transformers

θ∈R24×3×3β∈R10M∈R3×NN6890X∈R3×kXMWW∈RN×kθb​∈R23×3×3θg​∈R3×3πRt)R∈R3×3t∈R3XxIθβπ。

2024-06-07 14:42:56 1014

原创 Scalable Diffusion Models with Transformers

I∈RH×W×3z∈R8H​×8W​×4T×ddTpγβγβαα。

2024-06-05 17:48:58 882

原创 Human Guided Ground-truth Generation for Realistic Image Super-resolution

IHIPosINeg)IHILLR−PosLR−NegL1​。

2024-06-05 13:29:00 567

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除