loong_XL
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Qwen VLo :一个多模态统一理解与生成模型
通义千问VLO多模态模型创新性地将图像生成、编辑与理解功能集成于单一模型,支持文本到图像生成、局部/全局图像编辑(包括风格转换、背景替换等)以及复杂场景理解。该模型能根据文本指令自动完成图像创作与修改,同时具备精准的视觉问答能力。用户可通过在线Demo体验其强大的多任务处理能力,实现了从图像创作到智能分析的端到端解决方案。原创 2025-06-27 22:50:13 · 213 阅读 · 0 评论 -
AI前端页面、落地页生成:deepsite、Qwen Web Dev
本文介绍了两个基于AI的网页生成工具:deepsite和Qwen Web Dev。deepsite利用Hugging Face的推理API,结合DeepSeek-V3-0324模型生成HTML内容,默认使用TailwindCSS实现样式,确保输出为单HTML文件,并通过CDN加载TailwindCSS。Qwen Web Dev则支持直接部署,提供了多个部署示例,展示了其灵活性和易用性。这两个工具都强调了AI在网页生成中的核心作用,分别通过不同的技术栈实现高效、美观的网页生成。原创 2025-05-20 09:07:18 · 385 阅读 · 0 评论 -
AI免费工具-图像生成模型:豆包图像生成seedream使用
参考:技术模型。原创 2025-04-30 10:24:30 · 4863 阅读 · 0 评论 -
google 图像生成imageFX、Gemini2多模态大模型直接输出图片
labs.google也有音乐视频等ai工具。每次新的内容生成在新的会话里,不然会混淆冲突。支持图像编辑、动漫连续故事生成。原创 2025-03-13 08:53:05 · 476 阅读 · 0 评论 -
SANA 文生图模型模型案例
参考:https://github.com/NVlabs/Sana小模型高质量,支持中文,16g显存5秒内生成1080p图片在线demo:https://nv-sana.mit.edu/在线代码使用:https://colab.research.google.com/drive/1-4oeMykllGmvoymdeDQ4vy0_9ggQkhZ1?usp=sharinghttps://github.com/NVlabs/Sana/blob/main/asset/docs/model_zoo.mdFor原创 2025-01-11 10:32:30 · 197 阅读 · 0 评论 -
AI在线免费视频工具4:AI视频编辑ai-video-composer
使用自然语言从您的资产组成新的视频。添加视频、图像和音频资源,让 Qwen 2.5-Coder 为您生成一个新的视频(使用 FFMPEG)原创 2024-11-27 08:29:26 · 914 阅读 · 0 评论 -
AI免费logo贴到任何产品上:slap logo on anything
logo可以上传图片或图片url。prompt是写放到什么产品上。原创 2024-11-20 16:10:44 · 158 阅读 · 0 评论 -
免费实时AI图片编辑工具-多模态大模型 Qwen-Image-Edit、GPT-4o、grok、豆包、BAGEL、MagicQuill、OmniGen2
人工智能交互式图像编辑:可以制定涂改增加删除。原创 2024-11-18 20:52:17 · 456 阅读 · 0 评论 -
AI实时免费在线图片工具10:3D图像生成;CAD文件生成;人像表情精细调整控制
Hunyuan3D 支持文生和图生3d。原创 2024-11-07 16:21:22 · 634 阅读 · 0 评论 -
LayerDiffuse透明背景图像主题生成
在线colab测试,t4免费显卡可以测试。测试上传自己图片测试代码运行报错。原创 2024-11-01 15:37:43 · 120 阅读 · 0 评论 -
AI实时免费在线图片工具9:矢量图形图标生成,图文融合,产品背景生成,海报生成
下载的svg图形。原创 2024-10-30 14:54:27 · 1678 阅读 · 0 评论 -
live2d 实时虚拟数字人形象页面显示,对接大模型
运行的话还需要额外下载https://github.com/lyz1810/edge-tts支持语音。原创 2024-10-15 17:01:29 · 1460 阅读 · 0 评论 -
AI免费文档处理在线工具:ColPali文本检索文档
https://huggingface.co/spaces/manu/ColPali-demo 检索pdf。原理还是对比学习,图像和文本,文档通过图像模型,文本通过大模型gemma。原创 2024-10-12 11:39:16 · 323 阅读 · 0 评论 -
AI在线免费声音工具2:语音转录asr、文本生成声音
whisper。原创 2024-10-03 18:49:03 · 450 阅读 · 0 评论 -
数字人形象自定义制作:readyplayer
上面弄好后右上角点击next,创建的模型可以下载3d glb文件。支持上传照片和拍照,会自动识别变成卡通风格。其他选项是配置选项:穿着、样貌等。原创 2024-09-26 15:06:03 · 855 阅读 · 0 评论 -
未来数字世界相关技术、应用:AR/VR/MR;数字人、元宇宙、全息显示
元宇宙是一个虚拟的、扩展的现实空间,用户可以在其中进行社交、娱乐、工作、学习等各种活动。也可以拓展应用到数字孪生,数字孪生(Digital Twin)是一种通过数字模型对现实世界的物理实体或系统进行实时模拟和分析的技术。它通过收集物理实体的实时数据,将现实世界与数字世界连接起来,从而在虚拟空间中测试真实的场景。:数字人是指通过计算机技术创建的虚拟人物,这些人物可以具有逼真的外貌、行为和交互能力。数字人技术广泛应用于游戏、影视、虚拟现实(VR)和增强现实(AR)等领域,为用户提供沉浸式的体验。原创 2024-09-26 11:30:31 · 1258 阅读 · 0 评论 -
AI免费UI页面及代码生成 vibe code:v0、same、firebase
界面和claude类似,右侧展示效果和代码。原创 2024-09-19 16:29:21 · 1226 阅读 · 0 评论 -
免费AI播客生成:notebooklm可以生成播客的两个发言人谈论的内容,从各种来源如研究论文、文章
另外notebooklm他本身也是个rag知识库对话,可以直接聊天框对话。原创 2024-09-15 10:19:48 · 757 阅读 · 0 评论 -
diffusion 模型gguf量化使用案例,支持CPU运行
参考:https://github.com/leejet/stable-diffusion.cpp模型下载,大小4G左右推理,大概需要2G左右显存原创 2024-08-31 20:07:51 · 666 阅读 · 0 评论 -
AI免费PPT生成:kimiplus PPT助手、通义千问aippt、WPS 灵犀ppt生成、智普、skywork、腾讯文档
大模型生成内容一键点击生成ppt编辑保存。原创 2024-08-11 13:53:17 · 7800 阅读 · 2 评论 -
AI实时免费在线图片工具8:长文生成一致的图像;指定内容去除抠图;证件照生成
StoryDiffusionhttps://huggingface.co/spaces/YupengZhou/StoryDiffusion原创 2024-07-30 09:28:59 · 673 阅读 · 0 评论 -
AI实时免费在线图片工具7:人物写真生成;文本指导图片修改;全景图像生成
仅通过上传图片,然后就可以文字描述修改图片。3)其他kolors、星绘app。原创 2024-07-25 13:48:53 · 1081 阅读 · 0 评论 -
AIGC Kolors可图IP-Adapter-Plus风格参考模型使用案例
解决主要就是把报错的相关包的指定版本去掉即可。在上面cd Kolors下。原创 2024-07-20 11:00:36 · 2101 阅读 · 0 评论 -
AIGC工具:IPAdapter和ControlNet 指导控制生成工具
ControlNet强调对生成过程的直接控制,如通过线条、边缘、形状等信息;而IPAdapter侧重于风格迁移和内容的间接引导。IPAdapter 它专注于通过迁移图片风格来生成新的图像内容。IPAdapter的强项在于能够将一张图片的风格迁移到另一张图片上,实现风格融合,甚至可以进行多图风格的融合。它允许用户通过上传参考图片,结合特定的提示词,生成具有参考图片风格的新图像。原创 2024-07-19 15:27:09 · 2860 阅读 · 0 评论 -
AI实时免费在线图片工具2:人物风格参考、风景风格参考生成、模特换衣服
参考左侧风格图片,生成一直相似风格的猫。原创 2024-04-25 10:49:03 · 743 阅读 · 0 评论 -
AI在线免费声音工具1:音乐生成suno、udio、stableaudio;文字转声音
文生音乐。原创 2024-05-23 19:49:51 · 2139 阅读 · 0 评论 -
AI实时免费在线图片工具5:Glyph-ByT5图上添加文字显示;lorastudio各种风格图片生成;4M图片深度、边缘等信息获取
下面是画框,一个框要点击两下鼠标左键生成,及左上和右下坐标;下面box框内写上需要图片上显示的文字。参考:https://github.com/AIGText/Glyph-ByT5。原创 2024-06-18 11:14:58 · 551 阅读 · 0 评论 -
AI在线免费视频工具2:视频配声音FoleyCrafter;音频图片驱动hedra、hallo;图生视频ExVideo
https://www.videotosoundeffects.com/ (免费在线使用)原创 2024-06-18 17:30:57 · 1039 阅读 · 0 评论 -
AI免费文档处理在线工具:文档总结;论文阅读
NoteGPT 支持各种类型文档ppt、word、pdf等总结另外各种大模型工具一般都支持文档上传总结:例如kimi、通义等参考:https://blog.youkuaiyun.com/weixin_42357472/article/details/138205261。原创 2024-07-04 14:14:27 · 582 阅读 · 0 评论 -
AI实时免费在线图片工具6:以图生相似图;ai扩图;老旧照片修复
间接实现:可以是图片先提取描述,再通过描述再去生成新图片。原创 2024-07-08 17:21:43 · 2280 阅读 · 0 评论 -
AI实时免费在线图片工具1:文本生成图像、抠图去除背景及水印、图像高清增强分辨率
https://nuxt-sam-webgpu.labz2.com/ (sam分割算法)https://getimg.ai/realtime(支持任务、卡通形象实时生成)原创 2024-04-23 10:51:33 · 1313 阅读 · 0 评论 -
AI在线免费视频工具1:文生视频、风格转转换、生成数字人播报
https://dreamina.jianying.com/ai-tool/home (抖音下面)暂时只能选择平台上的模版进行图像创造。原创 2024-05-23 14:21:46 · 4400 阅读 · 0 评论 -
AIGC文生图lora微调训练案例;SD-Train界面训练stable Diffusion lora模型
lora仓库(1000多个lora微调模型分享):参考:tab=readme-ov-file (微调脚本基本也是上面官方diffusers的例子)训练时间有点久,200轮。原创 2024-07-03 10:13:28 · 1485 阅读 · 0 评论 -
AI在线免费视频工具3:声音生视频、视频驱动图片liveportrait/MimicMotion、视频描述生成
Noisee:通过声音生成对应视频,可以增加prompt指定生成内容相关视频。原创 2024-07-01 14:31:05 · 728 阅读 · 0 评论 -
diffusers accelerate多显卡文生图案例
【代码】diffusers accelerate多显卡文生图案例。原创 2024-06-24 09:43:24 · 693 阅读 · 0 评论
分享