AppMall-优快云博客

原创 HiDream-I1：AI绘画，点石成金

HiDream-I1是一个拥有170亿参数的开源图像生成基础模型，并且在 huggingface 的文本到图像排行榜排名超过了 flux，以秒级的速度实现业界领先的图像生成质量，尤其是在提示词的遵循以及出图的质量以及美感上表现的都是相当的不错。一位有着发光蓝色纹身的生化武士，身背一把收在全息护甲中的武士刀，穿行于热闹的集市。所以在使用过程中，在提示词里越能用文字更具体、精准的表达想要的感觉，最终生成的图片质量越高、细节越丰富，这既是一个比较重要的使用技巧，也是几乎一切AI文生图大模型的使用门槛。

2025-05-07 14:10:39 976

原创 12条AI行业风向观察笔记

很少有人再提“AI四小龙”（商汤、旷视、依图、云从），C位变成了“AI六小虎”——月之暗面（Kimi）、百川智能（搜狗王小川）、智谱AI（清华系）、零一万物（李开复）、Minimax+阶跃星辰（都在上海，都是产品驱动）。许多企业都从以往单纯关注产品的能力，转向客户需求驱动、关注PMF（Product Market Fit），指的是产品市场匹配度，即产品如何和市场需求相结合，从而实现商业化的落地。商业落地必须做差异化，不能用自己的短板和竞争对手的长板去竞争，比如模型做不过国外那些开源的，就没必要做。

2025-04-28 16:35:42 680

原创赚钱利器！推荐几个适合小红书博主的 AI 应用

AI 技术的发展为我们提供了强大的助力，今天就给大家推荐几个适合小红书博主的 AI 应用，让创作变得轻松又高效，成为你赚钱路上的得力助手。此外，除了仿真场景（美食冒着热气）、主体动作（奔跑的动物、人物跳舞）之外，通过AppMall的不同应用生成视频，还还兼顾不同风格场景，比如卡通、数字人、名人，甚至可以实现视频场景下的AI换脸。

2025-04-27 17:22:35 485

原创数字人AI应用大对决：谁是你的创作利器？

总而言之，这些应用各有所长，现在访问appmall.ai，只需花费低至2.3元/小时，即可一站式体验和使用，还可以在不同应用之间来回切换，非常便捷。LivePortrait顾名思义，就是让照片动起来，这个功能其实和SkyReels-A1有些许类似，从实测体验来看，表情捕捉和真实性不如A1。A1在数字人场景主打“让照片动起来”，需要通过图片里的人脸/环境+视频里的动作/表情，生成一个新的视频。V1的数字人原型主要来自于创作者用文字的描述，支持非常细节的描述，然后投喂给AI，进行数字人生成。

2025-04-23 14:42:19 819

原创 Agent助你开启超级外挂：4款主流AI应用大比拼

这四款应用各有特色，现在登录appmall.ai，即可一站式试用和灵活切换上述应用，价格低至2.3元/小时。举例而言，当你想要订一张机票，Agent会先通过分析明确你的需求，然后打开你手机或电脑里的订票App，自动填写或调用你的身份信息，自动调用另一个支付App，然后完成订票全过程，更像一个专属的智能秘书。Agent 既不是 Siri 或者小爱同学的升级版，也不是 ChatGPT等对话大模型的变体，而是一种“自主智能体”。它能分析目标、拆解目标、感知环境、调用外部工具，然后完成目标。

2025-04-22 14:44:13 602

原创社恐新嘴替：7款AI语音工具哪家强？

是基于深度学习的语音合成框架，通过整合 GPT（Generative Pre-trained Transformer）的自然语言理解能力与 SoVITS（Soft Voice Isolation and Timbre Synthesis）的声纹特征建模技术，实现了「文本 – 语音」的高保真映射与个性化声音克隆，即使没有直接的训练数据，模型仍能生成相似风格的语音。最大的特点是，在应对一些数据匮乏但又有特定风格语音需求的场景时，具备突出的独特优势，降低了对大量训练数据的依赖，提高了语音生成的灵活性。

2025-04-17 17:16:46 733

原创主流AI换脸应用大比拼：到底哪款好用？

AppMall.ai作为一款高性价比、支持按需付费（低至2.3元/小时）的AI应用集合站，现已上线多款AI换脸应用，用户一次充值即可在多款应用之间灵活试用和切换，一站式解决“AI换脸”场景下的高频痛点。的特点是，虽然它与InstanID有点相似、支持多元化和个性化的风格，但它更聚焦的是头像、名片这种细分场景，确保生成的图片很适配社交媒体的需求。的换脸主要指把同一张人物面孔换到不同的风格下。的换脸可能才是最直接意义上的AI换脸，也就是把图A中的人脸，换到图B中，同时保留图B的其他头部特征、环境特征不变等。

2025-04-15 15:36:28 526

原创智能学习新革命！用 Flowise 算力，让知识吸收“飞”起来

每天面对书本中海量的知识，却因为复杂的概念、繁杂的章节而感到无从下手？想要快速掌握重点，却苦于没有合适的学习工具？别担心，【AppMall】为您带来破局之道！我们深知学习过程中的痛点，现在隆重推出——Flowise！无需复杂的操作，只需简单3步，即可拥有您的专属智能学习伙伴，让您的学习之旅焕然一新！我们在【AppMall】中为您精心打造的独立、易用的Flowise应用。您可以在这个专属空间内，快速部署和训练您的智能学习助手，轻松应对学习中的各种问题。

2025-04-14 10:09:21 192

原创 AniPortrait：视频或音频驱动，人人都是歌手！

AniPortrait 是腾讯游戏 “知己” 工作室开发的开源项目，专注于音频驱动的真实肖像动画合成。其核心功能是将静态人脸图片与音频输入结合，生成口型同步、表情自然的动态视频，支持虚拟偶像、影视制作、教育互动等场景。技术架构基于多模态扩散模型与3D 面部重建算法，通过两阶段处理流程音频特征提取与 3D 面部建模和2D 关键点投影与扩散模型渲染。

2025-04-14 10:08:14 172

原创 Stable Video Diffusion：手搓视频，3步生成电影级画面

Stable Video Diffusion是Stability AI发布的视频生成大模型，基于Stability AI原有的Stable Diffusion文生图模型，Stable Video Diffusion可实现文生视频。‌。

2025-04-10 14:21:48 411

原创 Ollama Open WebUI：无需代码！本地运行强大 AI！

我们隆重推出 Ollama Open WebUI，一个让你在本地就能运行强大人工智能模型的开源 Web 界面。Ollama Open WebUI 就像一个神奇的工具箱，已经为你准备好了各种强大的 AI 模型，包括最新潮的。你可以尝试各种不同的问题，让 AI 为你写故事、出主意、甚至进行简单的头脑风暴！现在，无需复杂的配置和深厚的专业知识，你也可以轻松拥有属于自己的 AI 大脑！在输入框中输入一个你感兴趣的问题，比如： “让LLM帮你写代码！打开你的浏览器，访问我们的产品页面。只要点点就能快速构建环境。

2025-04-10 14:20:55 170

原创 GPT-SoVITS：5 步实现 AI 语音克隆

GPT-SoVITS是基于深度学习的语音合成框架，通过整合的自然语言理解能力与的声纹特征建模技术，实现了「文本 – 语音」的高保真映射与个性化声音克隆。

2025-04-10 14:19:00 871

原创 IOPaint：一键修图神器，迅速实现智能擦除，替换对象功能

IOPaint 是一款免费开源的 AI 图像处理工具，基于先进的 AI 模型（如 LaMa、Stable Diffusion 等），专注于图像修复、擦除、扩展和内容替换。

2025-03-26 15:40:49 352

原创 CogVideo：强大的高清视频生成工具

CogVideo 是由智谱 AI 联合清华大学开发的开源视频生成模型，其升级版 CogVideoX 于 2024 年发布，集成于智谱的 AI 视频生成工具清影（Ying）中。该模型基于多模态技术，支持通过文本或图片生成高质量视频，具备快速响应、高指令遵循能力和物理世界运动还原等特点，适用于教育、影视、营销等多个领域。

2025-03-26 15:39:06 340

原创 FishSpeech：中日英文生语音，自然流畅

不少AI语音合成软件的生成作品都缺乏“人味”，而流畅自然的语音交互体验却逐渐被更多AI应用场景所需要。今天要介绍的就是Fish Audio出品的一款文本转语音（TTS）解决方案——FishSpeech，其在中文语音生成场景下的出色表现如同一骑绝尘，几乎能够达到接近人类自然语音的效果。在实测中，差不多长度的中文文本的生成速度最快>英文文本>日文文本。但是从语音文件本身来说，有起承转合，准确率也接近100%，而且语速和语调都比较自然，高度还原native speaker。下面就让我们一起来看看吧~

2025-03-26 15:35:51 541

原创 ChatTTS：最像真人的文生语音工具是怎样炼成的？

现在如果告诉你，有一款新的AI工具ChatTTS，你只需输入一段文字，AI就能声情并茂地全文读出来，不仅支持中英文混合，还能恰到好处地加入语气词和停顿，完胜Azure，那么你想不想试试呢？也提供了【清理所有wav文件】按钮，在任务操作需要一键清空时，十分方便。它采取了目前最先进的深度学习算法，在音调、情感表达、多语言识别方面极其出色，可以生成非常逼真的语音，不仅开源，而且还在不断迭代升级。从默认音色的流畅度来看，中英文的混合生成确实没有痕迹，但是中文符号短剧方便，比如低至约2.3元/小时，略显生涩。

2025-03-26 15:34:09 393

原创方言语音克隆哪家强？阿里CosyVoice放大招

这表示使用系统自带的音色，配合输入合成文本，进行内容的生成。流式推理好处就是可以实时生成，应答速度快，更适合智能客服等需要即时回复的场景，但是缺点也比较明显，对文本整体涵义理解内容不够，尤其在跨语种生成的场景下可能会表现不理想，所以在不赶时间的前提下，我们一般选“否”，不使用流式推理。CosyVoice 是阿里开源的一款创新的多语言语音生成大模型，无论是语音质量，还是细节精准度上都表现卓越，能够应对零样本语音生成、跨语言声音合成，还可以模仿非常自然的人类语音，包括笑声、咳嗽和呼吸。下面就一起来看看吧~

2025-03-25 09:57:20 674

原创 SkyReels-A1：影帝级微表情，拉Sora下神坛

SkyReels-A1是昆仑万维推出的国内首个SOTA级别基于视频基座模型的表情动作可控算法，对标Runway的Act-One，支持视频驱动的电影级表情捕捉，实现高保真微表情还原，将为包括提升短剧在内的AI内容创作的生产效能提供高效的助力。和大部分图片视频生产软件类似，左侧上传源图片，右侧上传驱动视频，就可以用图片里的人脸/环境+视频里的动作/表情，生成一个新的视频了。可以看到，生成的过程很快，用时并不长，而且效果十分流畅，连视频里的一些微表情（闭眼、撇嘴等）都保留的很好。

2025-03-21 10:35:49 246

原创 Paints-UNDO：一张图生成绘画全过程

大多数AI应用都在“创造未来”，即基于此时此刻的素材和idea，生成时间轴之后的作品，而今天AppMall要为大家介绍的这款应用Paints-UNDO则主打一个“回溯往昔”，上传一张图片即可自动生成从一张白纸到这幅作品的创作全过程。根据上一步关键帧的拆分，很快就可以生成过程视频，因为步骤设定在50，所以视频非常细化，最终长达26秒。有一些绘画走的是实景照片类风格，看起来就像一幅拍摄的照片，那么对于这个类型的绘画过程的还原，基本上Paints-UNDO就会比较勉强，可以说是驴唇不对马嘴。

2025-03-20 14:38:03 410

原创 InstantID：只要2张图片，一键生成独具风格的定制化照片

InstantID是一种基于扩散模型的图像生成技术，由小红书的InstantX团队开发。它能够在不需要大量训练的情况下，仅通过一张参考图像生成具有各种风格和姿势的定制化图像，同时保持高保真度。

2025-03-20 12:10:26 234

原创 PuLID：只需1张图，快速生成高定制个性化身份

PuLID全称（Pure and Lightning ID Customization），是一种先进的文本到图像生成技术，由字节跳动的研究团队开发‌。PuLID能够在单张参考图像的基础上，快速生成具有高度个性化特征的图像和视频，同时在维持身份ID的精确度和图像的可塑性方面展现了卓越的性能‌。PuLID应用场景PuLID可以应用于各种需要个性化身份定制的场景，例如在社交媒体平台上生成具有高度个性化的头像、名片等。

2025-03-20 12:09:36 373

原创 F5-TTS：语音克隆“六边形战士”上线

上海交通大学、剑桥大学和吉利汽车研究院联合开发了一款全非自回归文本到语音转换系统F5-TTS，利用独特的架构，基于零样本 (Zero-shot) ，即可搞定声音克隆。F5-TTS的界面非常简洁，可以分为基础区和参数优化区。在实测当中，使用用一位相声演员的音色，输入《报菜名》的文本，在该语境下，E2-TTS的表现更为自然流畅。，即可一键开启F5-TTS试用。选择F5-TTS模型，或者平台嵌入的另一个语音克隆模型E2-TTS。，全流程了解如何安装开启站内应用，一键启动，无论是极客还是小白，都能快速上手。

2025-03-20 12:00:15 370

原创 48 小时倒计时！AppMall 专属算力让不可能成为现实

新品发布会需要一段 “柯基犬跳格子舞” 的创意视频，既要展现狗狗的灵动跳跃，又要呈现光影下毛发的自然飘动。现在，AppMall 万相 2.1 专属算力环境为您破局！当您还在为动物运动轨迹发愁时，竞争对手已通过 AppMall 万相 2.1 专属算力环境完成了创意迭代。稍后，如你所见提示词被增强了，点击生成视频后，耐心等待一会就可以看到可爱的柯基在跳格子舞了。“柯基犬跳格子舞，慢动作展示关节运动，毛发在阳光下呈现丝绸光泽，背景是绿色草坪”所有计算在企业专属环境中运行，数据全程本地化处理，确保创意素材不泄露。

2025-03-14 17:00:21 184

原创实测万相2.1文生视频大模型：能歌善舞、能写会画，堪比四栖艺术家

她衣袂飘飘，裙上白梅隐约，眉眼低垂含愁。阿里最新开源的视频生成模型阿里万相Wan2.1火遍全网，不仅迅速在全球权威垂直类榜单VBench上登顶，完胜‌Sora，更在整个AI界，乃至内容创意领域一石激起千层浪，开启了视频生成的无限可能。提示词越详细，生成视频效果会越好，但也不宜过长，否则会影响万相2.1大模型的理解，生成过程的时长也会被无限拉长（实测一般长度提示词至少需要300s以上的生成时长）。万相2.1的用户界面非常简单，一共分为3个区域：（左上）提示词输入，（左下）优化参数，以及（右侧）结果生成。

2025-03-05 11:26:53 1237

原创 FaceChain一键搞定简历照——毕业&求职季送女友的特别心意

比起那些千篇一律的鲜花、包包，一套高质量的毕业照或简历照，更能助力她在求职路上自信闪耀。爱她，就为她一键生成专属美照，无需技术，只有满满心意！

2025-02-27 16:44:44 807

原创 PhotoMaker：一脸在手，百变我有

（3）值得注意的是，目前提示词仅支持英文（可先使用其他AI工具进行翻译，然后复制过来），并且必须包含img的字眼，比如一张婴儿图片，需键入a baby img，否则系统会因为无法识别而提示错误。（2）先从上传一张原始人像图片开始，同时在【prompt】提示词输入框中，详细描述想要生成的图片的样式，包括但不限于：颜色、场景、人物服饰、装饰、背景等。PhotoMaker是一个由南开大学和腾讯PCG实验室开发的人工智能系统，它的核心功能是文生图，同时允许用户通过调整特定的参数来定制生成的图像。

2025-02-25 18:01:57 345

AppMall的博客