- 博客(19)
- 收藏
- 关注
原创 重磅!阿里开源首个端到端全模态大模型 Qwen2.5-Omni-7B
在图像、音频、音视频等多种模态下,Qwen2.5-Omni 的表现都优于同等规模的单模态模型以及一些闭源模型,比如 Qwen2.5-VL-7B、Qwen2-Audio 和 Gemini-1.5-pro。此外,在单模态任务中,Qwen2.5-Omni 在多个领域都表现出色,包括语音识别(Common Voice)、翻译(CoVoST2)、音频理解(MMAU)、图像推理(MMMU、MMStar)、视频理解(MVBench)以及语音生成(Seed-tts-eval 和主观自然听感)。
2025-04-01 11:54:48
436
原创 数字人的 DeepSeek 时刻!“中国造” Heygem.ai 数字人整合包
Heygem.ai 凭借其“零训练、秒级量产”的特性,打破了数字人行业的传统壁垒。它只需要 1 秒的视频或一张照片,就能精确地克隆出数字人的形象和声音,并且在 60 秒内合成 4K 超高清视频。这种颠覆性的技术,将过去需要数小时甚至数天的数字人制作流程,大幅缩短到秒级。Heygem.ai 以远超行业标准的效率、精度和视觉效果,重新定义了数字人生产力的上限。即使在复杂的光影、侧脸或遮挡等场景下,它仍然能够实现 100% 的口型匹配和自然流畅的情感表达,真正让数字人从实验室走向实际应用。
2025-03-30 09:16:52
376
原创 Ditto-Talkinghead:阿里巴巴数字人技术新突破 [特殊字符]️
阿里巴巴推出了一项新的数字人技术,名为 Ditto-Talkinghead。这项技术主要用于生成由音频驱动的说话头,也就是我们常说的“数字人”。这些问题很大程度上是由于依赖变分自编码器(VAE)产生的隐式潜在空间造成的。
2025-03-29 19:39:09
431
原创 [特殊字符] PDFMathTranslate:数学文档翻译利器,公式排版不再愁!
总而言之,PDFMathTranslate 是一款功能强大且极具实用价值的开源工具,它精准地切入了数学及科学文档翻译的痛点,特别是公式处理方面表现突出。如果你经常需要阅读或处理包含复杂数学公式的外文 PDF 文档,那么这款工具值得一试!👍。
2025-03-28 11:26:27
587
原创 全球第二强开源模型Gemma 3整合包,性能超越DeepSeek V3,仅次于DeepSeek R1!
Gemma 3 作为 Google 的最新力作,以其卓越的性能和多样化的功能,为AI开发者和爱好者提供了强大的开源选择。无论是在语言处理、视觉理解还是任务执行方面,Gemma 3 都展现出了令人瞩目的能力,为AI应用开发带来了新的可能性。
2025-03-12 21:07:02
496
原创 Manus邀请码炒到10万?试试这款基于DeepSeek的开源平替!
Browser Use作为Manus的高性价比开源替代方案,不仅提供了comparable的AI自动化能力,更以其零成本、高自由度和完全开源的特性,为广大开发者和AI爱好者提供了更具包容性的选择。无需支付高昂的邀请码费用,您现在就能体验到AI浏览器自动化的强大魅力!
2025-03-08 09:05:29
832
原创 白嫖满血全速DeepSeek教程!
通过本教程的指导,您现在应该已经成功在 CherryStudio 中配置并开始使用 DeepSeek 满血版模型。现在,您可以尽情探索 DeepSeek 带来的强大 AI 能力,体验智能对话的无限可能!无论是日常工作、学习还是创意项目,DeepSeek 都将成为您的得力助手。祝您使用愉快,创意无限!
2025-03-07 07:32:16
763
原创 最强本地运行国产大模型QwQ-32B,参数仅为DeepSeek R1的1/21,成本仅1/10!附一键启动包!
QwQ-32B 是阿里巴巴 Qwen 团队推出的一个以推理为中心的开源 LLM,以。
2025-03-07 07:27:34
669
原创 MatAnyone:Mac版AI视频抠像神器,轻松应对复杂背景!
MatAnyone是一款革命性的视频抠像工具,由南洋理工大学和商汤科技联合开发。它能轻松分离视频中的目标对象和背景,即使在复杂或模糊的背景下也能表现出色。让我们来深入了解这个强大的工具!
2025-03-06 20:50:08
484
原创 视频生成届的DeepSeek Wan2.1整合包,阿里巴巴出品!
Wan2GP:为低配GPU用户打造的视频生成利器。这款基于阿里巴巴Wan2.1开发的开源模型,为资源受限用户带来前所未有的视频创作体验。
2025-03-06 08:11:40
6592
原创 超强原生macOS直播实时换脸神器来啦!
还在为找不到好用的Mac换脸软件发愁吗?MacFaceSwap闪亮登场!这是一款基于尖端深度学习技术打造的macOS原生应用,让你轻松实现专业级实时换脸效果。无论是视频会议还是直播,都能让你的虚拟形象焕然一新!
2025-02-16 09:30:13
384
原创 最新AI换脸软件VisoMaster一键整合包,支持无人直播!
界面分为三个主要区域:左侧区域:用于导入目标视频/图片和源人脸素材中央区域:实时预览窗口和视频控制面板右侧区域:参数调整和效果设置面板基本操作流程:将需要处理的视频或图片拖入左上方区域在左下方导入源人脸图片(按住Ctrl键可选择多张)通过右侧面板调整处理参数。
2025-02-09 21:16:17
1348
原创 DeepSeek生态已成,一个 API玩转数十款AI神器!
DeepSeek 通过这些丰富的集成方式,可以全方位提升我们的工作效率。无论是日常办公、开发编程,还是内容创作,都能找到适合的工具来充分利用 AI 的能力。要开始使用这些工具,你需要:访问 [DeepSeek 开放平台](https://platform.deepseek.com/) 获取 API key选择适合自己需求的工具按照相应的配置说明进行设置硅基流动统一登录。注册就送2000万Tokens的免费额度!够你玩一阵子的了!😉注册完,在个人中心就能找到你的API Key。
2025-02-08 10:09:42
1052
原创 告别DeepSeek服务器繁忙,最新免费本地客户端使用满血DeepSeek R1教程!
好啦,今天的教程就到这里!是不是感觉自己又get了一项新技能?😎 赶紧去试试吧,从此告别DeepSeek服务器繁忙的烦恼!你的支持是我持续输出的动力!💪 咱们下期再见!👋。
2025-02-07 09:14:11
613
原创 [特殊字符] 手把手教你在 VS Code 中本地运行 DeepSeek,打造你的专属 AI 编程助手 [特殊字符]
告别云端依赖!本指南将手把手教你如何在本地安装并运行 DeepSeek,并通过 CodeGPT 进行配置,从而充分利用 AI 来增强你的软件开发流程。所有操作都在本地完成,无需担心数据泄露。
2025-02-05 11:04:49
1201
原创 [特殊字符] DeepSeek-R1 本地知识库一键整合包:你的论文分析利器!
这个 DeepSeek-R1 本地知识库整合包,操作简单,功能强大,可以有效地提升你分析论文和处理文件的效率。如果你正在寻找一款方便易用的 AI 工具,不妨试试这个整合包!
2025-02-02 12:51:50
476
原创 [特殊字符] 在手机上也能运行DeepSeek R1模型了?!
最近,DeepSeek-R1 模型正式发布,其性能可以与 OpenAI 的 o1 正式版相媲美。DeepSeek-R1 在后训练阶段采用了大规模的强化学习技术,这使得即使在标注数据极少的情况下,模型的推理能力得到了显著提升。在数学、代码及自然语言推理等多个任务中,DeepSeek-R1 的表现已接近 OpenAI o1 的水平。
2025-01-29 19:56:04
312
原创 轻松两步本地运行国产大模型DeepSeek,附Windows与Mac教程及安装包!
在短短一夜之间,中国的AI大模型DeepSeek-R1迅速崛起,成功引起了全球科技界的广泛关注。英伟达的AI科学家Jim Fan对此表示惊讶,并指出:“一家非美国公司,正在推动OpenAI初衷的真正开放与赋能的前沿研究。DeepSeek-R1的性能不仅与OpenAI的O1不相上下,而且实现了完全开源。这一发布为我们提供了更好的机会来使用开源大语言模型进行推理任务。
2025-01-28 12:14:20
1986
原创 本地CPU解压即用,DeepSeek最新多模态大模型Janus整合包!
最近,DeepSeek在AI领域频频发力,继全球瞩目的R1大模型之后,又推出了全新的多模态大模型Janus-Pro-7B系列,这一系列模型在多模态领域掀起了一股技术革命的新浪潮!
2025-01-28 09:29:34
1107
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人