自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(62)
  • 收藏
  • 关注

原创 千问又震撼开源!AI 绘画告别“一整张图”,进入原生图层时代

不定时分享干货、学习方法、效率工具和AIGC趋势发展。

2025-12-22 12:56:22 382

原创 国内免费5个 AI 工具网站!值得收藏!

不定时分享干货、学习方法、效率工具和AIGC趋势发展。

2025-12-22 12:47:08 135

原创 千问又震撼开源!AI 绘画告别“一整张图”,进入原生图层时代

不定时分享干货、学习方法、效率工具和AIGC趋势发展。

2025-12-21 19:45:57 202

原创 刚刚,Gemini 3 Flash 正式上线!位置稳居第一!

Gemini 3 Flash 在保持智能的同时,实现了极高的效率,突破了性能与效率的帕累托极限。这意味着,每一位 Gemini 用户都能即刻免费享受到 Gemini 3 系列的尖端技术成果,日常交互体验将迎来质的飞跃。官方管这叫「为速度而生的前沿智能」,但在开发者和用户眼里,它其实就一句话:用买“代步车”的钱,让你开上了“超跑”,引擎还是顶配的。Gemini 3 Flash 为游戏开发者带来了强大的性能,提供卓越的视频分析和近乎实时的推理能力,优于之前的 2.5 版本。Gemini 3 Pro 太强了!

2025-12-18 16:56:32 399

原创 Gemini 3学生身份验证,免费使用一年!详细教程

本文提供Gemini3Pro学生优惠详细教程,通过Google AI学生计划可免费试用1年旗舰AI服务(含文档分析、图像/视频生成等功能)。关键步骤:1)访问指定链接获取验证;2)使用1key.me验证;3)绑定付款方式(支持代充);4)成功后需手动取消自动续订。每个账号可额外赠送3人各4个月会员(随机)。附官方知识库链接供参考,提醒注意账号安全和订阅管理。

2025-12-18 13:24:52 756

原创 OpenAI 十周年推出 GPT-5.2!不只是数字的提升!

OpenAI在成立十周年之际推出重磅产品GPT-5.2系列,展现突破性进展:在GDPval测试中,70.9%的表现超越或持平人类专家,处理速度比专家快11倍,成本仅1%;SWE-benchPro测试成绩达55.6%,支持四种编程语言;幻觉率降低38%,256k长上下文处理能力接近100%准确率。该模型在专业工作、编码、事实核查等方面表现优异,标志着AI从聊天工具向专业助手的转变。OpenAI联合创始人回顾十年发展历程,从最初15人的小团队到如今推动AI技术革命,对未来实现超级智能充满信心。

2025-12-12 16:15:50 911

原创 阿里巴巴开源 Z-Image:6B 轻量模型重塑 AI 图像生成格局

阿里巴巴通义实验室推出开源AI图像生成模型Z-Image,采用轻量级6B参数设计却接近20B级商业模型性能。该模型基于单流Diffusion Transformer架构,推出Turbo、Base、Edit三个版本,支持8步采样快速生成,显存需求仅16GB。突破性地解决了复杂指令理解和中英双语文字渲染难题,在中文海报生成方面表现优异。采用Apache 2.0开源协议,为移动端AI应用和创意行业带来新可能,标志着AI图像生成向普惠化迈出重要一步。

2025-11-27 15:34:30 1061

原创 Ant Design Web3 全新体验:开箱即用的组件体系与灵活主题定制,轻松打造专业 DApps

AntDesignWeb3正式发布,为DApp开发者提供开箱即用的前端设计解决方案。基于AntDesign成熟体系,它提供钱包连接、支付面板等预置组件,支持多链兼容和主题定制,简化Web3应用开发流程。内置安全机制和丰富组件库,结合AntChain技术支撑,帮助开发者快速构建专业级去中心化应用界面,实现高效开发和灵活扩展。

2025-11-27 14:27:59 395

原创 腾讯开源最新视频生成模型:仅8.3B,元宝已接入

腾讯元宝推出创新视频生成功能,基于HunyuanVideo1.5模型实现文字/图片一键生成5-10秒高清视频。该技术采用DiffusionTransformer架构,支持多模态融合,大幅降低视频创作门槛。适用于个人分享、社交媒体创作及商业营销,提供高效的内容生产工具。用户只需输入文字描述或上传图片,即可快速获得创意视频,显著提升创作效率。

2025-11-21 19:06:03 283

原创 Nano Banana Pro上线!12种玩法案例!

NanoBananaPro正式发布,为独立开发者和设计师带来突破性AI工具。新版本在画质、逻辑理解和风格泛化方面显著提升,成功通过12项极限测试。亮点包括自动生成可用游戏动作序列帧、智能控制海报留白排版,以及稳定的一键风格切换功能,大幅提升设计效率。

2025-11-21 18:22:11 74

原创 Gemini 3 炸场发布!一文了解!

Google正式发布Gemini3,宣布向AGI迈出关键一步。这款AI在多个基准测试中表现卓越,包括LMSys榜单1501分封顶、Humanity's Last Exam博士水平成绩等。Gemini3具备原生多模态能力,能理解并生成文本、图像、视频和代码,重新定义编程范式。其"氛围编程"功能让用户仅需描述创意即可生成完整应用,即将上线的DeepThink模式则赋予AI严谨推理能力。此外,Google将Gemini3深度整合到搜索引擎中,实现"搜索即应用"的体验,并为学

2025-11-19 17:06:24 911

原创 字节跳动Seed团队推出 Seed3D 1.0:从单张图像生成仿真级 3D 模型

字节跳动Seed团队发布3D生成大模型Seed3D1.0,支持单图端到端生成高质量3D模型,具备几何精度高、PBR材质真实等特点。该模型采用DiffusionTransformer架构,可生成单物体或完整场景,适用于游戏开发、机器人仿真、电商展示等多个领域,支持主流3D格式导出。其突破性技术降低了3D建模门槛,有望成为AI数字资产生产的重要基础设施。

2025-10-26 17:53:03 582

原创 RemixIcon v4.7.0 发布:新增 AI 图标,优化搜索体验,前端必备图标库再升级!

RemixIcon v4.7.0 版本发布,新增AI相关图标并优化搜索功能。本次更新加入多款人工智能主题图标,如ai-brain-line、robot-smile-line等,适配现代AI产品界面。同时优化官网搜索功能,提升关键词联想和语义匹配能力,使图标查找更高效。该图标库保持轻量一致的扁平化设计风格,支持24x24网格和双风格模式。Figma插件同步升级,支持实时预览和一键插入。RemixIcon以开源免费、风格统一、持续更新等特性,成为设计师优选工具。

2025-10-20 14:11:53 440

原创 AI 语音界面利器来了!ElevenLabs 推出开源组件库 “ElevenLabs UI”

ElevenLabs发布开源语音UI组件库ElevenLabsUI,为开发者提供22个即用组件,支持语音聊天、转录、播放等场景。该组件库采用MIT许可,兼容主流前端框架,包含完整示例和文档,可快速集成语音交互功能。这一工具降低了AI语音应用开发门槛,推动语音交互标准化,有望成为语音AI应用的基础设施。

2025-10-20 14:06:13 1011

原创 快手KAT-Dev-72B模型开源登顶!国产AI编程助手迎来技术突

快手KAT-Dev-72B模型在SWE-Bench测试中以74.6%准确率登顶开源代码模型榜首。该AI编程助手创新性地采用共享前缀轨迹和熵塑策略,在代码补全、漏洞修复和系统重构方面表现卓越,支持多种编程语言。作为开源工具,它不仅提供高效免费的工具链,还能显著提升开发者效率。这一突破标志着国产AI编程技术的重要进步,未来有望广泛应用于各类开发场景。

2025-10-12 23:44:10 688

原创 真香!这几个AI设计工具网站值得收藏!

每日学习,扶摇直上!

2025-10-12 23:18:50 1436

原创 腾讯混元图像3.0登顶全球文生图榜首!

腾讯混元3.0在伯克利LMArenaAI竞技场夺魁!这个中国开源模型击败了谷歌、字节等26个顶尖对手,成为首个登顶的国产AI。最硬核的是,这次评测采用全球网友"盲测"投票机制,完全凭真实体验决胜负。目前该模型已在GitHub、魔搭社区等平台开源,展示了中国AI的强劲实力。

2025-10-05 22:24:11 216

原创 Kimi 灰度测试 OK Computer,AI 从 “问答” 迈入 “执行” 新阶段​

月之暗面推出Kimi智能代理"OKComputer",开启AI从问答到执行的新阶段。该功能基于万亿参数KimiK2模型,能自主拆解复杂任务(如网站开发、数据分析)、调用20余种工具并解决问题,实现专业场景的端到端交付。KimiK2采用MoE架构,在代码生成和工具协同方面表现突出,使AI完成质量媲美人工团队。目前已在网站开发、数据分析和PPT制作等场景实现"数小时工作分钟级完成",大幅降低专业工具使用门槛,推动AI向生产力伙伴转型。

2025-09-27 10:48:36 1067

原创 DeepSeek-V3.1-Terminus 终极版发布!

DeepSeek发布V3.1终极版Terminus,实现两大升级:优化语言输出纯净度,修复中英文混杂问题;增强Agent能力,CodeAgent可生成更逼真的物理效果代码,SearchAgent提升信息整合能力。该版本在HLE等测评中表现优异,已上线各平台,并开放开源下载。

2025-09-27 10:39:30 201

原创 Qwen又把Qwen-Image-Edit升级了!

阿里通义千问发布全新图像编辑模型Qwen-Image-Edit-2509,带来三大突破性升级:1)首次支持多图编辑,实现人物合影、商品代言图等复杂场景合成;2)显著提升一致性,人物换姿势不崩脸、商品修图保质感、文字编辑支持改内容/字体/材质;3)原生兼容ControlNet控制图,深度图/关键点图直接可用。该模型已上线Qwen官网,支持在线体验和下载,大幅提升设计效率,成为AI修图新标杆。

2025-09-24 00:02:55 1295

原创 美团 LongCat-Flash-Thinking 大模型深度解析:5600 亿参量混合专家架构,开源赋能 AI 推理开发

美团发布LongCat-Flash-Thinking推理大模型,采用混合专家架构(MoE)实现高性能与低算力成本的平衡。该模型总参量5600亿,但仅动态激活186-313亿参数,单卡GPU即可部署。在数学推理、代码生成等任务中表现优异,部分指标超越GPT-4 Turbo。模型开源权重并提供专属工具,支持本地生活场景应用,开发者可快速上手。该方案显著降低了千亿级模型的使用门槛,推动AI推理模型的普惠化发展。

2025-09-22 18:21:13 1030

原创 通义万相正式开源Wan2.2-Animate动作生成模型

阿里云通义万相开源全新动作生成模型Wan2.2-Animate,支持"角色模仿"和"角色扮演"两大功能,可精准复刻视频中的动作表情并实现角色替换。该模型在生成质量、主体一致性等指标上超越多个开源模型,甚至优于部分闭源产品。用户可通过GitHub、魔搭社区等平台获取模型,或直接通过阿里云百炼平台调用API体验。该技术有望降低动态内容创作门槛,为短视频、动漫制作等领域提供新工具。

2025-09-21 22:38:53 708

原创 阿里云开源通义 DeepResearch!轻量级 AI 代理性能对标 OpenAI,系统性技术创新赋能研究能力​

阿里云通义实验室开源轻量级AI研究代理通义DeepResearch,其300亿参数中仅激活30亿即实现对标OpenAI的性能突破。该系统通过全流程合成数据、多模态推理范式、优化训练流程等创新,在Humanity's Last Exam测试中获得32.9分。支持128K长上下文处理,已应用于高德地图出行规划、法律研究等领域。所有技术方案及12篇相关论文已开源,开发者可通过GitHub等平台获取资源共建生态。

2025-09-17 18:33:03 1311

原创 OpenAI Codex 狂揽 4 万星标!GPT-5-Codex 实战教程!

AGENTS.md。

2025-09-17 17:02:15 2421

原创 即梦4.0与豆包4.0齐发,中文界的AI绘图王者?内含提示词!

国内AI绘图领域迎来重大突破!字节跳动旗下即梦4.0和豆包4.0相继发布重磅功能:即梦4.0支持14张图同时生成、6张参考图融合,具备强大中文识别和人像美化能力;豆包4.0则实现精准指令编辑、手办模型生成、角色特征保持等创新功能。两大平台在图像生成质量、编辑能力和多场景应用方面均有显著提升,为用户带来更强大的AI创作体验。(149字)

2025-09-12 19:14:41 400

原创 字节跳动 USO 模型!打破 AI 图像生成壁垒,开启创意融合新时代

字节跳动智能创作实验室推出开源USO模型,实现风格与主题的统一生成。该模型采用两阶段训练方法:先学习艺术风格特征,再引入内容信息确保主题准确性,并通过风格奖励学习机制优化生成效果。在评估平台USO-bench上,USO模型在风格相似性和主题保真度方面均超越现有开源模型。该技术可广泛应用于数字艺术创作和商业设计领域,支持主题驱动、风格驱动及混合模式生成。目前项目已在GitHub开源,提供完整的环境搭建指南和推理使用方法,支持低显存设备运行。这一突破性技术为AI图像生成领域带来新的可能性,推动行业创新发展。

2025-09-12 19:12:50 1298

原创 国产AI新星!17亿参数开源图像模型HiDream-I1技术解析

国产开源图像生成模型HiDream-I1突破技术壁垒,具备170亿参数规模与4K级图像输出能力。该模型支持50+预设风格,3秒内快速生成高质量图像,适用于游戏开发、广告创意及数字艺术领域。其核心优势在于卓越的成像质量、高效生成速度和低门槛操作,提供全模型/开发版/快速版三种部署方案,支持自定义参数调优。项目已在GitHub开源,为国产AI图像生成技术发展提供重要支持。

2025-09-07 16:20:44 358

原创 腾讯混元 3D 2.0 Windows 便携版:低显存需求下的高效文/图生3D体验

腾讯开源混元3D2.0推出Windows便携版,支持6GB显存低门槛运行。该版本提供一键安装、多模式3D生成(几何/纹理/文生3D)和本地数据处理功能,适用于游戏开发、AR/VR设计等领域。技术亮点包括显存优化和离线隐私保护,未来将持续迭代功能。(149字)

2025-09-07 16:19:27 565

原创 字节跳动OmniHuman-1.5发布:单图+音频秒变超真实视频,AI数字人技术再升级

字节跳动推出AI视频生成技术OmniHuman-1.5,通过单张图像和音频即可生成高度逼真的动态视频,支持双人互动、情感感知和文本定制等功能。该技术显著提升了视频的真实感和表现力,适用于影视制作、虚拟主播、教育培训等多个领域,大幅降低制作成本并提高创作效率,标志着AI视频生成技术的重要突破。

2025-09-06 20:34:41 1253

原创 全网最火的Nano Banana使用教程,模型手办玩法提示词以及最新玩法汇总!

谷歌推出AI图像生成模型NanoBanana(Gemini2.5FlashImage),支持高质量图像生成、编辑与合成,适用于角色设计、产品宣传等多场景。该模型能保持细节一致,提供简笔画转漫画、插画变真人等创新玩法,并可通过提示词实现图像局部修改、场景转换等功能。

2025-09-06 14:46:33 1415

原创 AI助力高效阅读!电子书秒变思维导图,智能解析EPUB和PDF文件

「电子书转思维导图」AI工具助力高效阅读。该工具可将EPUB/PDF电子书智能转换为结构化思维导图和文字总结,提供三种模式:文字摘要快速抓要点、思维导图理清逻辑、交互式离线查看深入理解。内置缓存支持离线使用,帮助学生、职场人士等提升阅读效率,解决信息过载问题,让复杂内容更易消化吸收。

2025-09-05 21:12:28 313

原创 快手Keye-VL 1.5开源128K上下文+0.1秒级视频定位+跨模态推理,引领视频理解新标杆

快手开源了大型多模态推理模型Keye-VL1.5,具备128K超长上下文窗口、0.1秒级视频时序定位和跨模态推理能力。该模型采用Slow-Fast双路编码和四阶段预训练技术,在多个基准测试中超越同类模型。Keye-VL1.5通过ViT结合3DRoPE等技术实现高效视频处理,已公开模型权重和在线演示,为短视频智能分析提供新框架。

2025-09-05 21:11:34 823

原创 通义实验室发布AgentScope 1.0新一代智能体开发框架

通义实验室发布AgentScope1.0智能体开发框架,支持多智能体的全生命周期管理。该框架采用三层技术架构(核心框架、Runtime和Studio),提供开发、部署和监控的一站式解决方案。其特点包括智能上下文管理、高效工具调用机制,以及通过工具沙箱保障安全性。AgentScope1.0为开发者提供了灵活、稳定且安全的智能体开发环境,适用于复杂多智能体系统的构建需求。项目已在GitHub开源。

2025-09-03 22:43:58 819

原创 腾讯开源HunyuanWorld-Voyager突破性原生3D重建与视频扩散框架

腾讯开源HunyuanWorld-Voyager,这是一个突破性的原生3D重建与视频扩散框架。该模型仅需单张输入图像即可生成具有世界一致性的3D点云,支持沉浸式探索,为VR、游戏和仿真空间领域带来重大革新。其核心能力包括:1)单图生成高质量3D点云;2)同步输出深度信息与RGB视频;3)支持超长程场景重建。作为开源项目,开发者可在GitHub和HuggingFace获取代码进行二次开发,将极大推动虚拟现实内容创作和3D建模技术的发展。

2025-09-03 11:45:50 1030

原创 美团 LongCat 开源大模型60 亿参数 MoE 架构,赋能开发者加速 AI 应用落地

AI 大模型技术快速迭代的当下,开发者对 “高性能、低成本、易部署” 的开源模型需求日益迫切。美团针对性推出的(核心版本 LongCat-Flash),以 560 亿参数规模、创新混合专家(MoE)架构为核心,兼顾计算效率与全场景性能,更以 MIT 开源协议、完善的部署工具链降低开发门槛,旨在为全球开发者提供 “能落地、好使用” 的 AI 基础工具,加速从模型技术到实际应用的转化。

2025-09-02 19:26:48 1449

原创 Nano Banana 新玩法超惊艳!附教程案例提示词!

超实用NanoBanana玩法合集✨附5个神级工具网站:Google AI Studio、ModelScope、LovArt、Lmaren AI,助你解锁惊艳效果!点击即玩~#AI工具 #黑科技 #教程分享

2025-09-02 19:23:59 1873

原创 被 Nano-banana 霸屏了!这款 “最强 AI 生图神器” 凭什么火?看一眼出图就懂了!

每日学习,扶摇直上!

2025-08-28 15:24:34 1000

原创 刚刚,GPT-5正式发布!人人免费可用

每日学习,扶摇直上!

2025-08-08 08:52:57 1051

原创 OpenAI推出开源GPT-oss-120b与GPT-oss-20b突破性大模型,支持商用与灵活部署!

每日学习,扶摇直上!

2025-08-07 23:42:37 936

原创 5个AI大模型平台!

AI资料AI学习平台 uied.cnAI免费工具 uiedtool.comAI资讯热榜 hot.uied.cnAI工具导航 hao.uied.cn/ai。

2025-07-16 13:34:09 2828

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除