自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 通义千问Qwen3-30B-A3B-Thinking-2507技术解析:推理模型的工程实践突破

阿里云发布Qwen3-30B-A3B推理模型,采用MoE架构和GQA机制,显著提升计算效率。该模型在数学(AIME25得分85)和编程(LiveCodeBenchv6得分66)测试中表现优异,支持256K长文本处理且显存占用降低67%。通过"强到弱蒸馏"策略和36万亿token训练数据增强,其STEM能力显著提升。应用测试显示,该模型在科研分析、代码审查等场景中展现出色性能,但创造性任务仍有改进空间。支持32GB设备本地部署,为专业领域推理提供高效解决方案。

2025-07-31 23:06:52 2050 1

原创 每日AI观察 | 多模态编辑、研究Agent、云端智能体一览

过去24小时内,Runway推出多任务视频编辑模型Aleph,支持对象增删、风格转换与镜头迁移;微软为Edge浏览器引入Copilot模式,升级为“AI原生”浏览器;阶跃星辰发布AI研究助手“深研”,可十分钟生成专业报告;阿里云推出AgentBay,三行代码接入云端AI能力;昆仑万维开源多模态模型Skywork UniPic;OpenAI上线ChatGPT Study学习模式,强调引导式学习与批判性思维。AI技术持续向工具集成与智能体方向演进。

2025-07-30 17:42:12 2065

原创 GLM-4.5发布:面向推理、代码与智能体的开源SOTA模型

GLM-4.5是智谱AI推出的国产开源大模型,采用混合专家架构(MoE)与“深度优先”设计理念,在性能与效率之间实现精妙平衡。模型分为旗舰版与轻量版,结合Grouped-Query Attention机制和Muon优化器,显著提升了推理能力和训练效率。在MMLU等权威基准上表现优异,具备强大的代码生成与多任务处理能力。其开源生态完善,支持多种推理框架,并通过三阶段训练体系实现高质量模型构建,为国产大模型发展和全球开源社区贡献了重要技术成果。

2025-07-29 23:18:03 894

原创 腾讯混元3D世界模型1.0:开源、沉浸与实用的技术解析

在2025世界人工智能大会上,腾讯发布并开源了混元3D世界模型1.0,成为业界首个支持沉浸漫游、交互与仿真的开源世界级3D生成模型。该模型采用两阶段生成架构与语义分层算法,支持文本与图像输入,可生成可编辑、可导出的高质量3D场景,广泛适用于游戏、影视、教育等领域。开源策略和技术创新显著降低了3D创作门槛,具备较强实用性与生态潜力。

2025-07-28 17:10:25 2842

原创 通用大模型、生成大模型、推理大模型:关系与区别详解

本文面向普通读者,全面介绍了通用大模型、生成大模型和推理大模型的定义、特点及相互关系。通用大模型作为基础框架,具备多模态处理能力和广泛的任务适应性;生成大模型通过学习数据分布实现内容创作,如文本和图像生成;推理大模型则强调逻辑推理与多步骤问题解决,在数学和决策等领域表现突出。三者关系上,生成与推理大模型多为通用模型的功能延伸,应用场景互补。未来发展趋势包括能力融合、行业垂直化以及效率优化,推动大模型向更智能、更实用方向演进。

2025-07-27 19:28:32 1733

原创 ChatGPT Agent全解析:从多任务处理到实操指南

2025年7月,OpenAI发布了ChatGPT Agent,这是融合Deep Research与Operator的全新AI助手,具备网页浏览、代码执行和视觉交互等能力。其核心为统一代理系统架构,采用文本浏览器和可视化浏览器的双浏览器设计,并运行于虚拟计算机环境中,能够独立完成多步骤任务,如竞争对手分析、PPT生成和在线购物。该功能通过Plus/Pro订阅可用,并设置消息次数限制(Pro用户400条/月,Plus用户40条/月)。OpenAI采用红队测试、权限确认等机制确保安全。未来计划增强多轮对话、个性化

2025-07-26 22:35:24 857

原创 GitHub Spark全栈应用生成技术深度剖析

GitHub Spark 是 GitHub Next 实验室推出的实验性项目,支持用户通过自然语言描述快速生成完整的全栈应用。它采用多模型架构(如 GPT-4o、Claude Sonnet 3.5)解析用户需求并生成 React/TypeScript 技术栈代码,涵盖状态管理、路由和 API 接口。Spark遵循“微应用”理念,平均生成代码约500行,内置轻量化容器和 Azure CosmosDB 存储,并实现无部署架构。所有代码同步至 GitHub 仓库,方便开发者随时查看和修改,大幅缩短从创意到原型的开

2025-07-25 20:45:34 785

原创 大模型低成本落地实践:量化、蒸馏与 QLoRA 全解析

随着大模型的应用不断拓展,企业亟需在保证性能的同时降低部署和推理成本。本文以盘古 5.5、Kimi-K2 和 Qwen3 等大模型为例,系统分析了量化、蒸馏及 QLoRA 技术如何协同降低显存需求和计算开销。通过 4bit 量化、知识蒸馏及低秩微调,企业可在少量 GPU 资源下实现高效推理与定制化应用。文中还介绍了从模型选择、微调到推理优化的完整流程,并给出成本对比,帮助企业以更高性价比实现大模型落地。

2025-07-25 11:11:26 1922

原创 开源代码模型的里程碑:深度解析Qwen3-Coder的技术突破与行业震荡

阿里推出Qwen3-Coder-480B-A35B大模型,专为代码理解与生成设计。该模型采用MoE架构,总参数量4800亿,激活参数35亿,支持256K上下文并扩展至1M token。在SWE-Bench测试中表现优异,接近ClaudeSonnet-4水平。通过三阶段训练流程提升代码质量,并配套QwenCode工具链辅助开发。相比商业产品,该开源模型成本更低,但运行仍需8张A100显卡。未来团队计划开发轻量版本,并探索自我改进机制和多模态能力,旨在优化而非替代人类编程。

2025-07-24 21:12:09 920

原创 每日AI观察 | Le Chat升级全面对标ChatGPT,腾讯CodeBuddy IDE上线,Qwen3-Coder开源再放大招

AI领域最新动态速览:Mistral升级LeChat,新增语音交互与多语言推理功能,全面对标ChatGPT;阿里开源480亿参数代码模型Qwen3-Coder,支持百万级上下文;腾讯推出零门槛AI开发工具CodeBuddy;科大讯飞发布首款离线AI办公本X5;字节跳动同时推出自动编程系统TRAESOLO和机器人模型GR-3。此外,开发者工具ZreadAI上线,昆仑万维发布音乐生成模型MurekaV7,千寻智能获6亿元融资布局具身智能。AI技术正加速向多模态、自动化和硬件终端渗透。

2025-07-23 16:56:20 1412

原创 FlashAttention下还需要缓存Key吗?

本文探讨了Transformer模型在推理阶段使用KV缓存加速的必要性,特别是在FlashAttention优化框架下。尽管FlashAttention优化了注意力计算过程,但仍需依赖完整的Key/Value输入。

2025-07-22 16:40:37 542

原创 2025国内AI绘图与PPT工具推荐

2025年国内主流AI工具实用指南 绘图工具推荐: 国风设计选文心一格(文化适配强) 电商作图用通义万相(商品图专业) 快速出图用豆包(对话式调整方便) 科研插图选智谱(学术严谨) 短视频动图用可灵(运镜效果好) 移动端出图用即梦(适配手机端) PPT工具推荐: WPSAI(文档转PPT最便捷) 飞书演示(实时数据联动优秀) 腾讯文档(团队协作轻便) Canva国内版(美化效果突出) 综合建议根据具体需求组合使用,优先考虑工具与办公场景的适配性,避免过度追求技术参数,。

2025-07-21 17:04:42 3021

原创 Hugging Face模型下载到本地方法

摘要:本文介绍了两种从HuggingFace平台下载模型的方法。第一种使用官方命令行工具huggingface-cli,通过设置环境变量HF_ENDPOINT切换镜像源,支持模型和数据集下载,可使用--local-dir-use-symlinks False参数避免符号链接。第二种为非侵入式方法,通过设置环境变量HF_ENDPOINT来修改下载源,适用于运行包含模型下载代码的Python脚本。两种方法均可通过国内镜像源https://hf-mirror.com加速下载。

2025-07-19 16:23:35 934 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除