
大模型
文章平均质量分 92
源泉的小广场
专注大模型、隐私计算技术领域以及商业化
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【大模型实战篇】BGE-Rerank-base重排服务部署教程
BGE-reranker-base、reranker、rerank、服务部署、docker、重排服务、相似度计算、GPU原创 2025-05-27 11:36:06 · 447 阅读 · 0 评论 -
【大模型实战篇】使用megatron微调模型
大模型训练、模型微调、megatron原创 2025-05-05 00:27:51 · 570 阅读 · 0 评论 -
【大模型实战篇】对Qwen3提到的thinking和no thinking混合思考模式的讨论
大模型、qwen3、推理模型、混合思考、思考模式、不思考模式、thinking、no thinking、mcp、强化学习、模型蒸馏、moe架构原创 2025-05-02 10:27:22 · 3746 阅读 · 0 评论 -
【大模型实战篇】华为信创环境采用vllm部署QwQ-32B模型
华为、信创、qwq-32b、昇腾、鲲鹏、vllm、vllm-ascend、ascend、模型推理、模型部署原创 2025-05-01 09:47:08 · 1366 阅读 · 3 评论 -
【大模型实战篇】解决QwQ-32B推理模型输出结果不带<think>的问题
<think>丢失、<think>标签、qwq32b、推理模型、think缺失、vllm、推理模型部署、推理结果格式、qwq模型、原创 2025-04-23 20:56:18 · 730 阅读 · 0 评论 -
【大模型理论篇】DeepResearcher论文分析-通过在真实环境中的强化学习实现深度研究
大模型、深度推理、deep researcher、强化学习、深度检索、智能体、自主规划、深度研究、deep research原创 2025-04-11 23:50:34 · 776 阅读 · 0 评论 -
【大模型理论篇】Search-R1: 通过强化学习训练LLM推理与利⽤搜索引擎
大模型、深度研究、deep research、深度检索、deep search、深度搜索、强化学习、深度检索增强、R1、search-R1原创 2025-04-11 15:39:39 · 1137 阅读 · 0 评论 -
【大模型智能体】Agent2Agent协议加上MCP协议也许会成为未来Agent智能体系统的标配
大模型、智能体、智能体与智能体协作、agent2agent、agent、mcp、智能体协作原创 2025-04-10 20:55:51 · 922 阅读 · 1 评论 -
【大模型理论篇】关于生成式模型中联合分布概率学习必要性以及GPT是生成式模型的讨论
大模型、生成模型、生成式模型、判别式、判别模型、判别式模型、监督生成式、无监督生成式、gpt、llama、大模型、大模型生成式模型原创 2025-04-09 10:26:57 · 979 阅读 · 0 评论 -
【大模型理论篇】SWIFT: 可扩展轻量级的大模型微调基础设施
大模型、多模态、微调框架、训练框架、后处理框架、评估、多模态训练、swift、msswift原创 2025-04-08 23:58:31 · 1031 阅读 · 0 评论 -
【大模型智能体】构建AI智能体的关键要点分享(To B场景)
智能体、大模型、agent、to b智能体、智能体经验、智能体踩过的坑、智能体构建准则、智能体构建关键要点原创 2025-04-07 08:03:22 · 1042 阅读 · 0 评论 -
【大模型实战篇】基于Claude MCP协议的智能体落地示例
大模型、智能体、agent、ai agent、mcp、工具使用、tools、manus、open manus、mcp示例、mcp解决的问题原创 2025-03-25 08:52:24 · 2514 阅读 · 0 评论 -
【大模型理论篇】CogVLM:多模态预训练语言模型
大模型、多模态模型、多模态视觉模型、cogvlm、vision llm、视觉理解、视觉问答、视觉语言预训练模型原创 2025-03-21 11:43:15 · 1290 阅读 · 0 评论 -
【大模型&算法工程】大模型应用工具化、忠诚度以及知识库场景下PDF双栏解析问题的讨论
大模型、知识库、RAG、解析工具、解析引擎、pdf双栏解析、pdf解析、AI工具化、忠诚度、产品打磨、AI生态建设、大模型应用场景、大模型能力边界原创 2025-03-21 10:20:50 · 1284 阅读 · 0 评论 -
【大模型理论篇】Skywork R1V: Pioneering Multimodal Reasoning with Chain-of-Thought 论文解读
多模态、多模态推理、vlm、vision llm、cogvlm、r1v、推理模型、大模型、自适应推理链原创 2025-03-20 10:46:58 · 1293 阅读 · 0 评论 -
【大模型实战篇】多模态推理模型Skywork-R1V
大模型、多模态、多模态推理模型、多模态强化推理、r1、r1-v、r1-vision、强化推理、vit、deepseek、qwq-32b原创 2025-03-19 23:36:35 · 1432 阅读 · 0 评论 -
【大模型理论篇】R1-Searcher:通过强化学习激励llm的搜索能⼒
强化学习、强化推理、强化rag、强化搜索推理、rag、r1-searcher、大模型搜索能力、强化学习、r1、强化学习++、grpo原创 2025-03-18 20:45:59 · 1043 阅读 · 0 评论 -
【算法工程】vllm突然报错No platform detected, vLLM is running on UnspecifiedPlatform
大模型启动、大模型vllm部署、vllm检测不到设备、启动报错、部署报错原创 2025-03-18 17:21:30 · 1779 阅读 · 0 评论 -
【大模型实战篇】使用GPTQ量化QwQ-32B微调后的推理模型
大模型推理、大模型量化、推理模型量化、微调模型量化、推理模型微调版本量化、qwq32b量化、gptq量化、autogptq、量化提速、性能优化、推理模型、千问模型量化、awq原创 2025-03-16 23:19:21 · 1312 阅读 · 0 评论 -
【大模型实战篇】对比包括QwQ-32B在内的不同推理模型的吞吐量表现
大模型、性能对比、推理模型、推理性能对比、qwq推理模型、量化模型、int4量化、int8量化、r1蒸馏原创 2025-03-16 14:15:07 · 774 阅读 · 0 评论 -
【大模型智能体】UpsonicAI-面向任务可靠执行的智能体框架
大模型、智能体、大模型智能体、智能体框架、可靠性、任务可靠智能体、MCP、upsonic、upsonic智能体框架原创 2025-03-14 17:41:02 · 1059 阅读 · 0 评论 -
【大模型实战】利用ms-swift微调框架对QwQ-32B推理模型进行微调
大模型、大模型微调、大模型微调框架、lora微调、推理模型微调、强化推理、qwq-32b、ms-swift、微调框架原创 2025-03-13 00:00:26 · 2936 阅读 · 3 评论 -
【大模型实战篇】vllm本地部署阿里最新的QwQ-32B推理模型以及体验
推理模型、千问推理模型、大模型、32B推理模型、强化学习、deepseek-r1、QwQ-32B原创 2025-03-06 20:14:56 · 7276 阅读 · 7 评论 -
【大模型实战篇】DeepSeek-R1面临的DDOS攻击以及与O系列的差距
大模型、推理模型、ddos、大模型拒绝服务攻击、deepseek-r1、o1、o3原创 2025-02-28 18:49:37 · 425 阅读 · 0 评论 -
【多模态】Magma多模态AI Agent
大模型、智能体、多模态、ai agent、ai 智能体、magma、ui agent、gui agent、omniparser原创 2025-02-28 17:44:21 · 1388 阅读 · 0 评论 -
【大模型实战篇】大模型训练/微调的一些经验分享
大模型、大模型训练、大模型微调、参数设置、大模型训练参数、大模型概念、大模型术语、经验分享原创 2025-02-28 17:33:37 · 1468 阅读 · 0 评论 -
【大模型实战篇】OmniParserV2+DeepSeek:基于纯视觉的 GUI Agent解决方案
omniparser、agent、智能体、deepseek、大模型路径规划、omniparser v2原创 2025-02-26 14:02:49 · 2746 阅读 · 0 评论 -
【算法工程】大模型局限性新发现之解决能连github但无法clone项目的问题
github、大模型、局限性、大模型局限性、小众问题、无法克隆、无法clone项目原创 2025-02-26 12:11:18 · 525 阅读 · 0 评论 -
【多模态】市场主流文生视频/图平台能力横向对比
文生视频、文生图、海螺AI、vidu、混元、豆包、即梦、minimax、智谱清言原创 2025-02-24 00:23:19 · 700 阅读 · 0 评论 -
【大模型实战篇】利用DeepSeek-R1数据微调蒸馏ChatGLM32B让大模型具备思考能力(Aha moment)
大模型微调、大模型蒸馏、R1数据蒸馏、微调蒸馏、chatglm蒸馏、chatglm推理模型、deepseek-r1、aha moment、glm-zero-preview原创 2025-02-22 00:56:07 · 1777 阅读 · 2 评论 -
【大模型实战篇】大模型局限性之DeepSeek V3/R1的行业微调方案
deepseek、deepseek-R1微调、deepseek-v3微调、大模型微调、grpo、lora微调原创 2025-02-21 00:56:16 · 1056 阅读 · 0 评论 -
【算法工程】强化推理模型局限性之解决linux下Aspose.slides提示No usable version of libssl found
文档解析、RAG、pptx解析、Aspose、linux镜像、openssl、大模型、强化推理短板原创 2025-02-14 02:34:53 · 933 阅读 · 0 评论 -
【大模型理论篇】MCP(Model Context Protocol) 大模型智能体第一个开源标准协议
大模型智能体开放协议、MCP、Model Context Protocol、大模型、智能体、工具连接协议、智能体开放协议、标准协议、Agent、Anthropic原创 2025-02-10 10:54:29 · 8541 阅读 · 0 评论 -
【大模型理论篇】Kimi-1.5是DeepSeek-R1的有力竞争者
大模型、LLM、强化学习、强化推理、scaling RL、kimi1.5、k1.5、deepseek-r1、冷启动、预热、奖励设计、Long2short原创 2025-02-07 00:03:11 · 2714 阅读 · 0 评论 -
【大模型理论篇】DeepSeek-R1与O1复现的技术路线对比及R1展现出OpenAI Moment的价值探讨
强化学习、强化推理、大模型、deepseek-r1、deepseek-zero、openai-o1、glm-zero-preview、大模型强化学习、大模型强化学习四要素、强化推理技术路线对比原创 2025-02-06 12:32:06 · 2021 阅读 · 0 评论 -
【大模型理论篇】DeepSeek-R1:引入冷启动的强化学习
大模型、冷启动、强化学习、结合冷启动的强化学习、deepseek-r1训练模式、人类对齐、奖励函数、大模型输出可读性、deepseek模型关系图原创 2025-02-04 22:38:49 · 1712 阅读 · 4 评论 -
【大模型理论篇】DeepSeek-R1-Zero之关键技术GRPO解析
deepseek-r1-zero、强化推理、大模型、grpo、Group Relative Policy Optimization、群体相对策略优化、critic model、ppo原创 2025-02-04 18:32:24 · 2081 阅读 · 0 评论 -
【大模型理论篇】最近大火的DeepSeek-R1初探(原理及使用)
大模型、deepseek-R1、deepseek-R1-zero、deepseek-v3、强化学习、强化推理、大模型后训练、大模型蒸馏、MLA、MoE原创 2025-02-03 10:09:51 · 3966 阅读 · 1 评论 -
【数字人】上传视频与音频实现美女数字人(基于音频条件的潜在扩散模型的端到端唇动同步框架)
2D数字人,latentsync,唇动对齐,unet, diffusion model,多模态,syncnet,数字人,大模型原创 2025-01-08 12:20:03 · 1105 阅读 · 0 评论 -
【数字人】仅需一张图片和一段音频生成美女数字人讲解视频
数字人、d-id、virtual human、digital human、多模态、aigc、大模型、虚拟人、电商直播、视频制作、内容自动创作原创 2025-01-05 11:32:25 · 1356 阅读 · 0 评论