- 博客(912)
- 收藏
- 关注

原创 DeepSeek R1 671B 完整版本地部署教程来了!!!
关于本地部署,大多数人使用的是蒸馏后的8B/32B/70B版本,本质是微调后的Llama或Qwen模型,并不能完全发挥出DeepSeek R1的实力。然而,完整的671B MoE模型也可以通过针对性的量化技术压缩体积,从而大幅降低本地部署门槛,乃至在消费级硬件(如单台Mac Studio)上运行。那么,如何用 ollama 在本地部署 DeepSeek R1 671B(完整未蒸馏版本)模型呢?一篇在海外热度很高的简明教程即将揭晓。作者主页:https://snowkylin.github.io。
2025-02-05 16:12:23
12137
1

原创 深入浅出 AI 智能体(AI Agent)|技术干货
随着人工智能技术的飞速发展,智能体(AI Agents)正逐渐成为人与大模型(如大语言模型)交互的主要方式。智能体是能够执行任务、解决问题并提供服务的 AI 系统,它们通过模拟人类的行为和决策过程,使得与大模型的交互更加自然、高效和个性化。智能体作为人与大模型交互的桥梁,不仅提高了交互的效率和质量,还扩展了大模型的应用范围。随着技术的不断进步,智能体将更加深入地融入我们的日常生活,成为不可或缺的智能伙伴。智能体(英文名:AI Agent 或 AI Bot)是指能够感知其环境并采取行动以实现某种目标的实体。
2025-01-04 17:14:34
24393
1

原创 五款国产AI大模型大测评!Kimi,智谱清言,通义千问,文心一言,豆包谁更胜一筹?
AI大模型是指具有巨大参数量的深度学习模型,通常包含数十亿甚至数万亿个参数。原理主要基于深度学习技术,特别是神经网络和大规模数据的训练,它们通过分析大量数据来学习语言模式、知识表示和任务执行策略。AI大模型的训练过程通常包括以下几个步骤:数据预处理:对原始数据进行清洗、整理和标注,包括去除噪声、填充缺失值、归一化等操作;模型构建:设计并搭建神经网络,这包括确定网络的层次结构、神经元数量、激活函数等;模型训练:将预处理后的数据输入到神经网络中,不断调整神经元的连接权重使模型达到满意的性能;
2024-10-28 11:26:42
50024

原创 Ollama:一个在本地部署、运行大型语言模型的工具
所谓自定义模型就是不适用Ollama官方模型库中的模型,理论可以使用其他各类经过转换处理的模型Ollama库中的模型可以通过提示进行自定义。# 设置温度参数# 设置SYSTEM 消息SYSTEM """作为AI智能助手,你将竭尽所能为员工提供严谨和有帮助的答复。"""Modelfile文档One-API是一个OpenAI接口管理 & 分发系统,支持各类大模型。这里使用Docker快速进行部署。拉取镜像创建挂载目录启动容器访问IP:3001初始账号用户名为 root,密码为 123456。
2024-05-28 10:30:57
8030

原创 【大模型实战案例】手把手教大家微调大模型 Llama 3
Llama 3 近期重磅发布,发布了 8B 和 70B 参数量的模型,我们对 Llama 3 进行了微调!!!今天手把手教大家使用 XTuner 微调 Llama 3 模型。
2024-04-23 18:09:27
4639
2

原创 OpenAI的官方Prompt工程指南详解 - 看这一篇真的就够了
这个技巧偏开发者。普通用户可以跳过。因为模型具有固定的上下文长度,因此用户和助手之间的对话无法无限期地继续。解决此问题有多种解决方法,第一个是总结对话中的历史记录。一旦输入的大小达到预定的阈值长度,这可能会触发总结部分对话的查询,并且先前对话的摘要可以作为系统消息的一部分包括在内。或者,可以在整个对话过程中在后台异步总结之前的对话。这两种方法都行,或者还可以把过去的所有聊天记录存成向量库,后续跟用户对话的时候动态查询嵌入,也可以。
2024-04-10 10:42:26
12805
原创 一文读懂 Transformer:自注意力机制、编码器解码器结构及实战应用
一文读懂 Transformer:自注意力机制、编码器解码器结构及实战应用
2025-08-20 16:30:31
1023
原创 50 道大语言模型 (LLM) 核心面试题详解:从基础概念到部署挑战,助你轻松应对 AI 面试
50 道大语言模型 (LLM) 核心面试题详解:从基础概念到部署挑战,助你轻松应对 AI 面试
2025-08-19 16:32:03
741
原创 保姆级教程:从 Naive RAG 到 Agentic RAG 的架构演进关键技术拆解 | RAG 进阶必备
保姆级教程:从 Naive RAG 到 Agentic RAG 的架构演进关键技术拆解 | RAG 进阶必备
2025-08-19 16:28:07
1350
原创 程序员必备 AI 术语手册:36 个关键概念从 Transformer 到数据隐私一网打尽
程序员必备 AI 术语手册:36 个关键概念从 Transformer 到数据隐私一网打尽
2025-08-18 17:09:33
575
原创 大模型提示工程实战:Text2SQL 与 Text2API 的实现逻辑及代码示例
大模型提示工程实战:Text2SQL 与 Text2API 的实现逻辑及代码示例
2025-08-18 16:58:53
351
原创 Transformer 从原理到代码实战:手把手教你入门,轻松叩开大模型之门
Transformer 从原理到代码实战:手把手教你入门,轻松叩开大模型之门
2025-08-16 16:43:21
851
原创 2025 年产品经理职业分水岭:AI + 产品经理进阶指南(附智慧社区实操案例)
2025 年产品经理职业分水岭:AI + 产品经理进阶指南(附智慧社区实操案例)
2025-08-12 15:56:40
831
原创 月薪狂飙 6W?揭秘 AI 产品经理 “吃香” 真相,一文看透背后逻辑!
月薪狂飙 6W?揭秘 AI 产品经理 “吃香” 真相,一文看透背后逻辑!
2025-08-11 15:42:45
1045
原创 转行大模型必看:4 大岗位解析 + 避坑指南,校招 / 社招快速入门少走 3 年弯路
转行大模型必看:4 大岗位解析 + 避坑指南,校招 / 社招快速入门少走 3 年弯路
2025-08-10 12:15:00
669
原创 深入浅出理解算力:从传统 CPU 到智算芯片,一文读懂通算、超算与智算的核心差异
深入浅出理解算力:从传统 CPU 到智算芯片,一文读懂通算、超算与智算的核心差异
2025-08-10 10:15:00
600
原创 OpenAI 刚刚发布 GPT-5:不拼花哨功能,专攻“会思考”的核心能力
OpenAI 刚刚发布 GPT-5:不拼花哨功能,专攻“会思考”的核心能力
2025-08-08 15:48:06
1108
原创 2025 就业大震荡:1222 万毕业生如何冲破 “35 岁门槛” 与 AI 冲击?
2025 就业大震荡:1222 万毕业生如何冲破 “35 岁门槛” 与 AI 冲击?
2025-08-07 15:17:27
7297
原创 避坑指南:AI Agents 与 Agentic AI 不是一回事,核心差异在此
避坑指南:AI Agents 与 Agentic AI 不是一回事,核心差异在此
2025-08-07 15:05:29
917
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人