自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(912)
  • 收藏
  • 关注

原创 DeepSeek R1 671B 完整版本地部署教程来了!!!

关于本地部署,大多数人使用的是蒸馏后的8B/32B/70B版本,本质是微调后的Llama或Qwen模型,并不能完全发挥出DeepSeek R1的实力。然而,完整的671B MoE模型也可以通过针对性的量化技术压缩体积,从而大幅降低本地部署门槛,乃至在消费级硬件(如单台Mac Studio)上运行。那么,如何用 ollama 在本地部署 DeepSeek R1 671B(完整未蒸馏版本)模型呢?一篇在海外热度很高的简明教程即将揭晓。作者主页:https://snowkylin.github.io。

2025-02-05 16:12:23 12137 1

原创 深入浅出 AI 智能体(AI Agent)|技术干货

随着人工智能技术的飞速发展,智能体(AI Agents)正逐渐成为人与大模型(如大语言模型)交互的主要方式。智能体是能够执行任务、解决问题并提供服务的 AI 系统,它们通过模拟人类的行为和决策过程,使得与大模型的交互更加自然、高效和个性化。智能体作为人与大模型交互的桥梁,不仅提高了交互的效率和质量,还扩展了大模型的应用范围。随着技术的不断进步,智能体将更加深入地融入我们的日常生活,成为不可或缺的智能伙伴。智能体(英文名:AI Agent 或 AI Bot)是指能够感知其环境并采取行动以实现某种目标的实体。

2025-01-04 17:14:34 24393 1

原创 五款国产AI大模型大测评!Kimi,智谱清言,通义千问,文心一言,豆包谁更胜一筹?

AI大模型是指具有巨大参数量的深度学习模型,通常包含数十亿甚至数万亿个参数。原理主要基于深度学习技术,特别是神经网络和大规模数据的训练,它们通过分析大量数据来学习语言模式、知识表示和任务执行策略。AI大模型的训练过程通常包括以下几个步骤:数据预处理:对原始数据进行清洗、整理和标注,包括去除噪声、填充缺失值、归一化等操作;模型构建:设计并搭建神经网络,这包括确定网络的层次结构、神经元数量、激活函数等;模型训练:将预处理后的数据输入到神经网络中,不断调整神经元的连接权重使模型达到满意的性能;

2024-10-28 11:26:42 50024

原创 Ollama:一个在本地部署、运行大型语言模型的工具

所谓自定义模型就是不适用Ollama官方模型库中的模型,理论可以使用其他各类经过转换处理的模型Ollama库中的模型可以通过提示进行自定义。# 设置温度参数# 设置SYSTEM 消息SYSTEM """作为AI智能助手,你将竭尽所能为员工提供严谨和有帮助的答复。"""Modelfile文档One-API是一个OpenAI接口管理 & 分发系统,支持各类大模型。这里使用Docker快速进行部署。拉取镜像创建挂载目录启动容器访问IP:3001初始账号用户名为 root,密码为 123456。

2024-05-28 10:30:57 8030

原创 【大模型实战案例】手把手教大家微调大模型 Llama 3

Llama 3 近期重磅发布,发布了 8B 和 70B 参数量的模型,我们对 Llama 3 进行了微调!!!今天手把手教大家使用 XTuner 微调 Llama 3 模型。

2024-04-23 18:09:27 4639 2

原创 OpenAI的官方Prompt工程指南详解 - 看这一篇真的就够了

这个技巧偏开发者。普通用户可以跳过。因为模型具有固定的上下文长度,因此用户和助手之间的对话无法无限期地继续。解决此问题有多种解决方法,第一个是总结对话中的历史记录。一旦输入的大小达到预定的阈值长度,这可能会触发总结部分对话的查询,并且先前对话的摘要可以作为系统消息的一部分包括在内。或者,可以在整个对话过程中在后台异步总结之前的对话。这两种方法都行,或者还可以把过去的所有聊天记录存成向量库,后续跟用户对话的时候动态查询嵌入,也可以。

2024-04-10 10:42:26 12805

原创 基础大模型、行业大模型与场景大模型的区别和联系详解,一篇搞懂!

基础大模型、行业大模型与场景大模型的区别和联系详解,一篇搞懂!

2025-08-22 15:47:27 231

原创 大模型训练全解析:从提示词到 MoE、RLHF,核心术语一次讲透

大模型训练全解析:从提示词到 MoE、RLHF,核心术语一次讲透

2025-08-22 15:44:14 440

原创 吃透 AI 大模型:10 大核心技术能力与 10 大热门应用场景全攻略

吃透 AI 大模型:10 大核心技术能力与 10 大热门应用场景全攻略

2025-08-21 16:52:51 680

原创 企业AI流程重构与大模型深度融合:技术逻辑及落地路径,一文看懂!

企业AI流程重构与大模型深度融合:技术逻辑及落地路径,一文看懂!

2025-08-21 16:52:41 707

原创 AI 大模型冲击下,Java 程序员的突围指南:从焦虑到新生的转型之路

AI 大模型冲击下,Java 程序员的突围指南:从焦虑到新生的转型之路

2025-08-20 16:33:09 796

原创 一文读懂 Transformer:自注意力机制、编码器解码器结构及实战应用

一文读懂 Transformer:自注意力机制、编码器解码器结构及实战应用

2025-08-20 16:30:31 1023

原创 50 道大语言模型 (LLM) 核心面试题详解:从基础概念到部署挑战,助你轻松应对 AI 面试

50 道大语言模型 (LLM) 核心面试题详解:从基础概念到部署挑战,助你轻松应对 AI 面试

2025-08-19 16:32:03 741

原创 保姆级教程:从 Naive RAG 到 Agentic RAG 的架构演进关键技术拆解 | RAG 进阶必备

保姆级教程:从 Naive RAG 到 Agentic RAG 的架构演进关键技术拆解 | RAG 进阶必备

2025-08-19 16:28:07 1350

原创 程序员必备 AI 术语手册:36 个关键概念从 Transformer 到数据隐私一网打尽

程序员必备 AI 术语手册:36 个关键概念从 Transformer 到数据隐私一网打尽

2025-08-18 17:09:33 575

原创 大模型提示工程实战:Text2SQL 与 Text2API 的实现逻辑及代码示例

大模型提示工程实战:Text2SQL 与 Text2API 的实现逻辑及代码示例

2025-08-18 16:58:53 351

原创 Transformer 从原理到代码实战:手把手教你入门,轻松叩开大模型之门

Transformer 从原理到代码实战:手把手教你入门,轻松叩开大模型之门

2025-08-16 16:43:21 851

原创 大模型基础概念科普:从 Token 到上下文长度再到最大输出,一次讲透

大模型基础概念科普:从 Token 到上下文长度再到最大输出,一次讲透

2025-08-16 16:42:12 631

原创 一文读懂 AI 赋能:从核心能力到落地挑战,附行业实践案例

一文读懂 AI 赋能:从核心能力到落地挑战,附行业实践案例

2025-08-15 16:36:51 799

原创 揭秘混合专家模型(MoE):从原理到实践,一篇讲透核心逻辑

揭秘混合专家模型(MoE):从原理到实践,一篇讲透核心逻辑

2025-08-15 16:16:34 964

原创 传统 PM 转型必看:AI 产品经理凭什么薪资翻倍?附四大从业方向

传统 PM 转型必看:AI 产品经理凭什么薪资翻倍?附四大从业方向

2025-08-14 15:33:52 931

原创 大模型 AI Agent 全面解析:从核心概念到实际应用,一文吃透

大模型 AI Agent 全面解析:从核心概念到实际应用,一文吃透

2025-08-14 15:31:20 667

原创 【科普】大模型时代,“多少 B” 参数是怎么来的?为何成标配?

【科普】大模型时代,“多少 B” 参数是怎么来的?为何成标配?

2025-08-13 16:40:28 684

原创 2025 年,0 基础也能成为人工智能工程师!无需学位的超详细路线图

2025 年,0 基础也能成为人工智能工程师!无需学位的超详细路线图

2025-08-13 16:36:41 1724

原创 2025 年产品经理职业分水岭:AI + 产品经理进阶指南(附智慧社区实操案例)

2025 年产品经理职业分水岭:AI + 产品经理进阶指南(附智慧社区实操案例)

2025-08-12 15:56:40 831

原创 一文掌握多模态大模型:概念辨析、差异对比、应用场景与技术详解

一文掌握多模态大模型:概念辨析、差异对比、应用场景与技术详解

2025-08-12 15:49:31 924

原创 月薪狂飙 6W?揭秘 AI 产品经理 “吃香” 真相,一文看透背后逻辑!

月薪狂飙 6W?揭秘 AI 产品经理 “吃香” 真相,一文看透背后逻辑!

2025-08-11 15:42:45 1045

原创 AI大模型是什么?一文带你看懂AI大模型到底有什么用!

AI大模型是什么?一文带你看懂AI大模型到底有什么用!

2025-08-11 15:15:04 1310

原创 转行大模型必看:4 大岗位解析 + 避坑指南,校招 / 社招快速入门少走 3 年弯路

转行大模型必看:4 大岗位解析 + 避坑指南,校招 / 社招快速入门少走 3 年弯路

2025-08-10 12:15:00 669

原创 深入浅出理解算力:从传统 CPU 到智算芯片,一文读懂通算、超算与智算的核心差异

深入浅出理解算力:从传统 CPU 到智算芯片,一文读懂通算、超算与智算的核心差异

2025-08-10 10:15:00 600

原创 AI 智能体全解析:从基础概念到开发应用,一文看懂!

AI 智能体全解析:从基础概念到开发应用,一文看懂!

2025-08-08 15:53:20 844

原创 OpenAI 刚刚发布 GPT-5:不拼花哨功能,专攻“会思考”的核心能力

OpenAI 刚刚发布 GPT-5:不拼花哨功能,专攻“会思考”的核心能力

2025-08-08 15:48:06 1108

原创 2025 就业大震荡:1222 万毕业生如何冲破 “35 岁门槛” 与 AI 冲击?

2025 就业大震荡:1222 万毕业生如何冲破 “35 岁门槛” 与 AI 冲击?

2025-08-07 15:17:27 7297

原创 避坑指南:AI Agents 与 Agentic AI 不是一回事,核心差异在此

避坑指南:AI Agents 与 Agentic AI 不是一回事,核心差异在此

2025-08-07 15:05:29 917

原创 大模型基本概念速览:小白的避坑入门指南(2025最新版)

大模型基本概念速览:小白的避坑入门指南(2025最新版)

2025-08-06 15:36:44 607

原创 小白入门:一文读懂大模型训练中的算力究竟是什么?一文看懂!

小白入门:一文读懂大模型训练中的算力究竟是什么?一文看懂!

2025-08-06 15:28:46 1030

原创 零基础入门 Langchain:核心概念大白话指南,一文看懂!

零基础入门 Langchain:核心概念大白话指南,一文看懂!

2025-08-05 16:12:00 714

原创 企业想搞大模型微调?先搞懂:别让投入成 “冤枉钱”

企业想搞大模型微调?先搞懂:别让投入成 “冤枉钱”

2025-08-05 16:03:48 736

原创 普通人转 AI 岗全指南:从 0 到 1 抓住时代机遇,实现职业转型

普通人转 AI 岗全指南:从 0 到 1 抓住时代机遇,实现职业转型

2025-08-04 15:06:47 9239

原创 RAG 分块全解析:5 大策略深度拆解,小白也能看懂的实战指南

RAG 分块全解析:5 大策略深度拆解,小白也能看懂的实战指南

2025-08-04 14:55:16 1102

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除