自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1186)
  • 收藏
  • 关注

原创 5 分钟用满血 DeepSeek R1 搭建个人 AI 知识库(含本地部署)

看到这里,相信你已经找到最适合自己的 DeepSeek 个人知识库方案了。如果你和大多数人一样,选择使用官方 API ,那就不用再为性能和本地硬件资源发愁;如果你恰好有充足的算力和技术储备,本地部署也是个不错的选择。不过,在整个过程中,我想和你分享的不仅仅是这些技术细节。而是一个中国团队能做出世界级大模型,一个需要 +86 才能注册的大模型。很庆幸,我们能作为中国 AI 技术进步的见证人。当然,暂时的领先不是终点。但 DeepSeek 给我们带来的,是“中国也可以”这份信心。

2025-02-05 16:07:16 9148 2

原创 2024年国内外最新AI大模型汇总(含ChatGPT、Claude、Kimi、文心、天工、讯飞、通义等10大主流AI大模型)

两年前,我和你谈论AI搜索时,你可能觉得我在做梦。但现在,梦想已经成真——信息搜索,知识工作者的新武器正如鲁迅先生所说:“输入的是垃圾,输出的也是垃圾。”在这个信息爆炸的时代,搜索能力成为了衡量知识工作者能力的关键。AI搜索的崛起AI搜索作为AI领域的热门赛道,正吸引着各路英雄豪杰。搜索引擎的两大类别:就像是我们的_私人助理,随时待命_,通过对话就能理解我们的需求,提供精准搜索结果。比如chatgpt、kimi、万知等。:这类搜索引擎则将AI技术融入搜索过程,让搜索结果更个性化、多样化。

2024-09-19 17:26:48 26812

原创 用国产长文本大模型写小说,这个太强悍了 !

GLM-4-Long是智谱 BigModel开放平台(bigmodel.cn)推出的一款先进语言模型,适用于需要大规模文本生成的应用场景。GLM-4-Long有很多的实际应用场景:比如说,解读企业年报、学习论文文献、公司财务报表、阅读长篇小说甚至是分析总结长视频。关键是价格非常亲民,100万 tokens 只需1元 ,这简直是白给了,良心定价!2。

2024-09-16 18:00:00 7311

原创 新手必看!LangGraph如何轻松搞定多语言模型协同工作

今天,就让我们一起走进LangGraph的世界,看看它是如何解决这些问题的。

2025-07-06 12:30:00 1158

原创 Qwen3发布!从代码到对话,多模态大模型的全面进化

今天给大家带来一个超级重磅的消息——Qwen3语言模型正式发布啦!这可不是普通的更新,而是语言模型领域的一次巨大飞跃。如果你对自然语言处理、多模态交互,甚至是多语言对话感兴趣,那你绝对不能错过这篇文章!

2025-07-06 08:15:00 401

原创 智能体来袭!中小企业如何用它降本增效?7大案例告诉你

本文旨在分析中小企业AI应用的现状,并深入探讨七大案例,为企业提供关于AI智能体应用的深刻见解和实用建议。

2025-07-04 13:42:26 804

原创 大语言模型LLM底层技术原理到底是什么?大型语言模型如何工作?

大语言模型LLM底层技术原理到底是什么?大型语言模型如何工作?

2025-07-04 13:34:35 902

原创 AI 大模型时代:一篇文章说透中年程序员面临的挑战与机遇

AI 大模型时代:一篇文章说透中年程序员面临的挑战与机遇

2025-07-03 14:47:57 307

原创 从大模型的技术原理、落地应用到未来趋势,从入门到精通,看这一篇就够了!

从大模型的技术原理、落地应用到未来趋势,从入门到精通,看这一篇就够了!

2025-07-03 14:46:38 1061

原创 RAG是什么?一文讲明白所有RAG概念!附带完整RAG实践过程!

RAG是什么?一文讲明白所有RAG概念!附带完整RAG实践过程!

2025-07-02 14:40:43 913

原创 【大模型面试】20道必问!面试中的提示工程高频问题全攻略,看这一篇就够了!

什么是提示工程?它为什么如此重要?在面试中,又会遇到哪些关于提示工程的问题呢?今天,我们就来深入探讨一下。

2025-07-02 14:11:31 690

原创 Agent到底是什么,一文搞懂智能体相关概念及原理【建议收藏】

近年来,随着ChatGPT等大型语言模型的爆发式发展,人工智能领域又迎来一个新概念——AI Agent(智能体)。对于许多人来说,这个概念可能还比较陌生:AI Agent到底是什么?它与大语言模型有什么区别?它的工作原理是什么?它能为我们解决哪些实际问题?本文将为您全面解析AI Agent的概念、原理与应用,帮助您快速理解这一前沿技术。

2025-07-01 14:38:30 850

原创 大语言模型落地路径与应用案例思考 | “中小企业”如何运用大语言模型?

预训练(Pre-Training): 在大规模未标记的数据集上预先训练好模型。数据可以来源于一切途径诸如网络文本、书籍、代码、社交媒体、对话数据等。

2025-07-01 14:37:12 806

原创 LangGraph vs CrewAI vs OpenAI Swarm,哪个才是最合适你的 AI Agent 框架!

在这篇文章中,我们将探索三种构建智能体应用的流行框架:LangGraph、CrewAI 和 OpenAI Swarm。通过一个 Agentic Finance Assistant 的动手示例,我们将突出展示每个框架的优势、劣势以及实际使用场景。

2025-06-30 15:52:42 703

原创 2025年你需要了解的8种AI模型!并非一切都是大模型(LLMs)

如果你是一位AI研究者、创业者、产品经理,或只是希望跟上时代节奏的普通人,那么搞清楚LLM、LAM、SLM、MoE 等各种模型的差异,早已不是“加分项”,而是“核心竞争力”。

2025-06-30 15:49:14 1682

原创 一文了解大模型正确应用姿势:企业如何避开误区,精准选择与高效落地?

近年来,大模型的热度持续攀升,从ChatGPT到DeepSeek,从通用问答到行业场景,企业纷纷将AI转型提上日程。然而,许多企业在实际落地中陷入误区:要么盲目追求“参数越大越好”,要么迷信某款明星模型能“包治百病”。本文将从价值定位、选型方法、场景适配三大维度,为企业拆解大模型应用的底层逻辑。

2025-06-28 15:50:56 1058

原创 AI开发者必学:一分钟掌握Function Calling的用法与实操,看这一篇就够了

Function Call 是大模型在对话过程中调用外部函数的能力,它允许模型在无法直接回答问题时,返回一个函数调用请求,而不是生成文本。开发者需要手动解析这个请求,执行对应的函数,并将结果传回给模型,以生成最终答案。

2025-06-28 15:45:59 942

原创 从入门到精通:全面剖析大语言模型训练全流程,细节超详实,收藏我这一篇就够了

本文将详细梳理从零开始训练大语言模型的全过程,包括预训练阶段、指令微调、奖励模型和强化学习的实现方式。

2025-06-27 14:33:23 1068

原创 10种顶级 AI Agent 策略全解析:ChatGPT 智能应用开发必备指南

随着 ChatGPT 等大语言模型的普及,AI Agent 已成为下一代 AI 应用的核心。本文深入浅出地介绍 Agent 策略模式,帮助你理解如何选择和应用不同的 Agent 架构,打造更智能的 AI 应用。

2025-06-27 14:31:38 635

原创 2025 程序员转行做大模型:职业发展前景、可选岗位及选择策略

在科技飞速发展的 2025 年,大模型技术宛如一颗璀璨的新星,照亮了人工智能领域的天空,也为众多程序员提供了一个全新的职业发展方向。随着 DeepSeek 等技术的横空出世,大模型技术不断突破创新,AI 行业迎来了前所未有的热潮。对于许多程序员而言,这无疑是一个不容错过的转行良机。那么,2025 年程序员转行做大模型,职业发展前景究竟如何?又有哪些岗位可供选择?该如何做出合适的选

2025-06-26 11:54:31 644

原创 万字长文!AI智能体全面爆发前夜:一文讲透技术架构与行业机会

2025年,被广泛认为是 AI Agent(人工智能智能体)正式进入应用爆发的重要转折点。这一说法并非来自营销造势,而是由技术突破、产品形态变革与生态成熟度共同推动的阶段性标志。

2025-06-26 11:53:04 1017

原创 鹅厂实习生血泪贴:Agent/RAG黑科技,真相竟是这样!

被Agent/RAG吊打?你缺的不是智商,是这篇文章! 亲历鹅厂IEG/WXG项目实战,大三菜鸟用血泪debug记录, 撕开AI基石真面目 → 黑科技本质 = ______! 连夜肝出 「人话说明书+通关路线图」 , 即学即用!青铜连夜上分,帮助大家快速入门Agent/RAG (文章前半部分会介绍Agent,后半部分讨论RAG,最后还分享了优化RAG的一些tips,希望能帮助到大家!!)

2025-06-25 14:57:30 944

原创 一文解析四种主流LLM微调方法:Full-tuning、Freeze-tuning、LoRA、QLoRA

假设您现在是一位开发程序员,拥有一个功能强大的语言模型(LLM),现在希望利用它执行一些卓越的任务,例如进行文本分类、构建智能问答系统,或是在文本中识别关键信息。然而,你会发现问题随之而来:训练这样一个庞大的模型需要大量的计算资源和时间,您现有的计算机设备可能因此承受巨大压力,甚至因数据量不足而面临模型训练偏差的风险。

2025-06-25 14:32:42 788

原创 30+程序员想转行大模型,应该往哪个方向转?一文带你找到方向!

AI正在对全行业进行无差别的颠覆,所有人都面临着工作方式的升级。不是说有全新职业的出现,而是大部份职业都会被要求原地升级 + AI。我们每个人都会从个人劳动者转变成AI领导者,我们要提升自己的AI领导力。过去,我们通过个人的专业能力来交付工作成果,个人要亲自去执行具体的任务。现在到不远的未来,是我们带着AI一起工作并完成目标,我们作为AI的领导者,需要对AI团队进行目标设定,对AI协作过程进行管理和干预,对AI最终产出进行验收。虽然执行性的工具会逐渐交给AI,但这并不意味着对个人的专业能力不作要求了。相反,

2025-06-24 14:14:10 968

原创 agent快速入门,一文讲清楚60个AI Agent术语,这是一篇不得不看的干货总结!

一种能够感知环境、进行推理、做出决策并执行动作以实现特定目标的自主计算实体。它不仅仅是一个程序,更是一个具备一定智能体性的系统,其工作流程是一个感知-思考-行动的闭环。例如,一辆自动驾驶汽车通过摄像头、雷达、激光雷达等感知器获取路况信息,然后通过其内置的AI系统进行决策(如加速、减速、转向),并通过执行器(如油门、刹车、方向盘)实际执行这些行动,以实现在道路上安全行驶的目标。

2025-06-24 14:12:12 748

原创 Agent是什么?一文讲清智能体(AI Agent),这是一篇不得不看的干货总结!

智能体(Agent)作为先进的人工智能实体,通过持续感知外部环境、自主决策并执行行动来达成预设目标。其架构具备环境感知、动态决策、行为执行等核心功能模块,并集成记忆存储机制、多层级规划策略及工具调用能力。

2025-06-23 14:29:25 1342

原创 零基础小白必看!3 分钟让你吃透Coze智能体功能详解!AI保姆级入门教程!

Coze,中文名称"扣子", 是由字节跳动出品的一款用来开发各种AI功能的应用编辑平台,有国内国外两种版本。

2025-06-23 14:24:20 1260

原创 一文讲透大模型应用开发:新时代技术核心竞争力人人都能掌握!

最近几年,大模型在技术领域的火热程度属于一骑绝尘遥遥领先,不论是各种技术论坛还是开源项目,大多都围绕着大模型展开。大模型的长期目标是实现 AGI,这可能还有挺长的路要走,但是眼下它已经深刻地影响了“编程”领域。各种 copilot 显著地提升了开发者的效率,但与此同时,开发者也变得非常地焦虑。因为开发者们实实在在感受到了它强大的能力,虽然目前只能辅助还有很多问题,但随着模型能力的增强,以后哪天会不会就失业了?与其担忧,我们不如主动拥抱这种技术变革。

2025-06-21 15:15:21 750

原创 开源工具Ragflow是什么?零基础入门到精通,看这篇就够了!赶紧收藏!

在大模型应用的蓬勃发展中,检索增强生成(Retrieval-Augmented Generation,RAG)技术占据了举足轻重的地位。它就像是大模型的智慧助手,通过从外部知识库中检索相关信息,并将其融入到大模型的回答生成过程中,有效提升了大模型回答的准确性、可靠性和时效性,在问答系统、智能客服、文档摘要等多个领域都发挥着关键作用 。

2025-06-21 15:05:57 907

原创 不需要AI和数学知识背景,这篇文章带你学会大模型应用开发

最近几年,大模型在技术领域的火热程度属于一骑绝尘遥遥领先,它已经深刻地影响了“编程”领域,且正在各个领域迅速渗透。与此同时,普通开发者也变得非常地焦虑,因为实实在在感受到了它强大的威力,担心哪天自己就被取代。与其担忧,我们不如主动拥抱这种技术变革。

2025-06-20 15:53:42 721

原创 大模型开发理论与技术——大模型应用体系梳理,对大模型应用整体认识

随着对大模型技术应用的理解加深,以及和身边朋友和同事的交流,最近发现一个问题,很多人对大模型技术和应用并没有一个整体的认识;而且由于大模型属于一个新兴领域,也因此产生了很多新的概念和名词,所以这也间接导致了很多人认为大模型很难很复杂。

2025-06-20 15:23:35 783

原创 一文搞懂:提示词和提示词工程,看这一篇就够了!

那么提示词和提示词工程到底有什么区别呢?为什么提示词工程师的薪水会非常的高呢?

2025-06-19 15:10:55 934

原创 一文讲清楚大模型预训练、后训练、微调,看这一篇就够了!

最近,DeepSeek悄悄做了一次更新,发布了一个小版本:DeepSeek-V3-0324。

2025-06-19 15:05:41 802

原创 什么时候用GraphRAG?RAG VS GraphRAG综合分析

GraphRAG-Bench具有一个全面的数据集,任务难度逐渐增加,涵盖事实检索、复杂推理、上下文总结和创造性生成,并对整个流程进行系统评估,从图构建和知识检索到最终生成。

2025-06-18 14:59:29 289

原创 AI提示词(Prompt)从入门到精通,非常详细,收藏这一篇就够了!!!

提示词(Prompt)是指在使用大语言模型时,用户向模型提供的输入,用于引导模型生成特定类型、主题或格式的文本输出。这种输入可以是一个问题、一个描述、一组关键词或上下文信息;

2025-06-18 14:56:25 1162

原创 新手必读!2025最全AI智能体入门手册,50个问题全讲透

2025最全AI智能体入门手册,50个问题全讲透

2025-06-17 15:12:04 926

原创 在企业场景中应该怎么部署大模型——大模型企业级部署框架介绍

随着大模型的成本越来越低,以及企业生产中对大模型的定制化需求,越来越多的企业选择在本地部署大模型;这样既满足了数据安全性需求,同样也增加了企业定制化的选择。

2025-06-17 14:50:29 1311

原创 LLM运行框架对比:一文讲清楚ollama与vllm的区别

开源的LLM已经成为程序员、爱好者和希望在日常工作中使用生成式AI并保持隐私的用户的最佳选择,对于企业的私有化部署而言也是如此。这些模型提供了优秀的性能,有时在许多任务中可以与大型的闭源模型 (如 GPT-4o 或 Claude Sonnet 3.5) 相媲美。

2025-06-16 15:48:26 1091

原创 RLHF是什么?一文讲清楚ChatGPT中的RLHF!

无论是 ChatGPT 还是 GPT-4,它们的核心技术机制之一都是基于人类反馈的强化学习(Reinforcement Learning from Human Feedback,RLHF)。这是大型语言模型生成领域的新训练范式,即以强化学习方式依据人类反馈优化语言模型。那么,什么是 RLHF 呢?RLHF 背后的基本思想是采用预先训练好的语言模型,并让人们对其输出的结果进行排序。这个输出的排名作为一个信号,引导模型“更喜欢”某些结果,从而诱导响应,使其更安全可信。

2025-06-16 15:44:19 1318

原创 99%开发者不知道的细节:一文读懂DeepSeek R1训练过程!

随着大规模语言模型(LLM)在各类自然语言处理任务中不断突破,如何让模型具备更强的推理能力、生成能力与人类对齐特性,成为研究与工程实践中的重中之重。DeepSeek R1 正是在这样的背景下应运而生,它融合了预训练、监督微调(SFT)、强化学习(RL)及模型蒸馏等多种技术手段,通过分阶段、多轮次的训练迭代,最终构建了一款既具备扎实推理能力,又与人类偏好高度对齐的开源对话模型。在本文中,我们将结合如下流程图(一张纵向展现 DeepSeek R1 训练全貌的思维导图),对训练过程中的每一个模块、每一次迭代都做

2025-06-15 11:45:00 848

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除