- 博客(1186)
- 收藏
- 关注

原创 5 分钟用满血 DeepSeek R1 搭建个人 AI 知识库(含本地部署)
看到这里,相信你已经找到最适合自己的 DeepSeek 个人知识库方案了。如果你和大多数人一样,选择使用官方 API ,那就不用再为性能和本地硬件资源发愁;如果你恰好有充足的算力和技术储备,本地部署也是个不错的选择。不过,在整个过程中,我想和你分享的不仅仅是这些技术细节。而是一个中国团队能做出世界级大模型,一个需要 +86 才能注册的大模型。很庆幸,我们能作为中国 AI 技术进步的见证人。当然,暂时的领先不是终点。但 DeepSeek 给我们带来的,是“中国也可以”这份信心。
2025-02-05 16:07:16
9148
2

原创 2024年国内外最新AI大模型汇总(含ChatGPT、Claude、Kimi、文心、天工、讯飞、通义等10大主流AI大模型)
两年前,我和你谈论AI搜索时,你可能觉得我在做梦。但现在,梦想已经成真——信息搜索,知识工作者的新武器正如鲁迅先生所说:“输入的是垃圾,输出的也是垃圾。”在这个信息爆炸的时代,搜索能力成为了衡量知识工作者能力的关键。AI搜索的崛起AI搜索作为AI领域的热门赛道,正吸引着各路英雄豪杰。搜索引擎的两大类别:就像是我们的_私人助理,随时待命_,通过对话就能理解我们的需求,提供精准搜索结果。比如chatgpt、kimi、万知等。:这类搜索引擎则将AI技术融入搜索过程,让搜索结果更个性化、多样化。
2024-09-19 17:26:48
26812

原创 用国产长文本大模型写小说,这个太强悍了 !
GLM-4-Long是智谱 BigModel开放平台(bigmodel.cn)推出的一款先进语言模型,适用于需要大规模文本生成的应用场景。GLM-4-Long有很多的实际应用场景:比如说,解读企业年报、学习论文文献、公司财务报表、阅读长篇小说甚至是分析总结长视频。关键是价格非常亲民,100万 tokens 只需1元 ,这简直是白给了,良心定价!2。
2024-09-16 18:00:00
7311
原创 Qwen3发布!从代码到对话,多模态大模型的全面进化
今天给大家带来一个超级重磅的消息——Qwen3语言模型正式发布啦!这可不是普通的更新,而是语言模型领域的一次巨大飞跃。如果你对自然语言处理、多模态交互,甚至是多语言对话感兴趣,那你绝对不能错过这篇文章!
2025-07-06 08:15:00
401
原创 智能体来袭!中小企业如何用它降本增效?7大案例告诉你
本文旨在分析中小企业AI应用的现状,并深入探讨七大案例,为企业提供关于AI智能体应用的深刻见解和实用建议。
2025-07-04 13:42:26
804
原创 【大模型面试】20道必问!面试中的提示工程高频问题全攻略,看这一篇就够了!
什么是提示工程?它为什么如此重要?在面试中,又会遇到哪些关于提示工程的问题呢?今天,我们就来深入探讨一下。
2025-07-02 14:11:31
690
原创 Agent到底是什么,一文搞懂智能体相关概念及原理【建议收藏】
近年来,随着ChatGPT等大型语言模型的爆发式发展,人工智能领域又迎来一个新概念——AI Agent(智能体)。对于许多人来说,这个概念可能还比较陌生:AI Agent到底是什么?它与大语言模型有什么区别?它的工作原理是什么?它能为我们解决哪些实际问题?本文将为您全面解析AI Agent的概念、原理与应用,帮助您快速理解这一前沿技术。
2025-07-01 14:38:30
850
原创 大语言模型落地路径与应用案例思考 | “中小企业”如何运用大语言模型?
预训练(Pre-Training): 在大规模未标记的数据集上预先训练好模型。数据可以来源于一切途径诸如网络文本、书籍、代码、社交媒体、对话数据等。
2025-07-01 14:37:12
806
原创 LangGraph vs CrewAI vs OpenAI Swarm,哪个才是最合适你的 AI Agent 框架!
在这篇文章中,我们将探索三种构建智能体应用的流行框架:LangGraph、CrewAI 和 OpenAI Swarm。通过一个 Agentic Finance Assistant 的动手示例,我们将突出展示每个框架的优势、劣势以及实际使用场景。
2025-06-30 15:52:42
703
原创 2025年你需要了解的8种AI模型!并非一切都是大模型(LLMs)
如果你是一位AI研究者、创业者、产品经理,或只是希望跟上时代节奏的普通人,那么搞清楚LLM、LAM、SLM、MoE 等各种模型的差异,早已不是“加分项”,而是“核心竞争力”。
2025-06-30 15:49:14
1682
原创 一文了解大模型正确应用姿势:企业如何避开误区,精准选择与高效落地?
近年来,大模型的热度持续攀升,从ChatGPT到DeepSeek,从通用问答到行业场景,企业纷纷将AI转型提上日程。然而,许多企业在实际落地中陷入误区:要么盲目追求“参数越大越好”,要么迷信某款明星模型能“包治百病”。本文将从价值定位、选型方法、场景适配三大维度,为企业拆解大模型应用的底层逻辑。
2025-06-28 15:50:56
1058
原创 AI开发者必学:一分钟掌握Function Calling的用法与实操,看这一篇就够了
Function Call 是大模型在对话过程中调用外部函数的能力,它允许模型在无法直接回答问题时,返回一个函数调用请求,而不是生成文本。开发者需要手动解析这个请求,执行对应的函数,并将结果传回给模型,以生成最终答案。
2025-06-28 15:45:59
942
原创 从入门到精通:全面剖析大语言模型训练全流程,细节超详实,收藏我这一篇就够了
本文将详细梳理从零开始训练大语言模型的全过程,包括预训练阶段、指令微调、奖励模型和强化学习的实现方式。
2025-06-27 14:33:23
1068
原创 10种顶级 AI Agent 策略全解析:ChatGPT 智能应用开发必备指南
随着 ChatGPT 等大语言模型的普及,AI Agent 已成为下一代 AI 应用的核心。本文深入浅出地介绍 Agent 策略模式,帮助你理解如何选择和应用不同的 Agent 架构,打造更智能的 AI 应用。
2025-06-27 14:31:38
635
原创 2025 程序员转行做大模型:职业发展前景、可选岗位及选择策略
在科技飞速发展的 2025 年,大模型技术宛如一颗璀璨的新星,照亮了人工智能领域的天空,也为众多程序员提供了一个全新的职业发展方向。随着 DeepSeek 等技术的横空出世,大模型技术不断突破创新,AI 行业迎来了前所未有的热潮。对于许多程序员而言,这无疑是一个不容错过的转行良机。那么,2025 年程序员转行做大模型,职业发展前景究竟如何?又有哪些岗位可供选择?该如何做出合适的选
2025-06-26 11:54:31
644
原创 万字长文!AI智能体全面爆发前夜:一文讲透技术架构与行业机会
2025年,被广泛认为是 AI Agent(人工智能智能体)正式进入应用爆发的重要转折点。这一说法并非来自营销造势,而是由技术突破、产品形态变革与生态成熟度共同推动的阶段性标志。
2025-06-26 11:53:04
1017
原创 鹅厂实习生血泪贴:Agent/RAG黑科技,真相竟是这样!
被Agent/RAG吊打?你缺的不是智商,是这篇文章! 亲历鹅厂IEG/WXG项目实战,大三菜鸟用血泪debug记录, 撕开AI基石真面目 → 黑科技本质 = ______! 连夜肝出 「人话说明书+通关路线图」 , 即学即用!青铜连夜上分,帮助大家快速入门Agent/RAG (文章前半部分会介绍Agent,后半部分讨论RAG,最后还分享了优化RAG的一些tips,希望能帮助到大家!!)
2025-06-25 14:57:30
944
原创 一文解析四种主流LLM微调方法:Full-tuning、Freeze-tuning、LoRA、QLoRA
假设您现在是一位开发程序员,拥有一个功能强大的语言模型(LLM),现在希望利用它执行一些卓越的任务,例如进行文本分类、构建智能问答系统,或是在文本中识别关键信息。然而,你会发现问题随之而来:训练这样一个庞大的模型需要大量的计算资源和时间,您现有的计算机设备可能因此承受巨大压力,甚至因数据量不足而面临模型训练偏差的风险。
2025-06-25 14:32:42
788
原创 30+程序员想转行大模型,应该往哪个方向转?一文带你找到方向!
AI正在对全行业进行无差别的颠覆,所有人都面临着工作方式的升级。不是说有全新职业的出现,而是大部份职业都会被要求原地升级 + AI。我们每个人都会从个人劳动者转变成AI领导者,我们要提升自己的AI领导力。过去,我们通过个人的专业能力来交付工作成果,个人要亲自去执行具体的任务。现在到不远的未来,是我们带着AI一起工作并完成目标,我们作为AI的领导者,需要对AI团队进行目标设定,对AI协作过程进行管理和干预,对AI最终产出进行验收。虽然执行性的工具会逐渐交给AI,但这并不意味着对个人的专业能力不作要求了。相反,
2025-06-24 14:14:10
968
原创 agent快速入门,一文讲清楚60个AI Agent术语,这是一篇不得不看的干货总结!
一种能够感知环境、进行推理、做出决策并执行动作以实现特定目标的自主计算实体。它不仅仅是一个程序,更是一个具备一定智能体性的系统,其工作流程是一个感知-思考-行动的闭环。例如,一辆自动驾驶汽车通过摄像头、雷达、激光雷达等感知器获取路况信息,然后通过其内置的AI系统进行决策(如加速、减速、转向),并通过执行器(如油门、刹车、方向盘)实际执行这些行动,以实现在道路上安全行驶的目标。
2025-06-24 14:12:12
748
原创 Agent是什么?一文讲清智能体(AI Agent),这是一篇不得不看的干货总结!
智能体(Agent)作为先进的人工智能实体,通过持续感知外部环境、自主决策并执行行动来达成预设目标。其架构具备环境感知、动态决策、行为执行等核心功能模块,并集成记忆存储机制、多层级规划策略及工具调用能力。
2025-06-23 14:29:25
1342
原创 零基础小白必看!3 分钟让你吃透Coze智能体功能详解!AI保姆级入门教程!
Coze,中文名称"扣子", 是由字节跳动出品的一款用来开发各种AI功能的应用编辑平台,有国内国外两种版本。
2025-06-23 14:24:20
1260
原创 一文讲透大模型应用开发:新时代技术核心竞争力人人都能掌握!
最近几年,大模型在技术领域的火热程度属于一骑绝尘遥遥领先,不论是各种技术论坛还是开源项目,大多都围绕着大模型展开。大模型的长期目标是实现 AGI,这可能还有挺长的路要走,但是眼下它已经深刻地影响了“编程”领域。各种 copilot 显著地提升了开发者的效率,但与此同时,开发者也变得非常地焦虑。因为开发者们实实在在感受到了它强大的能力,虽然目前只能辅助还有很多问题,但随着模型能力的增强,以后哪天会不会就失业了?与其担忧,我们不如主动拥抱这种技术变革。
2025-06-21 15:15:21
750
原创 开源工具Ragflow是什么?零基础入门到精通,看这篇就够了!赶紧收藏!
在大模型应用的蓬勃发展中,检索增强生成(Retrieval-Augmented Generation,RAG)技术占据了举足轻重的地位。它就像是大模型的智慧助手,通过从外部知识库中检索相关信息,并将其融入到大模型的回答生成过程中,有效提升了大模型回答的准确性、可靠性和时效性,在问答系统、智能客服、文档摘要等多个领域都发挥着关键作用 。
2025-06-21 15:05:57
907
原创 不需要AI和数学知识背景,这篇文章带你学会大模型应用开发
最近几年,大模型在技术领域的火热程度属于一骑绝尘遥遥领先,它已经深刻地影响了“编程”领域,且正在各个领域迅速渗透。与此同时,普通开发者也变得非常地焦虑,因为实实在在感受到了它强大的威力,担心哪天自己就被取代。与其担忧,我们不如主动拥抱这种技术变革。
2025-06-20 15:53:42
721
原创 大模型开发理论与技术——大模型应用体系梳理,对大模型应用整体认识
随着对大模型技术应用的理解加深,以及和身边朋友和同事的交流,最近发现一个问题,很多人对大模型技术和应用并没有一个整体的认识;而且由于大模型属于一个新兴领域,也因此产生了很多新的概念和名词,所以这也间接导致了很多人认为大模型很难很复杂。
2025-06-20 15:23:35
783
原创 一文讲清楚大模型预训练、后训练、微调,看这一篇就够了!
最近,DeepSeek悄悄做了一次更新,发布了一个小版本:DeepSeek-V3-0324。
2025-06-19 15:05:41
802
原创 什么时候用GraphRAG?RAG VS GraphRAG综合分析
GraphRAG-Bench具有一个全面的数据集,任务难度逐渐增加,涵盖事实检索、复杂推理、上下文总结和创造性生成,并对整个流程进行系统评估,从图构建和知识检索到最终生成。
2025-06-18 14:59:29
289
原创 AI提示词(Prompt)从入门到精通,非常详细,收藏这一篇就够了!!!
提示词(Prompt)是指在使用大语言模型时,用户向模型提供的输入,用于引导模型生成特定类型、主题或格式的文本输出。这种输入可以是一个问题、一个描述、一组关键词或上下文信息;
2025-06-18 14:56:25
1162
原创 在企业场景中应该怎么部署大模型——大模型企业级部署框架介绍
随着大模型的成本越来越低,以及企业生产中对大模型的定制化需求,越来越多的企业选择在本地部署大模型;这样既满足了数据安全性需求,同样也增加了企业定制化的选择。
2025-06-17 14:50:29
1311
原创 LLM运行框架对比:一文讲清楚ollama与vllm的区别
开源的LLM已经成为程序员、爱好者和希望在日常工作中使用生成式AI并保持隐私的用户的最佳选择,对于企业的私有化部署而言也是如此。这些模型提供了优秀的性能,有时在许多任务中可以与大型的闭源模型 (如 GPT-4o 或 Claude Sonnet 3.5) 相媲美。
2025-06-16 15:48:26
1091
原创 RLHF是什么?一文讲清楚ChatGPT中的RLHF!
无论是 ChatGPT 还是 GPT-4,它们的核心技术机制之一都是基于人类反馈的强化学习(Reinforcement Learning from Human Feedback,RLHF)。这是大型语言模型生成领域的新训练范式,即以强化学习方式依据人类反馈优化语言模型。那么,什么是 RLHF 呢?RLHF 背后的基本思想是采用预先训练好的语言模型,并让人们对其输出的结果进行排序。这个输出的排名作为一个信号,引导模型“更喜欢”某些结果,从而诱导响应,使其更安全可信。
2025-06-16 15:44:19
1318
原创 99%开发者不知道的细节:一文读懂DeepSeek R1训练过程!
随着大规模语言模型(LLM)在各类自然语言处理任务中不断突破,如何让模型具备更强的推理能力、生成能力与人类对齐特性,成为研究与工程实践中的重中之重。DeepSeek R1 正是在这样的背景下应运而生,它融合了预训练、监督微调(SFT)、强化学习(RL)及模型蒸馏等多种技术手段,通过分阶段、多轮次的训练迭代,最终构建了一款既具备扎实推理能力,又与人类偏好高度对齐的开源对话模型。在本文中,我们将结合如下流程图(一张纵向展现 DeepSeek R1 训练全貌的思维导图),对训练过程中的每一个模块、每一次迭代都做
2025-06-15 11:45:00
848
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人