- 博客(1089)
- 收藏
- 关注
原创 DeepSeek 部署指南 (使用 vLLM 本地部署)
vLLM (https://github.com/vllm-project/vllm) 是一个快速且易于使用的库,用于进行大型语言模型的推理和部署。
2025-02-07 12:03:00
42317
4
原创 deepseek满血版本地最强部署教程!从此告别系统繁忙!
哈喽,大家好,要说当今社会什么东西最火那绝对是AI,在AI界最火的当属deepseek,然而所谓树大招风,由于它太优秀导致被各种攻击,所以就会导致使用是经常系统繁忙,实在影响使用心情,今天就教大家怎么在自己电脑本地部署DeepSeek R1 来解决这个问题。
2025-02-07 11:14:56
10123
1
原创 无需GPU!三步实现DeepSeek开源模型本地化部署。
deepseek和chatGpt最大的区别就在于,它是开源的模型,并且训练成本更低,这使得我们普通人也能够在自己的电脑部署大语言模型,训练自己的AI智能体。我们需要谨记的就是,AI是工具,是为了提高我们的效率,它能够给我们提供更精确,更具逻辑的回答,你再根据自身的需求进行修改和采用。最近Deepseek访问量剧增,导致App时常访问不了,但是不用担心,官方给我们提供了本地部署大模型的方案。
2025-02-05 11:06:52
23553
原创 DeepSeek全攻略:从零基础到精通的终极指南
Deep Seek是一款创新的智能搜索与分析平台,致力于通过先进的人工智能技术,帮助用户高效地从海量信息中提取关键信息。无论是数据挖掘、知识管理,还是市场分析,Deep Seek都能为您提供精准的搜索结果和深入的洞察力。今天,我们将带你深入了解这款工具,从入门到精通,掌握它的核心功能与使用技巧,开启高效智能工作的全新篇章。
2025-02-04 11:33:46
59374
原创 收藏!大模型从入门到进阶:小白&程序员必看的技术全解析
2022年末,OpenAI研发的ChatGPT——这款基于生成式预训练Transformer架构的对话式AI,以石破天惊之势闯入公众视野。它的出现如同投入湖面的巨石,激起连锁反应,直接引爆了以大语言模型(简称“大模型”)为核心的人工智能商业化浪潮,标志着全球正式迈入大模型驱动的智能新纪元。此后,大模型领域呈现出双线爆发的鲜明态势:技术层面,从单一文本交互能力向“文本+图像+语音+视频”的多模态融合高速突破,迭代周期不断缩短;
2025-11-24 11:47:36
472
原创 收藏备用!从入门到实战:大模型学习全攻略(小白&程序员专属)
大模型学习不是“技术炫技”,而是基于自身需求的“能力升级”。小白无需畏惧技术门槛,聚焦实用技巧就能快速受益;程序员无需盲目跟风,结合现有技术栈实现融合创新,就能打开职业新空间。无论是哪类群体,学习大模型的核心都在于“拒绝焦虑、精准切入、持续实践”。随着大模型技术的不断成熟,“AI+”的应用场景会越来越广泛——从智能办公、智能开发到智能医疗、智能制造,都离不开懂大模型的人才。小白掌握大模型应用能力,能提升职场竞争力;程序员掌握大模型开发能力,能抢占技术风口。
2025-11-24 11:42:15
793
原创 大模型技术宝典:Transformer、MoE、微调方法与智能体设计,值得反复研读收藏
大模型技术体系正沿着“架构优化(Transformer+MoE)→ 适配能力提升(参数高效微调)→ 知识增强(RAG演进)→ 自主决策(智能体设计)→ 效率优化(KV缓存、文本分块)”的路径快速发展。模型开发:优先采用“Transformer+MoE”架构平衡容量与效率,结合LoRA等微调技术适配具体任务;知识增强:简单场景用传统RAG,复杂推理用Agentic RAG或Graph RAG,模糊查询用HyDE;系统优化:根据文档类型选择文本分块策略,通过KV缓存提升推理速度。
2025-11-24 11:40:49
494
原创 必学】什么是Agentic RAG?2025年大模型应用的核心引擎,建议收藏!
过去两年里,RAG(Retrieval-Augmented Generation,检索增强生成)几乎成为大模型应用的标配,它能把模型的生成能力与外部知识库结合,避免“胡编乱造”。但传统RAG也有瓶颈:面对模糊问题、复杂多跳推理或脏数据时,效果往往不理想。就是在RAG的基础上引入“智能体(Agent)”的能力。它不仅能检索,还能像一个小助手一样自主规划步骤、调用工具、反思和修正,直到产出更精准、更符合语境的结果。
2025-11-23 15:00:00
633
原创 开源神器!AI一键生成n8n工作流,小白也能轻松掌握,快收藏!
总体来说,还可以吧。。不是百分比完美但,从开始写工作流,到最后不到10分钟。还要啥自行车啊!!!但是,要想效果达到最好,最起码你得知道你的工作流大概会用到哪些节点,提示词说明了会更好!另外就是,我这次之所以一次就基本成功,主要还是使用了,并使用的Claude大模型。这很重要!!!以上就今天主要内容了,小伙伴们赶紧去上手实操一下吧~
2025-11-23 10:30:00
671
原创 【必收藏】6步构建企业级AI智能体:从定义到部署的完整指南
首先在企业中选择一些现实的业务场景,并确定需要 AI 智能体才能更好完成的任务。选择一些你可以教一个聪明的实习生做的事情。如果最好的实习生即使有足够的时间和资源也无法完成任务,那么这个任务可能不现实或过于雄心勃勃。在激活专家模式之前,先证明你可以掌握基础知识。首先,想出5-10个具体的企业任务场景。这有两个目的:首先,它验证了你的想法是否定义得当:既不太琐碎也不太模糊。其次,为你以后衡量性能提供了基准。这个过程旨在帮助你构建基于明确用例、经过真实例子测试并由真实世界反馈塑造的 AI 智能体。
2025-11-22 14:15:37
1024
原创 程序员必看!Java与大模型开发:2025年如何选择你的技术路线?(建议收藏)
本文分析了2025年计算机专业学生在Java开发和人工智能方向的选择。Java稳定但竞争加剧,AI尤其是大模型领域增长快但门槛高。建议根据个人条件选择,优先考虑"Java+AI"复合路线,培养扎实基础,通过项目实践明确方向,关注行业动态,选择与个人特质匹配的发展路径,以在技术变革中保持竞争力。在2025年人工智能技术重构全球产业格局的浪潮下,计算机专业学生正面临一个关键抉择:是选择成熟稳定的Java开发体系,还是投身爆发式增长的AI领域?
2025-11-22 14:08:33
781
原创 AI人才抢夺战:大模型算法工程师月薪2.4万+,收藏这份2026校招指南,小白也能轻松入行
本文介绍了AI人才市场的火爆现状:高科技企业成为AI人才需求主力军,近60%已将AI人才纳入核心招聘目标;大模型算法工程师等岗位薪酬亮眼,月薪中位数超2.4万;字节跳动、京东、美团等大厂秋招开放大量AI岗位;预计到2030年,中国AI人才需求将增长至2022年的6倍,缺口达400万。AI人才已成为企业竞逐行业制高点的核心战略资源。
2025-11-21 13:59:20
998
原创 程序员必藏:AI Agents与Agentic AI完全解析:概念分类、应用场景与挑战
本综述采用一种结构化、多阶段的研究方法,旨在系统把握AI Agents与Agentic AI的演进历程、架构特征、应用场景及现存局限。该方法流程如图3所示,清晰勾勒出本研究中各主题与概念的递进逻辑关系。分析框架的设计聚焦于呈现从以LLM为基础的基本能动结构,到高级多智能体协同系统的演进路径。综述各环节均基于对学术文献及AI赋能平台所发布成果的严谨综合与提炼,从而实现对当前研究格局及其新兴趋势的全面把握。
2025-11-21 13:57:00
1010
原创 【必学收藏】大模型微调全攻略:LoRA/QLoRA核心技术+实战应用
大模型微调指在已有的大规模预训练模型基础上,通过对标注数据进行训练,进一步优化模型的表现,以适应特定任务或场景的需求。与 RAG 或者 Agent 技术通过搭建工作流来优化模型表现不同,微调是通过修改模型参数来优化模型能力,是一种能够让模型 “永久” 掌握某种能力的方法。尽管全量微调可以深度改造模型能力,但需消耗大量算力且有一定技术门槛。在绝大多数场景中,若只想提升模型某个具体领域的能力,高效微调会更加合适,而目前适用于大模型的最主流高效微调方法是 LoRA。
2025-11-21 13:53:47
592
原创 大模型架构选型完全指南:程序员必藏的实战干货课
本文系统解析AI大模型应用技术选型,对比LLM、RAG、Workflow、Agent和Multi-Agent的适用场景。提出基于场景指标的决策框架:RAG适合大数据量与实时更新场景;Workflow提供可控性而Agent增强灵活性;Multi-Agent需满足可拆解、可验证、成本可控三条件。强调技术落地没有万能方案,企业应根据业务需求选择混合架构,平衡通用化与专业化、自主性与可控性、成本与性能。
2025-11-20 15:30:00
907
原创 码农必看!大模型从入门到精通秘籍,赶紧收藏!
大模型技术更新迭代极快,从GPT-3到GPT-4仅用2年,从单模态到多模态的跨越也不过1年,试图“学完所有知识再行动”并不现实。最好的学习方式是“边学边练、持续迭代”——先完成最小可行性项目,再在优化中补充知识,在解决实际问题中提升能力。中国科学院院士姚期智曾说:“AI时代的核心竞争力,不是掌握现有技术,而是具备快速学习新技术的能力。” 大模型学习没有“终点”,但有明确的“起点”——现在打开HuggingFace官网,跑通第一个模型Demo,就是你抢占AI时代先机的开始。保证100%免费。
2025-11-20 11:18:01
535
原创 大模型进阶必看:上下文工程全解析,让你的AI智能体自主学习进化
Shopify的CEO Tobi Lutke这样形容上下文工程:为LLM提供所有用于合理解决任务的上下文信息的艺术。如果说上下文是LLM的RAM(来自OpenAI 前研究科学家 Karpathy的比喻),那么上下文工程(Context Engineering)就是 — 设计并实施这块有限 RAM 的管理机制,让信息的组织、输入、更新、淘汰都更有秩序与目的性。上下文工程不是简单的提示模板设计与堆叠(尽管提示模板是它的一角)。
2025-11-20 11:11:56
1027
原创 2025年大模型学习指南:从入门到进阶的完整路径
大模型技术更新速度极快,从GPT-3到GPT-4仅用2年,从单模态到多模态的跨越也不过1年时间,试图“学完所有知识再行动”是不现实的。最好的学习方式是“边学边练、持续迭代”——先完成一个最小可行性项目,再在优化项目的过程中补充知识,在解决实际问题的过程中提升能力。中国科学院院士姚期智曾说:“AI时代的核心竞争力,不是掌握现有技术,而是具备快速学习新技术的能力。” 大模型学习没有“终点”,但有明确的“起点”——现在就打开HuggingFace官网,跑通第一个模型Demo,就是你抢占AI时代先机的开始。
2025-11-19 11:08:31
989
原创 【干货收藏】AI智能体(AI Agent)详解:原理、应用与平台选择,程序员必备
本文详细介绍了AI智能体(AI Agent)的概念,强调其能自主理解、规划和执行复杂任务,区别于普通AI助手。智能体已广泛应用于生活、工作和专业领域,具有自动化特点。文章介绍了四个主流智能体平台,并解析了智能体完成任务的四步流程:理解任务、制定计划、执行行动和检查调整。随着技术发展,AI智能体将成为每个人的得力助手,未来每个人可能拥有多个专属AI智能体。
2025-11-19 11:06:53
1040
原创 【必学】智能客服、知识库、RAG应用实战指南:向量模型、库与排序器选型全解析(建议收藏)
一个文本 embedding 模型的核心目标是:把文本映射成一个能表达语义的向量,供向量库做检索、排序或相似度计算。指标说明语义表达能力(semantic fidelity)能否区分语义细微差别,比如“关闭灯”和“打开灯”之间压缩率(是否能低维表达)像 GTE 模型只有 384 维,而 BGE 有 1024 维,但效果不一定差领域适应性是通用模型还是特定领域的(如医疗、法律)?中英文支持有些模型只适合英文,如 OpenAI ada v2,有些是多语言模型大小/部署难度能不能本地部署?资源占用大不大?
2025-11-19 11:04:22
731
原创 大模型学习避坑:从“会用”到“精通”的3重能力跃迁
打开手机,ChatGPT能陪你聊天,Midjourney能帮你画图;打开电脑,LangChain文档翻了几十页,Python脚本也能跑通简单的RAGdemo。很多人就此觉得“我懂大模型了”,可一到实际工作中就露怯:领导要做企业专属知识库,不知道从何下手;模型推理延迟太高,调了半天毫无头绪;面试时被问“如何平衡模型效果与成本”,只能支支吾吾。
2025-11-18 15:00:00
775
原创 面试必背:RAG优化手段,从基础到前沿的完整攻略
如果要在面试中浓缩成一分钟回答,可以这么说👇检索器优化:混合检索、两阶段检索、查询改写;索引优化:语义分块、元数据、GraphRAG;生成优化:Prompt设计、事实一致性验证、输出过滤。我在项目中主要通过Hybrid Search + Reranker的方式提升了检索精度,同时结合语义分块与Prompt模板显著降低了幻觉率。这种答法既系统、又体现了实践深度。在大模型面试中,RAG是最常见的工程落地话题之一,能答出“RAG是什么”是基础,能答出“RAG怎么优化”才是真正的实力。
2025-11-18 10:58:36
900
原创 RAG技术2025:收藏必备的五大发展方向深度解析
2025年,RAG将彻底告别“独立明星”地位,成为智能体生态中的关键组件。智能化:通过Agentic RAG和任务分解,解锁复杂场景的推理能力。多模态化:多模态RAG支持文本、图像、视频的统一检索,覆盖更多行业。精细化:GraphRAG通过动态更新和因果推理提升召回精准性。低成本化:轻量化RAG和低代码平台降低中小企业部署门槛。行业化:定制化RAG深入垂直领域,解决特有痛点。“RAG已死,RAG万岁!
2025-11-18 10:53:43
937
原创 一文吃透大语言模型:从核心原理到实践应用
大语言模型是一种用于理解、生成和响应类似人类语言文本的神经网络。这类模型属于深度神经网络(deep neural network),通过大规模文本数据训练而成,其训练资料甚至可能涵盖了互联网上大部分公开的文本。“大语言模型”这一名称中的“大”字,既体现了模型训练时所依赖的庞大数据集,也反映了模型本身庞大的参数规模。这类模型通常拥有数百亿甚至数千亿个参数这些参数是神经网络中的可调整权重,在训练过程中不断被优化,以预测文本序列中的下一个词。下一单词预测。
2025-11-17 10:58:22
1328
原创 从提示词到上下文工程:AI 智能体开发的进阶指南
说实话,智能体的开发,核心就是调教。就像面对同样的新员工,不同公司有不同的培训方式,同样质量的新员工在不同的公司可能发展的好坏千差万别,和公司的培训体系、教学方式都有很大关系。所以,我一直认为,智能体开发是一个非常主观的事情,就像是一个公司的制度一样,可能有很多大公司的治理经验和体系化的制度可以供小公司参考。但是,最适合于自己公司的那套机制还是需要自己去开发的。保证100%免费。
2025-11-17 10:55:22
799
原创 收藏必备!200页大模型训练指南:从Why到How,Hugging Face实战经验全解析
本文系统介绍了Hugging Face构建世界级大语言模型的全流程,强调训练前需明确"Why-What-How"思考链条。从小规模消融实验开始,解决长周期训练中的吞吐量下降和并行化Bug等问题,并通过后训练(监督微调、偏好优化等)提升模型性能。这份200页详细手册为AI初学者、工程师和团队提供了宝贵的实战经验。对于技术小白而言,能否快速从零开始训练一个世界级的大语言模型(LLM)呢?答案或许是:可以的。
2025-11-14 13:15:00
584
原创 程序员收藏!一文掌握RAG:LangChain实现检索增强生成的两种架构
大模型赋能的最强大应用之一,便是功能完善的问答(Q&A)聊天机器人。这类应用能够针对特定来源的信息回答问题,其核心技术是检索增强生成(Retrieval Augmented Generation,简称 RAG)。Agentic RAG:通过工具执行搜索的RAG智能体,这是一种通用性较强的实现方案。Two-Step RAG:每次查询仅需调用一次大模型的两步式RAG链,该方案速度快、效果好,适用于处理简单查询。保证100%免费。
2025-11-14 09:15:00
868
原创 AI Agent多Agent协同系统开发:从入门到精通,建议收藏
Lambda: 它允许用户在工作流中嵌入自定义的函数逻辑。Lambda 组件底层是由输入输出是否流所形成的 4 种运行函数组成,对应 4 种交互模式,也是流式编程范式:InvokeStreamCollectTransform。一般用于在运行图中,进行输入输出格式化转化,以及插入一下业务的自定义逻辑,例如参数响应的格式化等等。##### 编排(Compose)
2025-11-13 13:42:23
921
原创 收藏必备!构建高级RAG代理:打造能理解上下文的智能问答系统
我们成功构建了一个能够处理复杂对话的高级RAG代理。这个系统通过多个AI技术的协同工作,实现了更加智能、上下文感知、可靠的对话AI。上下文感知的问题改写:使对话更加自然流畅。多层质量控制:通过分类和分级确保回答的质量。迭代改进检索:提高检索的成功率。强大的工作流管理:具备完善的错误处理机制。这个架构为构建能够处理复杂、多轮对话的生产级RAG应用提供了坚实的基础,能够在保持高质量和相关性的同时,为用户提供准确、有用的信息。保证100%免费。
2025-11-13 12:09:34
997
原创 收藏必备:小白也能学会的RAG系统构建:通义千问1.5+LlamaIndex实践
LLM会产生误导性的 “幻觉”,依赖的信息可能过时,处理特定知识时效率不高,缺乏专业领域的深度洞察,同时在推理能力上也有所欠缺。正是在这样的背景下,检索增强生成技术(Retrieval-Augmented Generation,RAG)应时而生,成为 AI 时代的一大趋势。RAG 通过在语言模型生成答案之前,先从广泛的文档数据库中检索相关信息,然后利用这些信息来引导生成过程,极大地提升了内容的准确性和相关性。
2025-11-12 14:45:00
934
原创 一篇搞懂AI智能体:概念、能力、结构与应用,建议收藏学习
其实 AI 智能体和聊天机器人有区别,它更多强调的是 AI 的自主性。人类提供任务,AI 自主拆解调用工具去执行。从结构层面来讲,现在其实有一大堆智能体。但从能力层面来讲,其实很多所谓的智能体还没有真正达到比较理想的状态。
2025-11-11 14:32:04
1316
原创 大模型进阶必学:AI Agents架构、分类与实战应用详解,程序员收藏指南
本报告《Introduction to Agents》由Google团队于2025年11月发布,核心主题是系统介绍人工智能代理(AI Agents)的架构、分类和实战应用,标志着AI从被动内容生成向自主问题解决的范式转移。报告的主要结论是:AI Agents已成为软件演进的下一阶段,通过结合语言模型的推理能力与外部工具的执行能力,能独立完成多步骤复杂任务。关键洞察包括:(1)技术突破:Agents通过“思考-行动-观察”循环实现自主性,从单机工具升级为协同团队;(2)行业影响。
2025-11-11 14:30:52
1193
原创 35 岁程序员被裁后,我靠 AI 转型年薪翻倍:附完整学习路径
35岁从来不是程序员的职业终点,而是职业升级的新起点。AI浪潮带来的不是淘汰,而是行业重构与机会重组。35岁程序员拥有的技术经验、业务理解和问题解决能力,在AI时代反而更具价值。如果你正面临35岁职业困境,不妨勇敢拥抱变化,找准转型方向,通过系统学习与实战积累,在AI领域开辟新的职业赛道。相信只要保持初心、持续努力,你一定能突破年龄限制,实现职业的二次腾飞。
2025-11-10 11:42:48
445
原创 干货收藏!8步打造你的AI智能体:大模型进阶必学教程
明确智能体要解决的问题、目标人群、成功指标与约束条件。📌提示:从一个具体场景出发,如“AI 财务分析师”或“AI 办公助理”。
2025-11-10 11:38:26
1076
原创 2025年最火技术岗来袭:大模型应用开发工程师,你准备好了吗?
要问2025年哪个技术岗位最火?那一定是!(劝大家越早转型越好,以后门槛会越来越高!未来5年AI人才缺口400W,快速入局,成为行业专家;63%企业都在布局AI,比同行更快一步技术升级,构建技术壁垒;从去年起,腾讯、字节等一线大厂相关岗位薪资已经,DeepSeek爆火更是加速了各行业AI应用落地,用百万年薪寻找的AI人才。如今技术圈降薪裁员频频爆发……好多人都怕被AI取代,希望通过迭代AI技术,成为中坚力量,延长职业寿命!
2025-11-08 11:57:38
1085
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅