- 博客(2152)
- 收藏
- 关注
原创 LLM大模型学习文档+教程+PDF书籍+系统学习路线,一套全拿到!
LLM相关的内容很多,现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学,学习成本和门槛很高。
2025-03-28 20:04:32
644
1
原创 Java程序员AI上岸指南:3步零成本转型,抄近道了!
最近刷招聘软件的开发者们发现:后端岗位数量锐减,薪资涨幅停滞,甚至有求职者反馈投递70份简历仅收到3个面试邀约,薪资同比降低10%。
2026-01-09 11:50:42
671
原创 用 Java 玩转本地大模型:Spring AI + Ollama 实现网页端实时对话
今天我就分享一下,如何用 Spring AI 1.0.0-M8 搭配 Ollama,快速搭建一个 流式问答的 HTML 页面。
2026-01-09 11:49:48
570
原创 Java逆袭机会来啦!AI应用开发再不入行真来不及了!
无论是AI技术岗位还是非技术岗位占比,从2024年到2025年都有明显提升,表明AI技术在企业中的渗透和应用正在加速。
2026-01-09 11:49:10
369
原创 Google的这篇70页上下文工程的雄文到底讲了什么?为您整理并奉上中文PPT解读
我们基于原文进行了精读、翻译与结构化整理,形成了这套精简版解读 PPT(是的,借助了Nano Banana Pro),帮助读者更轻松地理解上下文工程的关键思想与应用方法。
2026-01-08 13:54:19
268
原创 AI大模型实战——如何基于ChatGLM3-6B+Lora基本法律常识大模型
目前我们接触的无论是千亿大模型,如 130B、ChatGPT,还是小规模的大模型,如 6B、LLaMA2,都是通用大模型,就是说通过通用常识进行预训练的。
2026-01-08 13:53:22
432
原创 从检索到生成:解析RAG两阶段任务的分工与流程——你真的理解什么是检索和生成吗?
RAG的核心原理或者说流程是,根据用户问题检索到相关内容,然后再把检索到的内容交给模型进行生成任务。
2026-01-08 13:51:53
633
原创 AI时代必备技能get!一图看懂“上下文工程”帮你玩转大模型
别担心!今天给大家带来一份超实用的“上下文工程速查指南”! 赶紧收藏起来,免得以后需要的时候就找不到了!
2026-01-06 11:38:19
676
原创 智能体变笨了是什么原因? 怎么优化?
今天测试过程中遇到的问题主要有以下几种现象,随着对话轮数的增多,智能体无法准确识别工具并调用,甚至开始使用自身的知识和历史记录进行回答;并且,无法保证知识来源的准确性。
2026-01-06 11:36:49
858
原创 跟我学LangChain:入门指南,基于LLM构建强大AI应用的“魔法框架”
LangChain 是一个用于开发由大型语言模型 (LLMs) 驱动的应用程序的框架。它为开发者提供了一系列的工具和组件,开发者只需要写几行代码,就能运行一个大型LLM程序,甚至快速构建一个响应式的机器人。
2026-01-06 11:35:52
837
原创 2025年AI大模型终极点评:从王者到青铜,这份排名有点狠
今天,咱们就来一场纯主观、不讲情面的终极点评。从曾经的王者到如今的青铜,从国际巨头到国产新秀,一个都不放过!
2026-01-06 11:06:42
303
原创 LangChain 定义新赛道:Agent Engineering,让 AI 智能体从“能跑“到“可靠“
Agent 工程是将非确定性 LLM 系统迭代优化为可靠生产体验的过程。这是一个循环过程:构建、测试、发布、观察、优化、重复。
2026-01-05 11:11:54
553
原创 RAG 检索分不清“李逵”和“李鬼”?手把手微调垂直领域 Rerank 模型,让干扰项归零!(附数据生成+训练源码)
今天,结合我最近在政务领域的真实调优案例(在 3090 卡上调优),手把手带大家走一遍 Rerank 微调的全流程。
2026-01-05 11:11:19
737
原创 RAG的前世今生:AI Agent的记忆真相
LLM已有知识是旧的(训练完就定了),而且它不知道具体某公司的内部文档。RAG就是相当于给它一本参考书(比如公司的知识库),通过检索外部知识来增强LLM的回答。
2026-01-05 11:10:42
742
原创 2025年RAG已死?2026年做Agentic 和上下文工程?
这篇文章,既是对过去一年的复盘,也是给自己和同行的一些提醒:技术本身没有对错,关键在于是否用对了地方。
2026-01-05 11:07:40
539
原创 最近参与了大量Agent开发,于是想说……
这篇文章清晰地定义了agent和workflow的概念区别,并且以非常简明扼要的图文解释了围绕LLM来构建agent的多种流程。
2026-01-05 11:06:50
845
原创 大模型应用开发必需了解的基本概念
AI/LLM 大模型最近几年毋庸置疑的是热度第一,虽然我日常一直在用 AI 提效,但真正使用大模型做一个应用的机会还是少。
2026-01-04 10:41:46
623
原创 AI 并不懂文字,它只认向量:一文搞懂 Embedding
当你问 AI “什么是人工智能?”时,它真的“读懂”了这几个字吗?其实,AI 根本不理解文字的含义——在它眼里,没有“苹果”“爱情”或“代码”,只有冰冷的数字。
2026-01-04 10:40:26
676
原创 别再怪大模型了!RAG效果差,90%的问题出在这三个环节!
本文将带您系统拆解RAG的三大阶段,揭示每个环节的典型陷阱,并提供可落地的优化方案——从用智能文档技术破解PDF难题,到通过动态防护栏杜绝“幻觉”,助您真正释放RAG的生产力潜能。
2026-01-04 10:39:10
649
原创 不会写 Prompt?你可能正在白白浪费 AI
这篇文章就分享下anthropic这家公司出的AI使用指南。anthropic这家公司有些人可能不熟悉,编程领域的明珠 Claude 就是他们家的产品!
2026-01-03 09:30:00
797
原创 可部署本地大模型+知识库(RAG)介绍,一文全讲解(附教程)
本文介绍一种可部署于本地的大模型应用:“本地大模型+知识库(RAG,检索增强生成)”,有助于解决上述的问题。
2026-01-02 08:45:00
649
原创 阿里云大模型课程学习笔记-提示词工程(Prompt Engineering)
提示词工程(Prompt Engineering) 就是研究如何构建和调整提示词,从而让大语言模型实现各种符合用户预期的任务的过程。
2026-01-01 08:15:00
1583
原创 淘天二面:为何大模型离不开RL?
因为是强化学习小白,没有系统深度的 RL 知识储备,本文只是从 LLM 角度出发,简单思考和梳理 LLM 中关于强化学习的若干问题,请大佬们指点。
2025-12-31 10:41:32
733
原创 一文带你了解模型量化、剪枝和蒸馏
模型量化、剪枝和蒸馏是三种主流的模型压缩与优化技术,核心目标是在保证模型性能(精度、准确率)的前提下,减小模型体积、降低计算复杂度,使其能在资源受限的设备(如手机、嵌入式设备、边缘终端)上高效部署。
2025-12-31 10:39:58
889
原创 LLM应用开发进阶 · 序-为什么你“会用 LLM”,但做不出复杂应用?
LLM应用开发进阶 · 序-为什么你“会用 LLM”,但做不出复杂应用?
2025-12-31 10:38:33
791
原创 硅谷大厂集体改用中国大模型,国产AI成全球顶流!网友:一用一个不吱声……
硅谷大厂集体改用中国大模型,国产AI成全球顶流!网友:一用一个不吱声……
2025-12-31 10:37:47
427
原创 【LangChain】一文读懂RAG基础以及基于langchain的RAG实战
我查找了langchain的官方文档,并利用文档中提供的方法进行了实际操作。这篇文章是我的学习笔记,也希望为同样存在相同困惑的伙伴们能提供一些帮助。
2025-12-30 10:51:43
550
原创 AI对话魔法|Prompt Engineering 探索指南
Prompt Engineering 就是设计和优化与AI对话的“提示词”或“指令”,让AI能准确理解并提供有用的回应。
2025-12-30 10:50:05
608
原创 企业和个人基于业务知识和代码库增强的大模型生成代码实践
本文基于笔者在校招研发入职初起的真实困境出发,针对新人上手难,知识资产容易流失,运维耗时,以及基于AI结合的产研提效做了一系列工作,提出了产研分阶段应用大模型的策略,在第二阶段提出将大模型与系统知识库结合,以解决企业代码相关资产管理和沉淀以及利用率问题,同时能够很好的解决运维以及新人熟悉系统难的问题。
2025-12-30 10:48:19
943
原创 开源 Ai Agent 智能体,能用、能改、能学,美滋滋!
先是 RAG 知识库,再到 MCP 服务,越来越多的互联网公司掀起了 Ai 智能体的设计和落地。作为程序员👨🏻💻,我们是最早一波接触和使用了各类的 Ai Agent 产品的暖水鸭🦆,包括;Coze、Dify、Claude,以及编程类软件智能体,Cursor、Trae.ai 等。但是,也是作为程序员,其实我们更好奇,这东西是如何实现的。——我说的,Ai Agent 就不能是那种工作流配置的,太固定的东西,没法适应更多的场景。
2025-12-30 10:47:00
951
原创 保姆级教程:零代码基础也能微调Qwen3,并本地部署
我们将在本文介绍如何微调使模型成为一个"双重人格"的助手,既能进行普通闲聊,又能在需要时切换到更严谨的思考模式来解决复杂问题,特别是数学问题。
2025-12-29 13:52:38
926
原创 零基础也能体验模型微调!魔塔+LLaMa Factory手把手教程
我们天天微调微调,微调到底是啥感觉?所以今天用魔塔+LLaMa Factory 体验微调一个模型,文科生也能跑完,不用考虑你自己电脑的配置。
2025-12-29 13:52:04
1045
原创 LLaMA Factory 如何对大模型进行微调、导出和量化!掌握这几步,轻松搞定
LLaMA Factory的源码里默认提供了很多种可直接训练的数据集,在data目录下。我们就拿identity.json身份认知训练集来做微调。
2025-12-29 13:51:31
814
原创 零基础也能轻松掌握LLM!这份《大语言模型实战》可视化指南,吴恩达都点赞
对于许多初学者或希望深入理解大模型技术的朋友来说,面对浩瀚的理论和复杂的代码,往往会感到无从下手,甚至望而却步。
2025-12-29 13:50:19
747
原创 我力荐这本大模型书,真的贼好懂,还讲得特别细致(附PDF)
随着人工智能的不断演进,大模型正站在最前沿,彻底改变我们与机器的互动方式、信息处理流程,甚至语言本身的理解方式。
2025-12-29 13:49:30
1011
原创 LLaMA-Factory:让大模型微调变得如此简单
今天给大家介绍一个开源神器——LLaMA-Factory,它让大模型微调变得前所未有的简单!
2025-12-29 13:48:37
697
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅