自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

老皮的博客

一位在移动开发领域苦苦前行者

  • 博客(1041)
  • 收藏
  • 关注

原创 DeepSeek新手必看!全功能详解与实操指南

对于有特定需求的用户,DeepSeek还支持上传文件建立自定义知识库。将与自己工作、学习相关的文档、资料上传后,DeepSeek就能基于这些知识为你提供更个性化、针对性更强的回答和建议。例如,企业用户可以上传公司的内部规章制度、业务资料等,让DeepSeek成为企业内部的智能助手;学生可以上传自己的学习笔记、专业文献等,帮助自己更好地学习和复习。

2025-02-05 18:05:20 21212

原创 一文带你搞懂什么是生成式人工智能(GenAI)

AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享!

2024-11-13 11:43:32 9416

原创 工业大模型市场图谱:53个工业大模型全面梳理(通用、行业、场景大模型)看这一篇就够了!

AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享!

2024-09-21 10:11:41 5681

原创 AI大模型之Prompt工程指南:什么是Prompt工程?Prompt工程的格式与要求

Prompt是一种基于人工智能(AI)指令的技术,通过明确而具体的指导语言模型的输出。在提示词工程中,Prompt的定义涵盖了任务、指令和角色三个主要元素,以确保模型生成符合用户需求的文本。Prompt明确而简洁地陈述了用户要求模型生成的内容。这包括在特定应用场景中,用户希望模型完成的任务或生成的文本类型。模型在生成文本时应遵循的指令是Prompt中的关键要素之一。这些指令具体规定了模型生成文本的方式,通过清晰的语言来引导模型以获得所需的输出。Prompt中还包括模型在生成文本时应扮演的角色。

2024-08-01 22:18:51 21896 1

原创 解析LLM、RAG、AI Agent的工作原理(五)RAG 的 5 种分块方法

策略是否推荐用于正式文本是否保留语义完整性实现难度❌❌⭐✅✅⭐⭐⭐✅✅⭐⭐✅✅✅✅⭐⭐✅✅✅✅✅✅⭐⭐⭐⭐如你正在做文档类RAG项目,推荐结构化切分 + 递归切分或语义切分;若你对效果要求极高、资源充足,可以尝试。

2025-06-10 20:30:00 425

原创 解析LLM、RAG、AI Agent的工作原理(四)5 种常见的 Agentic AI 设计模式

这张图介绍了五种最流行的代理AI设计模式,它们分别是:反射模式、工具使用模式、React模式、规划模式和多代理模式。

2025-06-10 20:00:00 792

原创 解析LLM、RAG、AI Agent的工作原理(三)RAG 与 Agentic RAG 对比

RAG 是一种将外部知识库(如文档、数据库)与大语言模型(LLM)结合的技术。它通过“先检索再生成”的方式,让模型不依赖记忆就能回答问题。

2025-06-10 19:00:00 488

原创 解析LLM、RAG、AI Agent的工作原理(二)微调LLM 的5种方法

这张图展示了微调大语言模型(LLM)的 5 种常见方法,都是在原模型权重 冻结不变的前提下,添加少量可训练参数,以实现高效低成本微调的技术方案。传统的 LLM 微调需要训练数百亿参数,非常耗费资源。LoRA 系列方法通过只训练少量附加参数,让微调变得高效、便宜且更易迁移。

2025-06-10 11:25:55 466

原创 解析LLM、RAG、AI Agent的工作原理(一)Transformer 与 LLM 中的混合专家(MoE)

如上图,左边是传统的结构;右边是基于的 Transformer 改进结构。两者前半部分基本相同,主要区别出现在中的部分。

2025-06-10 10:58:18 560

原创 大模型RAG技术 | 总结RAG中最容易犯的5个错误

行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。因此,我们使用专门的大型语言模型 (LLM) 作为重新排序器,重新排列获取的上下文并进一步过滤,找出最相关的分块。如果你将教科书分解成较小的部分,可能每个部分只讨论一个主题,你就能只获取回答问题所需的相关信息。

2025-06-09 11:52:56 370

原创 大模型论文 | 清华提出Test-Time RL,无需标注,模型自学,正确率飙升159%,实现终身学习

AI自我进化,无需人工标注的强化学习来了!过去,训练模型就像教小孩做题——必须提前准备好标准答案(标注数据)。但现实中,许多任务根本没有现成答案,比如解一道全新的奥数题。如何让AI在没有答案的情况下自我提升?这篇论文提出的TTRL(Test-Time强化学习) 给出了答案:让AI自己生成答案,通过“投票”选出共识,再用共识作为奖励信号驱动学习。简单来说,就是让AI“自己出题、自己批改、自己进步”。TTRL的核心流程——模型生成多个答案,投票选出最佳,再根据投票结果优化自身面对一个问题(比如数学题),LLM先

2025-06-08 19:45:00 1480

原创 模型又更新了!阿里发布Qwen3-Embedding系列模型

阿里发布了Qwen3-Embedding系列模型,包括Qwen3-Embedding和Qwen3-Reranker。专为文本嵌入和排序任务设计,基于 Qwen3 基础模型进行训练。这个系列厉害的地方是,它!不管是日常用的主流语言,还是程序员写的各种代码语言,它都能搞定。它特别擅长在下工作,无论是处理单一语言的资料,还是跨越不同语言查找信息(比如用中文搜英文内容),甚至是在一堆代码里找片段,它都能帮你把需要的数据找出来。

2025-06-07 10:49:40 632

原创 一篇详解!以DeepSeek-R1、Qwen3为例搞懂如何微调推理大模型

首先先简单介绍下两个系列的模型:DeepSeek-R1是由深度求索公司推出的首款推理模型,该模型在数学、代码和推理任务上的表现优异。深度求索不仅开源了DeepSeek-R1模型,还发布了从DeepSeek-R1基于Llama和Qwen蒸馏而来的六个密集模型,在各项基准测试中均表现出色。本文以蒸馏模型DeepSeek-R1-Distill-Qwen-7B为例,为您介绍如何微调该系列模型。Qwen3是阿里云通义千问团队于2025年4月29日发布的最新大型语言模型系列,包含2个MoE模型和6个Dense模型。

2025-06-06 20:00:00 775

原创 大模型论文 | 一文总结10 种最新的思维链(Chain-of-Thought, CoT)增强方法

行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。可以说是最科学最系统的学习成长路线。书籍和学习文档资料是学习大模型过程中必不可少的,我们精选了一系列深入探讨大模型技术的书籍和学习文档,学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。

2025-06-06 09:53:15 982

原创 大语言模型 | 一文搞懂多模态视觉-语言模型:Qwen2.5-VL

这背后的原因是什么?因为现在的多模态视觉-语言模型(例如:Qwen2.5-VL)能很好地把图像和文字关联起来,图像直观且包含的信息量大,再加上模型经过大量图文数据的训练,还针对图像任务进行了优化,这正好符合咱们人类更习惯通过看图来理解的认知特点。

2025-06-04 20:00:00 694

原创 一篇搞明白RAG的痛点(六)后备模型、LLM 安全

当使用 LLM 时,你可能会想如果你的模型遇到问题该怎么办,比如 OpenAI 模型的速率限制错误。你需要后备模型,以防你的主模型发生故障。

2025-06-01 08:00:00 706

原创 一篇搞明白AI Agent & 多智能体系统!

LangGraph 是由 LangChain 团队开发的。

2025-05-31 20:30:00 801

原创 一篇搞明白RAG的痛点(五)结构化数据问答、从复杂 PDF 提取数据

没有对结构化数据进行问答的能力。准确解读检索相关结构化数据的用户查询可能很困难,尤其是当查询本身很复杂或有歧义时,加上文本到 SQL 不灵活,当前 LLM 在有效处理这些任务上存在局限。LlamaIndex 提供了 2 个解决方案。

2025-05-31 08:45:00 918

原创 大模型时代,普通人如何抓住风口逆袭?零基础入门AI大模型(非常详细)从入门到精通!

过去一年,ChatGPT-5、Claude-3等大模型的爆发式迭代,让全球AI行业迎来新一轮革命。据招聘平台数据显示,2025年大模型相关岗位薪资同比上涨40%,算法工程师年薪中位数突破50W,而数据工程师、部署工程师等岗位需求更是激增。然而,面对高门槛的技术体系,许多转行者陷入迷茫:“零基础如何入门?哪些方向更容易上岸?

2025-05-30 21:19:20 891

原创 一篇搞明白RAG的痛点(四)不完备、数据摄取的可扩展性

输出不完备。给出的响应没有错,但只是一部分,未能提供全部细节,即便这些信息存在于可访问的上下文中。举个例子,如果某人问「文档 A、B、C 主要讨论了哪些方面?」为了得到全面的答案,更有效的做法可能是单独询问各个文档。

2025-05-30 08:15:00 944

原创 一篇搞明白RAG的痛点(三)格式错误、不正确的具体说明

输出的格式有误。

2025-05-29 08:00:00 1775

原创 大模型论文 | 大模型对齐的本质、核心方法、技术演进、前沿方向

对齐的思想可追溯至20世纪的科幻作品与学术讨论。1920年,科幻剧《R.U.R.》首次提出“机器人威胁”的概念,奠定了早期对机器伦理的思考。1942年,阿西莫夫提出“机器人三定律”,成为最早的AI价值规范雏形。1960年,控制论之父维纳(Norbert Wiener)在《科学》杂志撰文指出:“我们必须确保赋予机器的目标是我们真正渴望的”,这一论述被视为对齐问题的学术起点。

2025-05-28 10:59:58 712

原创 一篇搞明白RAG的痛点(二)不在上下文中——合并策略的局限、未提取出来

重新排名之后缺乏上下文。对于这个痛点,上述论文的定义为:「已经从数据库检索到了带答案的文档,但该文档没能成为生成答案的上下文。发生这种情况的原因是数据库返回了许多文档,之后采用了一种合并过程来检索答案。

2025-05-28 08:15:00 895

原创 一篇搞明白RAG的痛点(一)内容缺失、错过排名靠前的文档

检索增强式生成(RAG)是一种使用检索提升语言模型的技术。具体来说,就是在语言模型生成答案之前,先从广泛的文档数据库中检索相关信息,然后利用这些信息来引导生成过程。这种技术能极大提升内容的准确性和相关性,并能有效缓解幻觉问题,提高知识更新的速度,并增强内容生成的可追溯性。RAG 无疑是最激动人心的人工智能研究领域之一。但 RAG 也并非完美,用户在使用时也常会遭遇一些「痛点」。

2025-05-27 19:52:21 696

原创 企业级大模型知识库部署 | 为什么要在 MacBook上搭建知识库?

另外对于 IT 同学来说,自己亲手搭建一个完整的方案、能灵活调整和对接各种不同的模型、评测各种模型不同的表现,也是出于对技术的探索本能使然。行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。

2025-05-23 19:23:55 919

原创 大模型爆款书推荐《从零构建大语言模型》,中文版来了!

2025 年,人工智能依然是科技圈最热的风口。ChatGPT、Claude、DeepSeek 等模型层出不穷,不断刷新人们对 AI 能力的想象。而支撑这一切的,正是大语言模型(LLM)——这个曾经只是大厂的专属!但问题来了:构建一个属于自己的大模型,真的非得依赖大团队、大算力、大预算不可吗?其实未必!Build a Large Language Model (From Scratch) 这本书,正在彻底打破这个思维定式。

2025-05-20 19:58:25 688

原创 大模型应用开发 | 2025程序员如何转行大模型?可以选择哪些高薪岗位?

2025年,随着DeepSeek的出现和大模型技术的发展,AI行业迎来了前所未有的热潮。对于许多程序员来说,这是一个不容错过的转行良机。

2025-05-20 08:45:00 989

原创 大模型应用开发 | Java开发者如何成功转型AI大模型?

在AI大模型技术席卷全球的浪潮下,传统Java开发者正面临前所未有的职业转型机遇。据LinkedIn 2023年报告,AI相关岗位增长率高达74%,而具备传统开发经验又掌握AI技能的复合型人才尤为稀缺。

2025-05-19 21:24:31 693

原创 2025最新最全大模型学习路线,零基础入门到精通,看完这一篇就够了!

当下,⼈⼯智能市场迎来了爆发期,并逐渐进⼊以⼈⼯通⽤智能(AGI)为主导的新时代。企业纷纷官宣“ AI+ ”战略,为新兴技术⼈才创造丰富的就业机会,⼈才缺⼝将达 400 万!伴随着人才需求增大,AI 大模型新发岗位平均月薪也由 2023 年的 ¥45812 上升至 ¥46452,远超新经济行业平均水平。最近很多程序员朋友都已经学习或者准备学习 AI 大模型,也经常会有小伙伴咨询学习路线和学习资料。学习第一步,咱们先理清楚。

2025-05-16 10:53:27 426

原创 一篇详解当前流行的向量数据库,RAG系统中的向量数据库怎么选?

Pinecone 是一个全托管的云原生向量数据库,专为高性能向量搜索设计,支持实时数据处理和低延迟查询。Milvus 是一个开源向量数据库,基于 FAISS、Annoy 和 HNSW 等算法构建,专为高维向量搜索优化,支持多种索引类型。Weaviate 是一个开源向量数据库,支持混合搜索(向量搜索+传统关键字搜索),内置模块化架构,易于与AI模型集成。Elasticsearch 是一个基于 Lucene 的分布式搜索和分析引擎,通过插件支持向量搜索,适合需要结合结构化和非结构化数据的场景。

2025-05-15 17:51:31 630

原创 大模型入门到精通(非常详细)全解析模型量化Quantization!

大模型(如DeepSeek、Qwen等)参数规模动辄数百亿,全精度(FP32)存储和推理会占用大量显存且速度慢。而模型量化技术通过将浮点数压缩为低精度整数,不仅能让大模型“瘦身”至1/4甚至更小体积,还能显著提升推理效率。例如,175B参数的模型用FP32需700GB显存,而量化到INT4仅需约10GB。

2025-05-13 20:04:57 1128

原创 大模型RAG实战 | RAG系统构建与微调实战

OpenAI于2022年11月30日发布的ChatGPT几乎颠覆了现有的NLP范式, 使NLP算法的日常工作和技术栈都发生了一定的改变。最受关注的两个 落地方向分别为RAG(Retrieval-Augmented Generation,检索增强生 成)和Agent。

2025-05-11 07:00:00 911

原创 如何学会手搓一个AI Agent?《大模型应用开发:动手做AI Agent》

对于构建 Agent 来说,目前业界已经具备技术基础,包括大模型和 AIGC 模型、人工智能应用开发框架和工具、软件平台、丰富的数据等。只要结合具体的业务场景,将现有技术进行整合,就能开发出满足需求的 Agent。

2025-05-10 08:15:00 657

原创 大模型论文 | HiRAG:基于层级知识索引和检索的高精度RAG

Year: 2025检索增强生成(Retrieval Augmented Generation,RAG)通过检索外部知识增强大语言模型(Large Language Models,LLMs)的领域任务能力。朴素RAG方法检索与查询相关的文本块,这些文本块作为大型语言模型生成响应的参考,用于缓解“幻觉”问题(如生成不准确内容),然而朴素RAG方法仅检索文本片段,忽略了实体间的关联(如“亚马逊”与“AWS”的关系),导致上下文碎片化。

2025-05-09 15:23:49 949

原创 大模型论文 | LightPROF:基于知识图谱的大语言模型轻量级推理框架

随着更多大语言模型(LLM)的出现,其持续提升的性能为自然语言处理(NLP)领域带来了重大创新。在庞大数据量和海量参数下展现的"突现能力",使LLM在复杂零样本任务中表现卓越。尽管效果显著,LLM在知识密集型任务中仍面临挑战:由于缺乏任务特定的先验知识和理解能力,以及模型训练的高成本耗时性,导致知识库持续更新困难。为解决这些问题,研究者提出通过知识图谱(KG)为LLM提供可靠且持续更新的知识库,以支持更精准可解释的推理。KGQA作为典型的知识密集型任务,现有工作探索了多种LLM与KG协同推理方法。

2025-05-09 14:07:44 652

原创 大模型RAG实战 | 基于LangChain实现RAG应用

OpenAI于2022年11月30日发布的ChatGPT几乎颠覆了现有的NLP范式, 使NLP算法的日常工作和技术栈都发生了一定的改变。最受关注的两个 落地方向分别为RAG(Retrieval-Augmented Generation,检索增强生 成)和Agent。

2025-05-08 18:50:27 760

原创 大模型论文 | 用于通用上下文推理的基于提示的知识图谱基础模型

Year:2024知识图谱上的推理涉及从现有关系事实中推断出新的关系事实。早期的相关工作主要集中在转导设置下对静态知识图谱进行推理,但缺乏处理知识图谱中新实体或新关系的泛化能力。最近的研究 考虑了已见过的实体和未见过的实体之间的关系模式,从而实现了归纳推理。然而,由于预训练的知识图谱和未见过的知识图谱之间的实体和关系词汇表既不共享也没有关联,这些方法在对未见过的知识图谱进行推理时仍然缺乏迁移能力。将其泛化到新实体、新关系甚至不同知识图谱上的主要挑战在于如何表示这些未见过的数据。

2025-05-06 17:39:38 965

原创 从零入门掌握AI大模型技术,大模型学习路线从入门到精通,收藏这一篇就够了!

一个明确的学习路线可以帮助新人了解从哪里开始,按照什么顺序学习,以及需要掌握哪些知识点。大模型领域涉及的知识点非常广泛,没有明确的学习路线可能会导致新人感到迷茫,不知道应该专注于哪些内容。

2025-05-05 19:38:16 324

原创 大模型入门(四)MHA多头注意力机制技术

多头注意力机制(Multi-Head Attention)是深度学习领域中一种重要的技术,最早由Vaswani等人在2017年的论文《Attention is All You Need》中提出。多头注意力(Multi-Head Attention)是一种在Transformer模型中被广泛采用的注意力机制扩展形式,它通过并行地运行多个独立的注意力机制来获取输入序列的不同子空间的注意力分布,从而更全面地捕获序列中潜在的多种语义关联。

2025-05-04 09:00:00 589

原创 大模型入门(三)MoE混合专家模型技术

想象一个人工智能模型是一个专家团队,每个人都有自己独特的专业知识。混合专家(MoE)模型通过将复杂任务划分为(称为专家的)更小的专业网络来运行这一原则。每个专家专注于问题的一个特定方面,使模型能够更有效、更准确地解决任务。就像医生负责医疗问题,技师负责汽车问题,厨师负责烹饪一样,每个专家都有自己擅长的事情。通过合作,这些专家可以更有效地解决更广泛的问题。

2025-05-03 08:45:00 699

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除