- 博客(722)
- 收藏
- 关注
原创 【大模型面试】50道大型语言模型(LLM)面试问题汇总,看完少走99%弯路!
随着人工智能技术的飞速发展,大型语言模型(LLM)已成为当下科技领域的热门焦点,在各行各业的应用愈发广泛,相关岗位的需求也日益增长。无论是求职 LLM 算法工程师、研究员,还是产品经理等岗位,掌握 LLM 的核心知识都至关重要。以下为你汇总 50 道 LLM 面试常见问题,涵盖基础概念、技术原理、模型应用、训练优化等多个方面,助你在面试中从容应对。
2025-07-12 11:53:45
原创 一文吃透 10 款主流 LLM 应用框架:LangChain、Dify、LlamaIndex 等全解析
本文将比较十款主流开源框架:LangChain、Dify、LlamaIndex、Haystack、Flowise、Langflow、CrewAI、AutoGPT、n8n 和 MaxKB,帮助你选择最适合项目的工具。
2025-07-10 12:23:29
882
原创 产品经理转行 AI 产品经理:基础教程(超详细)+ 入门到精通,一篇收藏全掌握
产品经理转行 AI 产品经理:基础教程(超详细)+ 入门到精通,一篇收藏全掌握
2025-07-10 11:58:42
1067
原创 2025 年大模型最新学习路径:从小白到大师,看这一篇就够了
对于许多渴望踏入这个领域的人来说,如何系统地学习大模型知识,从一无所知的小白成长为独当一面的大师,是一个亟待解决的问题。本文将为你详细梳理 2025 年大模型的最新学习路径,助你在这条充满机遇与挑战的道路上稳步前行。
2025-07-09 14:06:54
641
原创 什么是Transformer?Transformer综述,看完这篇你就悟了!
本文将为你全面剖析 Transformer,带你深入理解这一革命性的模型。
2025-07-09 13:56:33
1010
原创 十分钟吃透 RAGFlow:从入门到精通,手把手教你搭建 RAG 知识库”
十分钟吃透 RAGFlow:从入门到精通,手把手教你搭建 RAG 知识库”
2025-07-08 14:24:52
738
原创 【2025 年最新版】最新 AI 大模型入门基础教程(非常详细),收藏这一篇就够了!
在科技飞速发展的 2025 年,AI 大模型已如潮水般涌入我们生活与工作的方方面面。从智能客服精准解答疑问,到自动驾驶保障出行安全;从医疗影像辅助诊断疾病,到智能创作生成各类内容…… 大模型正以前所未有的力量改变着世界。如果你对这个充满魔力的领域充满好奇,渴望踏入 AI 大模型的大门,那么这篇教程将为你照亮前行的道路。它涵盖了大模型的核心知识、学习要点、职业方向等关键内容,助你从零开始,系统掌握 AI 大模型的入门基础。
2025-07-08 14:08:41
912
原创 大模型面试必看:一文讲清楚AI大模型应用开发工程师/算法工程师岗位面试常见问题及答案
大模型面试必看:一文讲清楚AI大模型应用开发工程师/算法工程师岗位面试常见问题及答案
2025-07-07 15:45:29
1227
原创 Transformer入门必读!从文本分词到输出概率的全解析,看这一篇就够了!
Transformer入门必读!从文本分词到输出概率的全解析,看这一篇就够了!
2025-07-07 15:43:16
750
原创 5分钟读懂RAG的原理,让AI学会做笔记
看完以上的介绍,有没有觉得更加清晰RAG到底是啥了。以后别人再问你,拍着胸脯说“这题我熟!不过以上讲的也就RAG的基础理解和用法,后续我还会考虑写写RAG的优化方法或实践,可以关注下我。
2025-06-24 15:35:23
907
原创 超赞!本地程序调用云知识库实现RAG功能
在 Spring AI Alibaba 程序中,我们可以直接使用本地程序调用百炼平台的云知识库,实现知识库文档解析、分块、向量化存储等一条龙服务。这样,,可以大大提升开发效率,非常哇塞。那问题来了,如何对接百炼平台的云知识库呢?本文我们基于最新版正式版 Spring AI Alibaba 和百炼平台带着大家一起操作一下。编写代码操作云知识库。
2025-06-24 15:33:27
913
原创 2025年最新大模型应用落地白皮书:企业AI转型行动指南,附白皮书无偿下载!
应用场景拓展:大模型的应用范围不断扩大,涵盖金融、互联网、零售、医药健康、智能终端、游戏、文化娱乐、教育科研、汽车等多个领域。白皮书列举了多个企业的成功实践案例,如赛力斯、上汽乘用车、海尔消金等,展示了大模型在不同行业中的应用价值。深度融合阶段:大模型技术已进入与业务深度整合的关键时期,企业正积极探索其在具体业务场景中的应用潜力。技术步骤:包括资源投入计划、模型选择、效果评估、开发平台搭建、模型接入、性能安全测试和应用上线等。明确应用场景:企业需根据自身业务需求,选择适合的大模型应用场景。
2025-06-20 19:57:49
623
原创 从被优化到年薪40万:35岁Java程序员的AI大模型逆袭之旅
男人过了35是不是就真的被淘汰了?”电话那头,老李的声音有些沙哑,带着深深的无奈和焦虑。昨天,他刚刚被公司优化,从一家大厂的外包Java开发岗位上离开。我们曾是同一所211大学的同学,毕业后他一直在做Java开发,本以为能安稳地干到退休,却没想到在35岁这年,遭遇了职业生涯的滑铁卢。“现在找工作太难了,很多公司一看我35岁,连面试机会都不给。”老李的声音里透着疲惫,“家里还有房贷、车贷,孩子上学也要花钱,我真的不知道该怎么办了。听着老李的倾诉,我心里五味杂陈。
2025-06-20 19:55:34
798
原创 想从前端成功转型AI大模型?可以听听我的经验!
今天跟大家好好聊一聊这个话题,结合一下自己的经历,我是如何从前端转到大模型这个岗位的,希望能对大家有一点启发。
2025-06-20 19:52:02
551
原创 LangChain + MCP + vLLM + Qwen3-32B 构建本地私有化智能体应用
问答应用,本文还是依据该场景,采用。端,依据上面图片的规划,包括三个。如果启动显存不足,可适当调整。将部分模型权重卸载到内存中。在本专栏的前面文章基于。运行智能体,开始测试。
2025-06-17 19:45:30
986
原创 使用LoRA和QLoRA微调大模型适合新手
本文是一篇适合新手的使用 #LoRA 和 #QLoRA 的 #微调大模型 指南,你可以一步步按照教程来就行,如果有不懂的地方,直接把本文链接传给 AI,并且打开联网搜索或者 #DeepResearch,直接提问即可,现在有了 #AI 学东西是真的方便。
2025-06-17 16:58:11
635
原创 一文速通什么是AI Agent,Coze智能体怎么入门?
最近接触到想要复刻搭建智能体案例的小伙伴,但其对Coze平台的使用熟练度都不是很高。多数都属于初识阶段,面对学习中的卡点无从下手,这里对AI智能体以及Coze基础进行一次整体的介绍。
2025-06-10 16:26:00
715
原创 2025高薪、缺人的AI岗位!机遇与挑战并存,零成本快速入门大模型
随着 AI 技术赋能千行百业,今年,关于 AI 人才的需求大大增加,薪资待遇也水涨船高。如何快速入局?
2025-06-10 16:20:22
4574
原创 MCP + n8n构建高效AI工作流
今天来点干货,本文将通过实战来展示MCP的强大拓展能力,当然它的强大之处也离不开外部的支持,比如支撑本次实战的n8n,下面简单介绍下什么是n8n
2025-06-07 17:06:25
712
原创 Embedding在LLM中的魔力:如何实现精准的文本匹配
在自然语言处理(NLP)领域,Embedding技术扮演着至关重要的角色。它将文本转换为计算机能够理解的数值形式,使得机器能够捕捉和处理文本之间的语义关系。尤其在大型语言模型(LLM)中,Embedding 技术更是实现精准文本匹配的核心。 Embedding 是指将高维度的数据(例如文字、图片、音频)映射到低维度空间的过程。embedding 向量通常是一个由实数构成的向量,它将输入的数据表示成一个连续的数值空间中的点。简单来说,embedding 就是一个N维的实值向量,它几乎可以用来表示任何事情,如文
2025-06-07 17:03:18
796
原创 《AI赋能:企业智能化应用实践》附PDF免费下载
本书是一本介绍AI技术在企业生产和运营过程中实践应用的图书,全书共6章:智能化应用的概念,智能化应用的价值、挑战及发展趋势,智能化技术概述,多行业智能化应用业务场景分析,智能化应用的项目化实施和智能化应用的实践案例。
2025-06-07 17:01:51
660
原创 如何微调推理大模型?以Qwen3/DeepSeek-R1为例
刚好最近在做一个推理训练任务,现在有现成的训练集,推理模型这么强的情况下,怎么把之前传统对话大模型+指令微调训练模式 转变成推理大模型+指令微调任务?
2025-06-04 14:43:46
598
原创 LLaMA Factory:微调DeepSeek-R1-Distill-Qwen-7B模型实现新闻标题分类器
本教程将基于深度求索公司开源的 DeepSeek-R1-Distill-Qwen-7B 模型(以 Qwen2.5-Math-7B 为基模型从 DeepSeek-R1 蒸馏得到),介绍如何使用 PAI 平台及 LLaMA Factory 训练框架微调得到新闻标题分类器:给定新闻的类别范围,通过自然语言触发新闻标题分类的功能,并以特定的格式进行返回
2025-06-04 14:35:44
1225
原创 又一本开源免费的大模型书来了,449页pdf!
《自然语言处理:大模型理论实践》(预览版)一书以自然语言处理中语言模型为主线, 涵盖了从基础理论到高级应用的全方位内容,逐步引导读者从基础的自然语言处理技术走向大模型的深度学习与实际应用。
2025-06-03 15:30:34
632
原创 如何微调推理大模型?以Qwen3/DeepSeek-R1为例
通过能力比较强的推理大模型底座将之前指令数据集蒸馏为思维链数据集,然后进行筛选过滤。具体做法我们可以参考刘聪大佬开源的Chinese-DeepSeek-R1-Distill-data-110k,大致流程是调用企业版满血R1 API,然后数据生成结果进行了二次校验,并保留了评价分数:
2025-06-03 15:28:24
816
原创 如何微调你的第一个领域大模型?
微调(Fine-tuning)大模型,就像是给一个已经学富五车的大脑(预训练的基础大模型),进行一次针对性的“专业强化训练”。基础大模型通过海量数据学习了通用的语言规律和世界知识,但对于特定领域、特定任务,它可能还不够“精通”。微调就是利用少量、高质量的领域数据,在基础模型之上继续训练,让模型更好地适应新的任务或领域。也就是让大模型从一个广度很强的通才,在某个领域树上的技能加强变成一位专才。
2025-06-03 15:26:30
858
原创 中国大模型爆发:大模型落地应用案例集,30+应用案例已落地
今天给大家带来的是《大模型落地应用案例集》,在大部分用户还停留在聊天式的AI对话时,很多行业已经开始悄悄的落地赋能行业能力了,这篇案例集覆盖了医疗、金融、制造、教育等10余个行业,京东、阿里、华为等头部企业的实践尤为亮眼。例如,MiniMax的医疗大模型助力肿瘤患者精准用药,昆仑万维“天工”大模型通过国家备案并实现高效金融风险评估,而商飞则用大模型将飞机设计效率提升千倍。这些案例不仅展示了技术如何解决行业痛点,还揭示了“大模型+垂直场景”的商业模式创新,如按调用量付费、私有化部署等。
2025-06-01 09:30:00
302
原创 使用 Unsloth 快速微调 LLMs 实用指南
大型语言模型(LLM)虽然具备强大的通用能力,但在实际生产部署中往往面临诸多挑战。要使它们真正满足企业级需求,必须确保模型能够:
2025-05-30 20:09:08
1058
原创 详细介绍!RAG 和 GraphRAG:了解何时(When)、如何(How)使用它们
检索增强生成(RAG)主要目的是为了大模型引入外部知识,减少大模型幻觉,是目前大模型应用开发中必不可少的技术之一。但是传统RAG主要是通过语义相似度在向量空间中进行检索,无法捕获数据库中数据点之间的依赖关系。为此,GraphRAG应运而生。本文将详细介绍传统RAG技术、GraphRAG技术、两者之间的优缺点以及如何将两者结合使用。本文结构安排:
2025-05-30 19:41:49
1031
原创 2024人工智能大模型技术财务应用蓝皮书丨附130页PDF下载
蓝皮书主要从人工智能大模型技术概述、人工智能大模型技术体系概述、人工智能大模型技术赋能财务概述、人工智能大模型技术赋能财务应用、人工智能大模型财务应用局限性和关注问题五大篇章进行阐述。
2025-05-29 15:23:25
429
原创 LangChain RAG入门教程:构建基于私有文档的智能问答助手
本文详述了如何通过检索增强生成(RAG)技术构建一个能够利用特定文档集合回答问题的AI系统。通过LangChain框架,可以实现超越预训练模型知识范围的定制化问答能力,适用于专业领域的精准信息检索与生成。
2025-05-29 15:22:06
671
原创 轻松上手,0代码用MCP Server搭建企业级文档处理智能体
MCP诞生时间并不长,但能在短时间内引发这么多关注,我想原因可能就来自于它连接“万物”的设计特殊性,像积木一样把各类AI能力拼装起来,合体成更强的Agent。
2025-05-29 14:37:48
820
原创 AI大模型报告 | 腾讯云《AI大模型应用发展研究报告》(附PDF免费下载)
**《2024年AI大模型应用发展研究报告》** 深入探讨了AI大模型在电信行业的应用前景,特别是电信运营商与云服务商在该领域的合作机会。报告指出,随着AI技术的快速发展,大模型已成为推动行业创新的关键因素。电信运营商凭借其丰富的数据资源和网络基础设施,与云服务商的技术优势相结合,共同探索AI大模型的多元化发展。
2025-05-26 16:03:01
416
原创 在文本分类任务上,Qwen3-0.6B真的比Bert效果好么?
最近在知乎上刷到一个很有意思的提问Qwen3-0.6B这种小模型有什么实际意义和用途。查看了所有回答,有人提到小尺寸模型在边缘设备场景中的优势(低延迟)、也有人提出小模型只是为了开放给其他研究者验证scaling law(Qwen2.5系列丰富的模型尺寸为开源社区验证方法有效性提供了基础)、还有人说4B、7B的Few-Shot效果就已经很好了甚至直接调用更大的LLM也能很好的解决问题。让我比较感兴趣的是有大佬提出小模型在向量搜索、命名实体识别(NER)和文本分类领域中很能打,而另一个被拿来对比的就是Bert
2025-05-26 15:43:03
848
原创 Dify+Ollama+Qwen3案例实战:10分钟实现AI业务数据查询
Qwen3是阿里巴巴于2025年4月29日发布的新一代开源大模型系列,作为通义千问(Qwen)家族的最新成员,它在性能、架构设计和应用场景上实现了多项突破。以下是核心特点:
2025-05-23 15:28:57
1203
原创 AI大模型详解!中国人工智能大模型技术白皮书!
近期,中国人工智能协会发布了《中国人工智能大模型技术白皮书》,系统梳理了大模型技术演进,深入探讨关键技术要素,并剖析当前挑战及未来展望。我为大家做了简要总结,并附上原文供深入阅读。
2025-05-23 15:18:02
1075
原创 零代码搞定!DeepSeek R1+RAG本地部署指南:从Ollama配置到知识库构建
零代码搞定!DeepSeek R1+RAG本地部署指南:从Ollama配置到知识库构建
2025-05-21 14:16:27
857
原创 【Qwen3实战】Dify+Qwen3+Echarts案例实战:实现数据库数据可视化分析
本案例可实现数据和图表合并输出,用户通过自然语言询问,通过大模型转换为sql语言,然后查询数据库并返回数据,再通过大模型将数据转换为标准Echarts格式数据,最终实现从用户自然语言提问到生成图文并茂可视化报告的全流程自动化。
2025-05-21 14:04:45
906
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人