自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(500)
  • 收藏
  • 关注

原创 2025大模型入门—写给小白的大模型入门科普,从入门到精通收藏这篇就够了!!(附教程)

文章摘要: 大模型(Large Model)是指包含超大规模参数的神经网络模型,通常指语言大模型(LLM)。其特点包括参数规模大、架构复杂、训练数据庞大及算力需求高。训练分为预训练和微调两个阶段:预训练通过海量未标注数据学习通用特征,微调则用特定领域数据优化模型性能。大模型具备“涌现能力”和“泛化能力”,但参数过多可能导致过拟合。训练完成后,模型可用于推理任务(如问答、内容生成)。通用大模型经微调可变为行业或专业模型,提升垂直领域表现。该技术依赖强大算力,成本高昂,但能高效处理复杂任务。

2025-06-12 22:47:04 931

原创 2025年AI行业6大高薪职位揭秘:薪资曝光!_ai研究科学家年薪

AI领域6大高薪职位解析 本文介绍了2024年AI行业最具赚钱潜力的6个职位:1.提示工程师(年薪91万),负责优化AI模型提示;2.AI研究科学家(年薪93万),开发新算法;3.AI软件工程师(年薪105万),整合AI功能;4.AI产品经理(年薪106万),协调技术与业务;5.AI顾问(年薪111万),为企业提供AI解决方案;6.AI创业公司创始人,潜在收益巨大。文章建议通过系统学习提升技能,把握AI时代职业机遇。

2025-06-12 22:42:08 776

原创 多模态RAG实战指南:完整Python代码实现AI同时理解图片、表格和文本

本文提出了一种多模态RAG(检索增强生成)方法,旨在处理包含文本、图像、表格等多模态内容的文档。该方法采用模态特定处理、后期融合和关系保留的技术架构,在性能、准确性和实现复杂度之间取得了平衡。通过结构保留的文档分割、模态特定内容提取、关系保留的HTML转换、语义分块和多模态向量化等步骤,系统能够有效处理复杂文档中的多模态信息。实验表明,该方法在检索精度上比统一方法提升23%,并具有良好的灵活性和模块化特征。文章还详细介绍了系统的工作流程和优势,为多模态RAG系统的开发提供了可行方案。

2025-06-10 19:50:18 851

原创 大模型入门好书推荐 -复旦NLP团队2025新书《大规模语言模型:从理论到实践(第2版)》

大语言模型(Large Language Models,LLM)是一种由包含数百亿以上权重的深度神经网络构建的语言模型,使用自监督学习方法通过大量无标记文本进行训练。自2018年以来,包含Google、OpenAI、Meta、百度、华为等公司和研究机构都纷纷发布了包括BERT, GPT等在内多种模型,并在几乎所有自然语言处理任务中都表现出色。2021年开始大模型呈现爆发式的增长,特别是2022年11月ChatGPT发布后,更是引起了全世界的广泛关注。用户可以使用自然语言与系统交互,从而实现包括问答、分类、摘

2025-06-10 18:54:56 997

原创 小白学大模型:适合1B模型的17个提示词

摘要: 针对小模型(1B参数量)优化提示词的关键在于明确指令、提供上下文和分步引导。通过零样例提示(简洁任务)、少样例提示(示例引导)、角色提示(特定视角)等12种技巧,可以显著提升小模型的任务理解能力。重点包括:1)用分步推理(CoT)处理复杂问题;2)通过系统提示设定全局约束;3)输出引导控制格式。这些方法弥补了小模型知识储备的不足,使其在特定场景下接近大模型效果,同时保持低成本优势。

2025-06-04 22:15:49 694

原创 假如你从25年6月开始学习大模型

不管是小白还是打算转行,希望对你们都能有帮助。第一阶段:认识大模型1️⃣:机器学习基础(19小时)

2025-06-04 22:10:02 807

原创 如何搭建mcp服务操纵dify工作流?

本文介绍了如何开发自定义MCP服务来连接Dify工作流与AI系统。主要内容包括: MCP作为接口可以为大模型提供丰富功能扩展,作者基于Dify工作流开发了专属MCP工具 详细说明了环境搭建步骤,包括安装uv、配置Python虚拟环境等前置条件 重点讲解了函数定义方法,通过@mcp.tool()装饰器注册服务,并规范了输入输出格式 展示了与Dify工作流对接的实现逻辑,包括请求发送、流式输出处理等关键代码 提供了完整的Python示例代码,实现了一个可返回Dify工作流执行结果的MCP服务 该方案使AI系统能

2025-05-29 22:08:41 653

原创 大模型技术基础学习路线,想要学好大模型应该具备哪些能力?

大模型技术学习路线指南 学习大模型技术需掌握六大基础: 理论基础:理解AI、机器学习、神经网络等核心概念 编程基础:Python为主,掌握算法实现能力 框架掌握:熟练使用PyTorch、TensorFlow等深度学习框架 领域知识:结合NLP/CV等具体应用方向 实践训练:通过项目验证理论,避免纸上谈兵 数学基础:扎实的算法与数学推导能力 学习路径包含七阶段进阶:从系统设计、提示词工程到微调开发、多模态应用。建议理论实践结合,关注行业最新动态,通过实际项目积累经验。

2025-05-29 22:03:03 1188

原创 SIGIR 25:快手基于层次搜索的LLM推荐

大型语言模型(LLM)在推荐系统中的应用面临长文本处理和兴趣动态变化两大挑战。本文提出HiT-LBM框架,通过分块用户行为提取、层次树搜索兴趣和时间感知兴趣融合三个模块,有效捕捉用户兴趣及其演变。实验表明,该框架可提升多种推荐模型的性能,在公开数据集和工业场景中均表现优异,尤其对长尾用户效果显著。在线A/B测试显示收入提升3.5%,转化率提升2.3%。

2025-05-28 22:58:05 1043

原创 16.8k Star 的吴恩达大佬的小白模型手册_吴恩达小白模型手册

这是一份专为开发者打造的大模型学习手册,旨在帮助国内开发者快速掌握大型语言模型(LLM)的开发与应用能力。项目以吴恩达老师的大模型系列课程为基础,通过内容筛选、翻译、复现与优化,构建了一套系统化的学习路径,覆盖从 Prompt 设计到 RAG 开发、模型微调的全流程实践。

2025-05-28 22:54:12 947

原创 使用agno实现AI代理设计的五个层级,由易到难

本指南将代理设计分解为五个实际难度级别,每个级别均提供可运行的代码示例。无论开发者是初学者还是处理现实世界的复杂任务,本指南都能帮助避免常见陷阱,构建真正有效的代理。这些级别包括:•级别1:带工具和指令的代理•级别2:带知识和记忆的代理•级别3:带长期记忆和推理的代理•级别4:多代理团队•级别5:代理系统以下逐一介绍各级别。

2025-05-27 10:02:13 693

原创 终于弄懂了《Transformer入门到精通》高清pdf分享

《Transformer入门到精通》是一本权威指南,全面介绍60多种Transformer架构及其算法技术。书中包含丰富案例和可运行的Colab代码,涵盖语音识别、自然语言处理、计算机视觉等领域。全书7大章节系统讲解Transformer基础知识、BERT模型、多语言架构、改进变体及可解释性技术,并提供实用应用建议。原价45美元,现可通过扫描二维码免费获取电子版。配套的完整版大模型AI学习资料也已上传优快云平台供读者领取。

2025-05-27 09:58:59 382

原创 企业级RAG实施指南,企业知识库落地一定不要错过,长文建议收藏

检索增强生成(RAG)系统作为连接大语言模型与企业私有知识库的关键技术,正成为企业提升信息处理能力和业务创新的重要工具。本文深入探讨了企业级RAG系统的配置、框架选型及实施策略,并分析了常见误区与挑战。文章指出,优秀的RAG系统能够显著提升信息检索准确率、缩短检索时间,并提高员工生产力。然而,企业在自建RAG系统时,常面临专业知识壁垒、可扩展性不足、系统集成不畅以及数据隐私与安全等挑战。为此,文章提出了前瞻性规划、无缝融入业务流、数据安全为基石等核心行动建议,并详细介绍了Cherry Studio、Anyt

2025-05-23 12:42:05 838

原创 大模型 AI 时代背景下,中年程序员面对的挑战与机遇

在大模型 AI(如GPT、通用多模态模型)高速发展的当下,软件行业已然步入了新的技术拐点。中年程序员,这一曾经在上一波互联网浪潮、AI早期实现中立下汗马功劳的群体,正面临着前所未有的挑战——AI技术门槛的变化、就业结构的重塑以及技能更新的迫切需求。但与此同时,新的机遇也静悄悄降临:经验与行业洞察,将在大模型时代焕发出全新活力。本文将围绕大模型的核心特征、技术优势,以及它对传统编程技能的冲击和转化,深入探讨中年程序员如何自我定位与进阶。

2025-05-23 12:34:00 569

原创 从简单到复杂AI Agent的五个发展阶段

Agno 是一个轻量级、高性能的开源库,专为构建具备记忆、知识和推理能力的 AI 智能体而设计,已在 GitHub 上获得 26.8k star。其开发理念强调“由简入繁”,主张从基础功能逐步提升智能体的复杂度和能力。Agno 提出了智能体系统的五个发展阶段:Level 1 聚焦基础工具与指令;Level 2 引入知识库和存储机制;Level 3 具备记忆和推理能力;Level 4 强调多智能体协作;Level 5 迈向完整的 Agent 系统,支持异步任务处理和大规模应用。Agno 提供了丰富的文档和示例

2025-05-23 12:31:21 1031

原创 农业+AI~气候变化时间序列分析:利用深度学习赋能精准农业

精准农业通过优化农业管理,旨在节约资源、提升产量并减少环境影响。关键技术包括智能灌溉系统、精准播种系统和作物产量预测。露点温度是影响灌溉的关键指标,预测露点温度有助于水资源规划和病虫害防治。本文介绍了利用深度学习进行露点温度时空预测的方法,使用美国农业部的数据集,通过VAR方法和LSTM神经网络构建预测模型。模型可通过纳入更多解释变量或改变网络架构进行拓展,以提升预测性能。精准农业和露点温度预测在农业、水利和能源管理等领域具有重要意义。

2025-05-23 12:27:40 938

原创 Java开发选手暑期3月勇闯转大模型算法上岸

在回顾还是觉得很神奇,其实研一就很想做算法,自学了机器学习深度学习。后来觉得为了求稳,以及实验室同学全部都做后端,就又开始java开发并且去实习。 直到3月份,机缘巧合下一个师兄说,为什么不做大模型呢,风口在这里为什么不上呢?

2025-05-16 11:36:37 799

原创 Deepseek本地部署详细指南!从 Ollama 到个人知识库应用

Deepseek本地部署详细指南!从 Ollama 到个人知识库应用

2025-05-16 11:32:39 1122

原创 2025年,大模型LLM还有哪些可研究的方向?

近两年LLM在学术界与工业界的发展大家都有目共睹。到了今年,以预训练LLM为代表的大模型PK上半场已然结束,接下来就要进入下半场大模型2.0时代了。那么在这新赛道,关于大模型我们还有什么可做的创新?要知道,如今的大模型研究已经从单纯的"规模竞赛"转向"效能突破"与"应用重构",研究者们致力于构建可持续进化的智能生态系统。因此,多模态大模型、智能体agent等这类围绕大模型技术演进核心矛盾的方向尤其值得关注。

2025-05-14 19:53:39 556

原创 【面试必备】大模型经典面试题+详细答案:背八股文才是王道,不然你面试撑不过五分钟_大模型面试题

最近秋招正在如火如荼地进行中,看到很多人的简历上都包含大模型相关的工作,各家大厂和初创都很舍得给钱,动辄百万年包也变得不再稀奇。因此在大模型纵横的这个时代,不仅大模型技术越来越卷,就连大模型相关的岗位和面试也开始越来越卷了。

2025-05-14 19:50:52 623

原创 AI大模型与企业数字化转型:业务“数字化”是必要之路

有了大模型之后,是不是就不需要开展业务“数字化”,只需要把问题直接丢给AI去解决呢?基于数字看板、数字孪生的传统方法在应对实现了“业务活动步骤化”、“步骤环节要素化”、“要素数据规格化”的业务数据时,就像数码照片的清晰度一样,效果是可度量、可预测、可控制的。AI大模型可以有效应对自然语言描述、图片、视频等非结构化数据,但其基于概率统计和模式匹配的基本原理,决定了在基于非结构化数据开展智能生成和决策时,其效果难以度量和预测,无法避免“AI幻觉”这类错误。

2025-05-09 14:27:38 733

原创 国内首份《2025央国企AI+数智化转型研究报告》

今天分享一份由中国软件行业协会信息主管(CIO)分会、晋阳数字经济产业研究院、数字产业创新研究中心、锦囊专家联合发布的国内首份《2025央国企AI+数智化转型研究报告》。

2025-05-09 14:25:46 546

原创 AI不只大模型?AI Agent到底有多强?

今天来和大家聊一个当下科技领域特别火爆的概念——AI Agent!

2025-05-08 17:58:14 798

原创 干货 :2025大模型学习路线图 (附大模型学习资源分享)

零基础想要入门大模型,langchain、transformer、bert这些是要学的,但是你上来就从这里开始学习,那你就大错特错了!作为一名有一定编程经验的程序员,我们真的没必要一上来就把时间精力全部投入到复杂的理论、纠结选择什么编程语言和各种晦涩的数学公式上,这样不仅容易让你精神内耗,最终演变成入门到放弃。

2025-05-08 17:55:27 874

原创 DeepSeek-R1发布100天后:全面复盘推理大模型复现研究及未来!

推理语言模型:RLMs (OpenAI-o1/o3/o4、DeepSeek-R1以及QwQ系列)的最新发展标志着大型语言模型的一次重大演变。特别,的发布引发了广泛的社会影响,但其并实现细节未完全开源。MiroMind&复旦&新加坡国立大学等总结了近期的,主要关注这两个主要方向,介绍了当前复现研究在数据构建、方法设计和训练过程中的细节、。**一、**是通过高质量的数据集来提升推理语言模型()的关键方法之一。**二、**数据集主要涵盖数学和编程问题,并确保在训练过程中可以验证模型的输出。

2025-05-07 21:52:00 864

原创 2025年传统程序员如何转行到AI大模型? AI大模型学习路线路径,巨详细!!_程序员如何转人工智能

传统程序员转行到AI大模型领域是一个既充满挑战又蕴含机遇的过程。以下是一份详细的指南,旨在帮助程序员顺利过渡到这个新兴且快速发展的行业。

2025-05-07 21:49:23 545

原创 干货分享|检索增强生成技术RAG:向量化与大模型的结合

本文我们将来学习一个与现在 AGI 时代合作紧密的技术 RAG, 这是每个 AIGC 方向开发不得不掌握的能力。*为什么需要使用RAG*该模块将介绍 RAG 的应用场景,以及与模型微调方案的差异*模型Agent需要额外的信息穿透*使用模型Agent时,对于一些不在基座模型训练数据中的信息,模型无法做出精准回答,即使回答了,也是错误的答复。当模型 Agent 用于外部或者一些通用场景时,这个问题可能还可以被忽略。**但在内网场景,或者存在信息壁垒的场景使用时,这个问题会严重影响用户的体验,**比如下列的一些场

2025-05-06 17:27:11 995

原创 资料分享丨2025年全球AI编程(AI Coding)市场洞察研究报告(附34页文件下载)

《2025年全球AI编程市场洞察研究报告》由亿欧智库倾力打造,深度剖析AI编程领域发展现状与趋势。报告涵盖行业背景、工具分类、商业模式、市场趋势等多维度内容,评估主流工具表现,分析代表产品优势劣势,为从业者、企业及投资者提供全方位市场洞察,助力把握AI编程发展机遇。

2025-05-06 17:18:24 263

原创 RAG的12种调优策略_rag调优

随着越来越多的开发人员在创建RAG流程的原型方面积累经验,讨论如何使RAG流程达到投入生产所需的性能变得更为重要。本文主要阐述了以下调优点:

2025-04-23 22:40:53 1105

原创 2025大模型面试题快问快答!必考速记!背完通过率(95%)

大模型面试25年春招必问,背完通过率(95%)

2025-04-23 22:38:39 641

原创 2025年必须掌握的LLM训练三阶段

01近日,DeepSeek-R1 横空出世,全球AI股票应声暴跌。他们打造了一款强大的推理模型,并将其开源。这款模型之强大,足以媲美OpenAI的o1模型,而成本却仅为后者的一小部分。他们的秘诀在于其大语言模型(LLM)的训练方式。正因如此,今天我们将一步步解析这一训练过程,以期最终能够设计出激动人心的新方法,并像DeepSeek那样创造出更加强大的模型。闲话少说,我们来研究一下吧!02大语言模型训练的第一阶段称为。预训练是一种无监督学习方法,帮助大模型掌握语言规则并构建世界认知框架。

2025-04-16 22:51:55 869

原创 AI小白到高手:大型语言模型你必须知道的事!

论你是刚接触 AI 的新手,还是对 AI 已有一定了解的朋友,这篇文章都会为你提供清晰又深入的理解。理解大型语言模型(LLM)其实很简单—— 你只要想象它就是在玩“文字接龙”的游戏。

2025-04-16 22:46:16 858

原创 2025如何抓住AI未来!《多模态大模型:技术原理与实战》揭秘下一代AI核心技术,大模型入门必备!

本书详细介绍了大语言模型和多模态大模型的发展历史、技术原理和亮点、主要的开源框架、配套工具、部署细则和实战案例。为了让读者更好地进行大模型的应用实战,本书还详细介绍了使用大模型为商业赋能的3个应用案例。期望本书能够帮助读者打开通往大模型尤其是多模态大模型的学习、实战和商业成功之路。本书适用于从事人工智能工作的专业技术人员,比如算法工程师、研发工程师等,也适用于对多模态大模型感兴趣的各类从业者,比如产品经理、项目经理和各级管理人员等。

2025-04-11 22:27:40 380

原创 本地离线部署Ai大模型的三种方案,含安装教程!_离线大模型

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;定制和创建您自己的模型。第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

2025-04-11 22:11:28 788

原创 十天速成大模型—路径规划篇_路径规划 大模型

了解当前主流的大模型,包括 GPT 系列、BERT、DALL-E、CLIP 等。探讨这些模型的架构、应用场景、优缺点,并了解它们在各自领域的影响力和应用实例。

2025-04-07 23:45:03 851

原创 大模型入门超全指南来了!人大团队力作,内附一线开发经验

大语言模型》教材力求全面详实、层次清楚、循序渐进,从预训练到微调与对齐,从使用技术到评测应用,基本全覆盖大语言模型训练与使用的全流程。第一部分 背景与基础知识,介绍大语言模型的背景知识和重要概念,GPT系列模型的发展历程,以及大模型相关的资源信息。第二部分 预训练,介绍预训练数据的准备工作,大语言模型的架构,以及预训练过程涉及的相关技术。第三部分 微调与对齐,介绍指令微调和轻量化微调方法,以及以强化学习算法RLHF为代表的大模型人类对齐技术。第四部分 使用与评测。

2025-04-07 23:43:37 593

原创 2025最新大模型算法岗面试八股文【基础篇100题】,金九银十季,涨薪涨薪(精简、纯手打)_大模型算法发八股文

最近春招正在如火如荼地进行中,看到很多人的简历上都包含大模型相关的工作,各家大厂和初创都很舍得给钱,动辄百万年包也变得不再稀奇。因此在大模型纵横的这个时代,不仅大模型技术越来越卷,就连大模型相关的岗位和面试也开始越来越卷了。本文总结了100道大模型算法岗常见的面试题(含答案),篇幅限制,部分内容如下。一、基础篇1、目前主流的开源模型体系有哪些?Transformer体系:由Google提出的Transformer 模型及其变体,如BERT、GPT 等。PyTorch Lightning:一个基于PyTorc

2025-04-01 23:37:36 736

原创 2025最新AI大模型应用开发的核心技术学习线路看这里

现如今大模型岗位需求越来越大,但是相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元,AI工程师薪资平均值约37336元,大模型算法薪资平均值约39607元。很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,下面是我整理好的一套完整的学习路线,希望能够帮助到你们学习AI大模型。第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。大模型的开源意味着AI时代更需要的是基于大模型的新生产力工具,而非纯粹的算法研究。

2025-04-01 23:34:07 1159

原创 检索增强生成(RAG)深度解析

RAG通过检索与生成的协同,突破了传统生成模型的静态知识局限,成为解决时效性与专业性的有效方案。随着多模态检索(如图文结合)和自适应学习的发展,RAG或将成为下一代AI系统的核心架构之一。

2025-04-01 23:28:09 705

原创 2025年3月份我放弃了前端,转行了!!!猜我得到了什么?_前端转行不干互联网了

![为什么离开这个行业这个问题其实 我真的真的想了很多很多,我也分享给你们我的想法,希望可以帮助想继续深耕这个行业的继续深耕,犹豫想转行的帮助你们确定转行。综上考虑,我个人直接决定离开前端,因为这4个,都让我觉得在前端深耕会更好。但往往对于我最好的,却让我无法走出下一步,我挣扎,焦虑,走不出自己的舒适圈。害怕未知事物,这一切,都让我忘记了,我20年去上海找工作的日子,那时候蠢蠢的,呆呆的,啥也不会,靠着几个面试题,东奔西走,到处面试。失败远远大于成功,但我敢于去做。现在呢,面对前端行业,乃至于整体行业的经济

2025-03-27 23:03:57 379

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除