- 博客(1193)
- 收藏
- 关注
原创 大模型训练基本流程详解
让pre-model自动化的生成模版,思路如下,fix主pre-train模型,让模型对有标注的任务做训练,模型学习后改的输入的句子embbeding,当然输入原句是不改的,只是让模型改非输入句子部分,最后就可以自动化的学习到最有prompt模版了。通常情况下,预训练模型的大小越大,它在各种任务上的表现也越好,但同时需要消耗更多的计算资源[1]。这张图表示的意思是,我还是我,但是我经过简单变化和学习后,我就可以成为多样不一样的我,但是pre-train模型是不动的,动的只是参入的参数,眼睛、一幅、装饰。
2025-04-02 15:51:01
669
原创 万字长文!小白也能懂的混合专家模型(MoE)深度解析
1.1 MoE模型定义混合专家模型(Mixture of Experts,MoE)是一种先进的神经网络架构,旨在通过整合多个模型或“专家”的预测来提升整体模型性能。MoE模型的核心思想是将输入数据分配给不同的专家子模型,然后将所有子模型的输出进行合并,以生成最终结果。这种分配可以根据输入数据的特征进行动态调整,确保每个专家处理其最擅长的数据类型或任务方面,从而实现更高效、准确的预测。专家(Experts):模型中的每个专家都是一个独立的神经网络,专门处理输入数据的特定子集或特定任务。
2025-04-02 15:49:52
773
原创 手把手教你搭建自己的AI智能体(史上最全教程)
智能体简介会在首页以及名片页展示,需要简洁明了的介绍智能体用途。用第三人称的角度去说明你的智能体可以解决哪个问题,比如,输入一个课程题目为你生成课程大纲、说出一个主题为你生成一段脚本等。
2025-04-02 15:48:53
967
原创 Cursor+deepseek,只需3步让国产黑马成就超高性价比编程工具
Deepseek V3是一个强大的专家混合 (MoE) 语言模型。他使用更短的训练时间,实现了与领先的闭源模型相当的性能。在代码、中文等方面和Claude 3.5 sonnet和GPT-4o等高级模型不相上下,还有些项目领先。API价格相对还是比较实惠的。
2025-04-02 15:47:33
633
原创 国内12家主流大模型,谁是地表最强?亲测后发现是它!
大模型GPT-3.5,2022年11月发布。可谓春风化雨,雨后春笋一般。到现在2024年,国产大模型工信部注册的,已有几百家。国产大模型崛起速度之快,令人惊叹。在如此之多的大模型里面,如何选择好用的,还真是个问题。结合GPT4o和Claude3.5,加上自身的一定使用,总结了如下12家国产大模型:下面表格,排名不分先后各自产品对应的logo如下:文字版介绍:1 百度:推出了“文心一言”大模型,具备强大的自然语言处理能力,广泛应用于搜索、对话等领域。
2025-04-02 15:46:13
846
原创 大模型从入门到精通:零基础详细教程,一篇就够了!非常详细收藏我这一篇就够了!
大模型,是指在人工智能领域,特别实在自然语言处理和机器学习中,拥有大量参数的深度学习模型。这些模型通过在大规模数据集上进行训练,能够学到丰富的数据表示和模式,从而在各种任务上表现出色,如文本生成,语言理解,图像识别等。大模型是具有大量参数和复杂结构的模型,这些模型通常具数十亿甚至数万亿个参数,能够处理大规模的数据和复杂的任务。通常使用深度学习技术,如深度神经网络,可以从数据中学习并提取特征来执行各种任务。
2025-04-01 14:23:52
613
原创 AI产品经理自学指南:大模型学习路径,一篇就够!收藏一下吧很难找全的
1️⃣【AI的产品形态到底是什么】?没有固定形态。实际上AI只是一种对传统产品或服务赋能的手段而已,将各种“中间件”(通常是一种训练好的模型,当输入一定数据后自动返回一定的输出值)、传感器等不同形式的软件、硬件融入传统产品或服务的使用或体验流程中。AI只是一种工具而已,产品的终极目标仍然不变为用户创造最大价值,提供最佳用户体验。2️⃣【AI产品的三要素】算法+计算能力 +数据3️⃣【AI产品经理核心能力】人工智能技术+行业认知+数据分析+产品设计+项目管理+商业认知。
2025-04-01 14:22:57
835
原创 【转行大模型 】大数据时代终结?AI崛起!我为何选择进军大模型领域
作为一名大数据开发工程师,我看到大模型技术正在重塑我们的行业。这次转型不仅是顺应技术潮流的选择,更是基于个人技能、市场需求和职业发展的综合考量。我相信,凭借我们在数据处理和分布式系统方面的专长,再辅以新的学习,我们完全有能力在大模型应用开发这个新领域大展身手。这次转型的思考是一个契机,后续还须更多步骤才能转型成功。我也会持续更新这一系列自己的心路历程,希望能为同样考虑转型的同行们提供一些参考和启发。让我们一起在这个AI驱动的新时代中,开创属于我们的新天地!
2025-04-01 14:00:49
854
原创 程序员如何转行大模型?五大热门岗位推荐,IT行业最后的风口就在大模型!错过就难有下次了!
模型研发工程师的核心任务是设计和开发新的深度学习模型架构。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。对于那些对模型架构有深入理解,喜欢创新和设计的程序员来说,模型研发工程师是一个理想的岗位。作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。
2025-04-01 13:59:01
652
原创 程序员转行做大模型,可以选择哪些岗位,如何选择?
模型研发工程师的核心任务是设计和开发新的深度学习模型架构。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。对于那些对模型架构有深入理解,喜欢创新和设计的程序员来说,模型研发工程师是一个理想的岗位。作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。
2025-04-01 13:58:16
1133
原创 30+程序员转行大模型,开启人生新篇章!
作为一位30+北漂男程序员,2个月零基础转行大模型,成功拿下我,开启了我的大学生活。因为听学长学姐说我们专业毕业了也是比较累的,但是我当时励志在北京创出一番事业来,所以我觉得其实都还好。后来我留在北京工作生活,,天天在高级写字楼工作,我想很多人都会很高兴在北京获得一份在高级写字楼里的工作,我也不例外,但是我到这里按年算起来,这十年来我从一个基层码农到现在的中层,月薪也涨到了2w+,一直以来我都是一个对生活没有什么特殊要求的人。
2025-04-01 13:55:40
757
原创 LLM框架对比选择:MaxKB、Dify、FastGPT、RagFlow【RAG+AI工作流+Agent]
1.MaxKBMaxKB = Max Knowledge Base,是一款基于 LLM 大语言模型的开源知识库问答系统,旨在成为企业的最强大脑。它能够帮助企业高效地管理知识,并提供智能问答功能。想象一下,你有一个虚拟助手,可以回答各种关于公司内部知识的问题,无论是政策、流程,还是技术文档,MaxKB 都能快速准确地给出答案:比如公司内网如何访问、如何提交视觉设计需求等等1.1 简介开箱即用:支持直接上传文档、自动爬取在线文档,支持文本自动拆分、向量化、RAG(检索增强生成),智能问答交互体验好;
2025-03-31 15:11:10
318
原创 初学者怎么入门大语言模型(LLM)?
大语言模型(LLM)是一门博大精深的学科,涉及到高等数学、python编程、PyTorch/Tensorflow/Onnx等深度学习框架……然而奇妙的是,越是看上去难得要死、一辈子都学不完的技术,入门起来却越是容易。正如阿瑟·克拉克的名言:足够先进的科技看上去与魔法无异。大语言模型先进得如同魔法,我们这些麻瓜也许一辈子都没法完全理解它。但乐观地看,既然大语言模型是魔法,那我们就把它当魔法用好了,用这个魔法发掘自己的天赋,兑现自己的价值。
2025-03-31 15:10:35
332
原创 【2025年最新版】写给小白的大模型入门科普
大模型,英文名叫Large Model,大型模型。早期的时候,也叫Foundation Model,基础模型。大模型是一个简称。完整的叫法,应该是“人工智能预训练大模型”。预训练,是一项技术,我们后面再解释。我们现在口头上常说的大模型,实际上特指大模型的其中一类,也是用得最多的一类——语言大模型(Large Language Model,也叫大语言模型,简称LLM)。除了语言大模型之外,还有视觉大模型、多模态大模型等。现在,包括所有类别在内的大模型合集,被称为广义的大模型。
2025-03-31 15:09:32
253
原创 大模型技术基础学习路线,想要学好大模型应该具备哪些能力?
随着大模型技术的发展,越来越多的人开始进入大模型领域,但大模型作为一门技术,因此它的本质上是一个工具,因此这也让学习大模型有了不同的学习方向。从工具的角度来看,学习一个工具主要有两个方向,一个是使用工具,一个是制造工具;而今天我们主要讲的是后者,也就是怎么制造一个大模型工具,它需要哪些技术基础。大模型基础技术路线下面主要从以下几个技术基础讲解一下大模型的学习路线:理论基础编程基础深度学习框架特定领域知识实践经验算法基础。
2025-03-31 15:08:56
292
原创 大模型时代,新手和程序员如何转型入局AI行业?
在当今大模型迅猛发展的环境下,人工智能的应用越来越广泛。然而,这些大模型的背后隐藏着更为深厚的基础技术——传统机器学习和神经网络。理解这些基础技术,不仅能够帮助我更好地使用大模型,还能为我提供创新和解决实际问题的能力。因此,在这个AI迅猛发展的时代,掌握传统机器学习和神经网络显得尤为重要。在近期的全国两会上,“人工智能”再次被提及,并成为国家战略的焦点。这一举措预示着在接下来的十年到十五年里,人工智能将获得巨大的发展红利。
2025-03-31 15:07:55
313
原创 如何微调(Fine-tuning)大语言模型?零基础入门到精通,看这篇就够了!赶紧收藏!
图片由DALL-E 生成阿里妹导读本文介绍了微调的基本概念,以及如何对语言模型进行微调。从 GPT3 到 ChatGPT、从GPT4 到 GitHub copilot的过程,微调在其中扮演了重要角色。什么是微调(fine-tuning)?微调能解决什么问题?什么是 LoRA?如何进行微调?本文将解答以上问题,并通过代码实例展示如何使用 LoRA 进行微调。
2025-03-29 14:07:47
950
原创 大模型技术基础学习路线,想要学好大模型应该具备哪些能力?
随着大模型技术的发展,越来越多的人开始进入大模型领域,但大模型作为一门技术,因此它的本质上是一个工具,因此这也让学习大模型有了不同的学习方向。从工具的角度来看,学习一个工具主要有两个方向,一个是使用工具,一个是制造工具;而今天我们主要讲的是后者,也就是怎么制造一个大模型工具,它需要哪些技术基础。大模型基础技术路线下面主要从以下几个技术基础讲解一下大模型的学习路线:理论基础编程基础深度学习框架特定领域知识实践经验算法基础。
2025-03-29 14:07:10
1084
原创 2025版最新大模型入门课程,带你从零基础入门大模型(非常详细)收藏这一篇就够了!
2022年末,ChatGPT一经推出即火爆全球,作为一款自然语言处理(Natural Language Processing,NLP)大模型,ChatGPT在意图理解和内容生成上,表现出了令人惊叹的性能。2023年初,ChatGPT的升级版GPT-4引入了对图片、语音的支持等多模态能力,多项考试分数已经超越了大部分人类。2024年初,OpenAI发布文生视频大模型Sora,在全球视频大模型领域取得里程碑式进展。
2025-03-29 14:06:32
848
原创 DeepSeek 部署指南 (使用 vLLM 本地部署)
vLLM (https://github.com/vllm-project/vllm) 是一个快速且易于使用的库,用于进行大型语言模型的推理和部署。
2025-03-29 14:05:50
1043
原创 一文全面说透,2025版最新AI大模型!零基础入门到精通,收藏这一篇就够了
近年来,随着深度学习技术的飞速发展,AI大模型作为人工智能领域的重要研究对象,正逐步成为学术界和产业界广泛关注的热点议题。AI大模型,作为一类具备庞大参数规模与卓越学习能力的神经网络模型,如BERT、GPT等,已在自然语言处理、计算机视觉等多个领域展现出卓越成效,极大地推动了相关领域的技术进步。**AI大模型的价值不仅体现于其庞大的参数规模与强大的学习能力,更在于其对于解决现实世界复杂问题的巨大潜力。
2025-03-29 14:05:17
496
原创 一文讲解GraphRAG与传统RAG的7大区别及融合方案,你会怎么选择?
其借助社区检测算法来识别知识图谱中的多个社区,并利用LLM对这些社区进行总结与摘要。因此,当回答类似这样的问题:“最近几年高端智能手机的整体发展趋势是怎样的?Microsoft GraphRAG会通过Map-Reduce算法首先从多个不同的关联社区(比如不同年份社区)来搜集到“高端智能手机”的信息(Map),最后汇总生成全局性答案(Reduce)。
2025-03-27 11:32:22
381
原创 教你在本地部署AI大模型,效果很赞!
随着人工智能的发展,AI与我们的工作与生活变得越来越紧密。AI大模型主要分为开源和不开源两类。现如今开源模型变得越来越好,甚至超过了很多不开源的大模型。前不久谷歌发布了gemma2模型的2B版本(20亿参数),让我们能够在性能十分有限的电脑上也能流畅运行本地大模型。在我的小破笔记本上都可以流畅出色运行,而且效果很赞!
2025-03-27 11:31:26
415
原创 一文彻底搞懂大模型 - Dify(Agent + RAG)
该平台结合了后端即服务(Backend as Service, BaaS)和LLMOps的理念,为开发者提供了。
2025-03-27 11:30:29
745
原创 30+程序员转行大模型,开启人生新篇章!
作为一位30+北漂男程序员,2个月零基础转行大模型,成功拿下我,开启了我的大学生活。因为听学长学姐说我们专业毕业了也是比较累的,但是我当时励志在北京创出一番事业来,所以我觉得其实都还好。后来我留在北京工作生活,,天天在高级写字楼工作,我想很多人都会很高兴在北京获得一份在高级写字楼里的工作,我也不例外,但是我到这里按年算起来,这十年来我从一个基层码农到现在的中层,月薪也涨到了2w+,一直以来我都是一个对生活没有什么特殊要求的人。
2025-03-27 11:29:48
675
原创 2025年转行指南:教你转行AI产品经理,非常详细收藏我这一篇就够了!
这两年AI突然“火起来” 了 ,算是出现了一个“大转折”。因为就在这2年里,全球所有“大厂”几乎同一时间挤破头在跟进AI技术,从ChatGPT发布,到谷歌、Facebook、亚马逊等都紧跟其后,再到国内百度、腾讯、阿里、字节等也随之在冲在后面。对市场趋势敏感的产品经理们,想必也感受到了这个变化。也许你们也曾经想过要不要转行AI产品经理或者入行AI领域?那AI相关的行业究竟值不值得做?如果想转行AI产品经理,现在是不是好时机?要是决定转行,得做好什么准备?什么才叫真正的入局?
2025-03-27 11:26:33
915
原创 月薪3W的AI产品经理学习路线,非常详细收藏我这一篇就够了!
要成为一名月薪三万的AI产品经理,需要构建一套全面的学习路线,这不仅涵盖技术知识,还包括产品管理、市场分析、商业策略和软技能。以下是简化版的学习路线,旨在帮助有志于成为高薪AI产品经理的人士。
2025-03-27 11:24:36
260
原创 大模型有几种类型(非常详细),零基础入门到精通,看这一篇就够了
我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。大模型的应用范围不断扩展,涵盖了自然语言处理、计算机视觉、语音识别、推荐系统等多个领域,并逐渐向更具体的垂直领域渗透,如医疗、金融、物流等。包括云计算、DSA架构芯片、多模态融合、迁移学习和预训练模型、自监督学习和无监督学习、模型压缩和优化、模型可解释性和可信度等。百度文心大模型主打搜索模型,继承了百度在搜索领域的核心技术,提供了高效、准确的搜索服务。
2025-03-26 13:59:06
546
原创 大模型时代,新手和程序员如何转型入局AI行业?
在当今大模型迅猛发展的环境下,人工智能的应用越来越广泛。然而,这些大模型的背后隐藏着更为深厚的基础技术——传统机器学习和神经网络。理解这些基础技术,不仅能够帮助我更好地使用大模型,还能为我提供创新和解决实际问题的能力。因此,在这个AI迅猛发展的时代,掌握传统机器学习和神经网络显得尤为重要。在近期的全国两会上,“人工智能”再次被提及,并成为国家战略的焦点。这一举措预示着在接下来的十年到十五年里,人工智能将获得巨大的发展红利。
2025-03-26 13:58:02
1040
原创 什么是大模型?大模型从入门到精通(超详细)看这一篇就够了!!!
大模型(Large Models),通常指的是拥有大量参数的深度学习模型。这些模型由于其规模庞大,能够捕捉到数据中的复杂模式,因此在自然语言处理(NLP)、计算机视觉(CV)等领域有着广泛的应用。例如,GPT-3 和 BERT 就是自然语言处理领域中著名的大型预训练模型。强大的表达能力:大量的参数使得模型可以更好地拟合复杂的数据分布。预训练+微调机制:通过在大规模数据上进行预训练,然后针对特定任务进行微调,大模型可以有效地利用迁移学习的力量。计算资源的进步。
2025-03-26 13:56:53
671
原创 2025大模型学习路线:最新最全【大模型学习路线规划】零基础入门到精通,看这篇就够了!!
通过以上七个阶段的学习,您将能够建立起对大规模预训练模型的深刻理解,并掌握其在实际应用中的技巧。记得在学习过程中保持好奇心和探索精神,积极尝试新技术并参与社区讨论。希望这份学习路线图能帮助您成功踏上大规模模型的学习之旅!
2025-03-26 13:55:42
872
原创 初识大模型(非常详细)零基础入门到精通_大模型入门
大模型的定义大模型是指具有数千万甚至数亿参数的深度学习模型。近年来,随着计算机技术和大数据的快速发展,深度学习在各个领域取得了显著的成果,如自然语言处理,图片生成,工业数字化等。为了提高模型的性能,研究者们不断尝试增加模型的参数数量,从而诞生了大模型这一概念。本文讨论的大模型将以平时指向比较多的大语言模型为例来进行相关介绍。大模型的基本原理与特点大模型的原理是基于深度学习,它利用大量的数据和计算资源来训练具有大量参数的神经网络模型。通过不断地调整模型参数,使得模型能够在各种任务中取得最佳表现。
2025-03-25 12:00:37
763
原创 AGI大模型学习路线,从零基础到就业,神仙级教程你学会了吗?
这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。如果要深入学习,建议再按以下步骤,从更基础的GPT和BERT学起,因为底层是相通的,而且实际落地到一个系统中,应该也是大模型结合小模型(大模型在做判别性的任务上,比BERT优势不是特别大)作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。,先快速上手体验prompt工程,然后再学习其架构,跑微调脚本。
2025-03-25 11:59:15
287
原创 学习AGI大模型到底有多重要?
随着科技的飞速发展,我们正处在一个智能化的时代。2024年,AGI(人工通用智能)大模型即将成为改变我们生活的重要力量。它不仅将引领科技产业的变革,还将为我们的日常生活带来巨大的影响。AGI大模型的重要性不仅体现在其技术本身,更体现在其对我们生活的深远影响。它将改变我们的工作方式,提升我们的生活质量,推动社会的发展。因此,学习AGI大模型,了解其背后的原理和应用,对于我们来说至关重要。在2024年,AGI大模型将成为科技发展的关键力量。它将引领我们进入一个全新的智能时代,为我们带来前所未有的便利和机遇。
2025-03-25 11:58:32
540
原创 国内AI大模型前十排行榜,最后一个你可能没听过
根据2024年的最新数据和搜索结果,国内AI大模型的前十排行榜:最近爆火,一度成为对标甚至超越ChatGPT的存在。:在SuperCLUE基准测试中得分最高,超过众多国内外闭源模型,引领全球的开源生态。:凭借其强大的技术能力和行业应用得到广泛认可。:专注于自然语言理解与生成,适用于文本创作、智能问答等场景。:支持对话、写作、编程等功能,还能提供语音交互方式。:在客观评测中以75.96分排名第二,得分最高的国产大模型。:在数据和算法方面有一定优势,其模型能够较好地处理各种复杂的语言任务。
2025-03-24 14:20:32
488
原创 人工智能智能体(AI Agent)发展趋势2024年总结与2025年展望
人工智能(AI)的快速发展引发了各行业的变革性转变。在 AI 的众多进步中,智能体作为创新的基石脱颖而出,重塑了行业格局,提升了用户体验,并将自动化推向了新的高度。这些自主运行的虚拟机已经在客户服务、医疗保健、金融甚至娱乐等领域占据了一席之地。那么,人工智能智能体的未来会是怎样的呢?在本文中,我们将探讨 2025 年及未来几年人工智能智能体的趋势和预测。人工智能智能体是旨在执行任务、做出决策并与人类或其他系统进行交互的自主系统。它们形式多样,从虚拟助手到协调物流或金融运营的高级多智能体系统不一而足。
2025-03-24 14:19:34
940
原创 【建议收藏】大模型使用宝典(附场景案例)
DeepSeeK汇聚了众多卓越模型,诸如R1、V1、V2 Coder、V3等。在本文中,我们将聚焦于指令模型与推理模型的区别,并提供实用的提示词框架及其使用技巧。最后,通过除老生常谈的文本生成、总结等场景外的典型场景示例,例如物理与数学题目、编程能力展示、简历制作和模拟面试等方面,深入阐释其应用。经过测试,大模型目前已展现出极高的逻辑推理能力和生成质量。强烈推荐使用DeepSeek R1进行个人模拟面试,其覆盖的面试范围和层次在常规企业面试中难以遇到,具体示例可在本文末尾的场景示例中找到。
2025-03-24 14:18:35
1040
原创 deepseek满血版本地最强部署教程!从此告别系统繁忙!
哈喽,大家好,要说当今社会什么东西最火那绝对是AI,在AI界最火的当属deepseek,然而所谓树大招风,由于它太优秀导致被各种攻击,所以就会导致使用是经常系统繁忙,实在影响使用心情,今天就教大家怎么在自己电脑本地部署DeepSeek R1 来解决这个问题。
2025-03-24 14:17:48
696
原创 DeepSeek 部署指南 (使用 vLLM 本地部署)
vLLM (https://github.com/vllm-project/vllm) 是一个快速且易于使用的库,用于进行大型语言模型的推理和部署。
2025-03-24 14:17:02
1124
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人