- 博客(627)
- 收藏
- 关注
原创 零基础学AI大模型要多久?真的能学会吗?_训练一个ai模型要多久
随着人工智能技术的迅猛发展,AI大模型成为了当前最热门的技术领域之一。很多人对AI大模型既充满好奇又感到陌生,特别是对于那些完全没有编程基础的人来说,从零开始学习AI大模型似乎是一项艰巨的任务。但实际上,只要有足够的决心和正确的方法,任何人都有可能成为AI大模型领域的专家。本文将探讨从零基础学习AI大模型需要多长时间,以及如何确保你能够真正学会。
2025-03-28 23:01:13
955
原创 AI大模型实战系列:电动汽车充电行为大模型智能体框架解读_微调大语言预测电动汽车
随着电动车(EVs)变得更加流行,它们大规模融入电网带来了新的挑战和机遇。EV的充电行为对电网有着显著影响,因为它涉及大幅度的功率需求波动,影响电力系统的稳定性和经济效率[1]。
2025-03-28 22:59:36
813
原创 RAG+AI工作流+Agent:全面对比MaxKB、Dify、FastGPT、RagFlow、Anything-LLM_ragflow和dify的比较
开箱即用:支持直接上传文档、自动爬取在线文档,支持文本自动拆分、向量化、RAG(检索增强生成),智能问答交互体验好;无缝嵌入:支持零编码快速嵌入到第三方业务系统,让已有系统快速拥有智能问答能力,提高用户满意度;灵活编排:内置强大的工作流引擎,支持编排 AI 工作流程,满足复杂业务场景下的需求;模型中立。
2025-03-28 22:55:14
707
原创 2025火爆全网的LLM大模型教程:从零开始构建大语言模型,git突破18K标星
什么!一本书的Github仓库居然有18.5k的星标!(这含金量不必多说)对GPT大模型感兴趣的有福了!这本书的名字叫也就是虽然这是一本英文书、而且还没正式出版,但是他真的可以帮你使用python从零构建一个自己的大模型!为了加强读者的动手能力,这本书主要使用的是框架,而不是依靠各种库。通过这种方法,加上大量的图表和插图让大家可以彻底了解llm的工作原理。
2025-03-24 22:59:10
995
原创 【AI大模型】如何构建一个大模型?看完你就知道了!_ai大模型开发
这四个阶段都需要不同规模的数据集及不同类型的算法,会产出不同类型的模型,所需要的资源也有非常大的差别。图1 OpenAI 使用的大语言模型构建流程(Pretraining)阶段需要利用海量的训练数据(数据来自互联网网页、维基百科、书籍、GitHub、论文、问答网站等),构建包含数千亿甚至数万亿单词的具有多样性的内容。利用由数千块高性能 GPU 和高速网络组成的超级计算机,花费数十天完成深度神经网络参数训练,构建基础模型(Base Model)。
2025-03-24 22:51:21
774
原创 2025年最新AI大模型学习路线(非常详细)零基础入门到精通保姆级教程,收藏这一篇就够了!学完即就业!
大模型目前在人工智能领域可以说正处于一种“炙手可热”的状态,吸引了很多人的关注和兴趣,也有很多新人小白想要学习入门大模型,下面给大家分享一份2025最新版的大模型学习路线,帮助新人小白更系统、更快速的学习大模型!微信扫描下方二维码。
2025-03-23 12:57:06
882
原创 亲手复现DeepSeek-R1-Zero实验完整解读
本文给大家分享个人亲手复现R1-Zero的全过程,包括对关键源码的解读、训练过程和实验结果分析。TL;DR,整个项目只需要定制2处地方:另外在main_ppo.py训练入口中的注册该reward function即可。如果想定制训练自己的推理任务,只需要处理上述两处代码即可。又可以愉快地调包了 (:中途遇到问题:模型和数据基于Qwen2.5-3B复现。下载作者上传的数据集Jiayi-Pan/Countdown-Tasks-3to4。数据集包括target和nums两列。此处要注意,veRL框
2025-03-23 12:43:06
898
原创 给GitHub排名No.1的LLM课程看跪了...
现如今大模型岗位需求越来越大,但是相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元,AI工程师薪资平均值约37336元,大模型算法薪资平均值约39607元。很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,下面是我整理好的一套完整的学习路线,希望能够帮助到你们学习AI大模型。2、LLM科学家阶段:深入研究最新技术,学习LLM的训练和优化,涵盖预训练、微调、强化学习等全流程。第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。
2025-03-22 23:25:20
996
原创 手把手教你如何用扣子(COZE)打造一个企业级的知识库机器人_扣子(coze)
大模型是由海量数据训练而成的人工智能模型,具备强大的学习和推理能力,能够理解和生成自然语言。智能体则是基于对话的AI项目,它接收用户的输入,通过大模型自动调用插件或执行工作流完成指定任务。智能客服、虚拟助手、英语外教等,都是智能体的典型应用场景。扣子(COZE)是字节旗下的新一代AI应用开发平台。无论你是否有编程基础,都可以在扣子上快速搭建基于大模型的各类AI应用,并将这些应用发布到各个社交平台、通讯软件,甚至通过API或SDK集成到你的业务系统中。二、扣子能做什么?扣子提供了可视化设计与编排工具。
2025-03-21 15:05:00
972
原创 2025打算转行AI大模型算法工程师,前景怎么样?_ai算法工程师怎么样
从ChatGPT到新近的GPT-4,GPT模型的发展表明,AI正在向着“类⼈化”⽅向迅速发展。GPT-4具备深度阅读和识图能⼒,能够出⾊地通过专业考试并完成复杂指令,向⼈类引以为傲的“创造⼒”发起挑战。现有的就业结构即将发⽣重⼤变化,社会⽣产⼒的快速提升将催⽣新的⾏业和岗位机会。如何与⼈⼯智能协同⼯作,利⽤AI辅助办公已经成为各⾏从业者的必修课。脉脉创始⼈兼CEO林凡认为,从“⼈⼯智障”向“⼈⼯智能”的进化节点,**是⼤模型的出现**。
2025-03-21 15:03:45
1011
原创 打造个人AI大模型:本地电脑部署全攻略_本地部署ai大模型
现在的ai很多,让我看得有些眼花缭乱,随着ai的发展,现在已经有很多ai的大模型已经支持开源,所以现在支持部署一个大模型在自己电脑上,数据私人化。如果不知道自己是否需要或者是否合适配置可以跳到本文的结尾查看小编的使用感受
2025-03-17 23:02:48
915
原创 【2025超详细汇总】大模型面经指南(附答案)
LLM(Large Language Model,大型语言模型)是指基于大规模数据和参数量的语言模型。Transformer架构:大模型LLM常使用Transformer架构,它是一种基于自注意力机制的序列模型。Transformer架构由多个编码器层和解码器层组成,每个层都包含多头自注意力机制和前馈神经网络。这种架构可以捕捉长距离的依赖关系和语言结构,适用于处理大规模语言数据。自注意力机制(Self-Attention):自注意力机制是Transformer架构的核心组件之一。
2025-03-17 22:36:27
1037
原创 尝试基于0.5B小模型复现DeepSeek-R1的思维链
本文主要是以两个目的出发:• 第一个是简单地介绍下LLM训练的一个完整流程,侧重点在于帮助认识这个过程,而不是严谨地对每一个剖析细节,因此基本没有公式推导,但一些必要的符号是避免不了的;• 第二个是尝试使用小模型(0.5B)来复现DeepSeek-R1的思维链模式,仅仅是一个demo级别的实践。
2025-03-15 13:34:32
1075
原创 无敌!大模型入门学习看这四本书足够了
大模型时代:学习的迷思与破局当ChatGPT的惊鸿一瞥席卷全球,"大模型"不再是科技圈的专属名词,它开始渗透到日常生活的方方面面,引发了人们对未来学习的焦虑与憧憬。 市面上涌现出大量的学习资源,从入门书籍到专业课程,让人眼花缭乱。本文并非简单罗列学习资料,而是希望拨开迷雾,探讨大模型时代学习的本质,并为读者提供一条更具实践性的学习路径。
2025-03-15 13:30:28
1311
原创 从思考,到行动:由Manus爆火谈AI Agent
2025年3月,一款名为Manus的AI产品在社交媒体上引发热议。它的内测邀请码一码难求,甚至被炒至数万元,同时带动了150多只AI智能体概念股涨停。Manus的走红,不仅因为它在GAIA基准测试中超越了OpenAI的Operator模型,达到当前技术最佳水准(SOTA),更因为它代表了一种全新的AI形态——AI Agent(人工智能智能体)。与我们熟悉的ChatGPT等生成式AI不同,AI Agent实现了从“思考”到“行动”的跨越。
2025-03-14 17:08:35
920
原创 2025首发最全面的人工智能学习路线,适合新手和大学生
人工智能已经成为了现代技术的重要组成部分,所以开发人员学习人工智能是非常必要的。人工智能是未来的趋势:人工智能已经成为了未来技术的趋势,它将会在各个领域发挥重要作用,包括医疗、金融、交通、教育等等。人工智能可以提高开发效率:人工智能可以自动化一些重复性的工作,比如数据分析、图像识别等等,这样可以提高开发效率,减少开发时间和成本。人工智能可以提高产品质量:人工智能可以通过分析数据和模式来预测和避免错误,从而提高产品的质量和可靠性。
2025-03-14 16:59:16
980
原创 2025两会后,大模型浪潮下的机遇与方向
大模型时代的大幕已然拉开,2025 年两会全力推进大模型应用这一决策,为中国的科技发展与经济转型注入了强大动力,带来了无限机遇。它将推动各行业智能化升级,催生出更多创新的商业模式和应用场景,为企业创造广阔的发展空间,也为个人提供了实现自我价值的新舞台。然而,我们也必须正视大模型发展过程中面临的风险与挑战,数据隐私、安全、伦理等问题需要我们共同努力去解决。
2025-03-11 18:50:28
1033
原创 看完这本书瞬间对学Transformer的兴趣达到1000000000000%-《精通Transformer:从零开始构建最先进的NLP模型》(附PDF)
本书由Savas Yldmnm专业人士编写萨瓦斯 ·伊尔蒂利姆 (Savas Yldmnm) 毕业于伊斯坦布尔技术大学计算机工程系,拥有自然 语言处理 (Natural Language Processing,NLP)专业的博士学位。目前,他是土耳其伊斯坦布尔比尔基大学的副教授,也是加拿大瑞尔森大学的访问研究员。他是一位积极热情的讲师和研究员, 具有20多年教授机器学习、深度学习和自然语言处理等课程的丰富经验。他开发了大量的开源软件和资源,为土耳其自然语言理解社区做出了重大贡献。
2025-03-11 18:46:12
974
原创 万字长文经验分享,我做模型量化的那些年!
量化(Quantization)是一种通过线性映射和舍入操作将连续实数映射到一组离散值的方法,该组离散值由给定低精度位数所表示(例如8bit位数可表示256个离散值),如下图所示。通过低精度的数值计算,在成倍压缩内存占用的同时可以实现更快速的计算。Tensor 量化示意图。
2025-03-10 13:56:53
1046
原创 2025最新AI大模型学习路线:(非常详细)AI大模型入门,收藏这一篇就够了!_ai学习路线
AI大模型学习路线:(非常详细)AI大模型学习路线,收藏这一篇就够了!
2025-03-10 13:49:57
837
原创 本地部署与远程访问:使用Anything LLM、Ollama与DeepSeek R1打造智能知识库
本文主要介绍如何在Windows电脑上本地部署Ollama并接入DeepSeek R1大模型,然后使用强大的开源AI工具Anything LLM结合cpolar内网穿透工具轻松实现随时随地使用与上传内容来训练本地部署的大模型,无需公网IP,也不用准备云服务器那么麻烦!
2025-03-05 22:35:58
1224
原创 2025年 | 大模型算法工程师相关面试题汇总及答案解析
在准备大模型的面试时,我们需要对模型的基础理论、进阶应用、微调策略、以及特定技术如LangChain、参数高效微调(PEFT)等有深入的理解。这里给大家整理了一份详细的面试题,帮助大家提前进行面试复习,同时对自己的技术进行查漏补缺。
2025-03-05 22:22:20
1021
原创 2025防失业预警:不会用DeepSeek-RAG建知识库的人正在被淘汰
我开始意识到,知识库的构建正在成为未来竞争力的一部分。尤其是在AI幻觉频发的今天,单纯依赖模型生成的内容是有风险的,而通过精准的知识库来辅助AI工作,能够有效避免错误的发生。也正是因此,我决定写这篇文章,分享如何基于AnythingLLM构建DeepSeek-RAG本地知识库,并帮助传统企业从中受益。掌握这种技术,将不仅仅是提升工作效率,更是走在未来职场前沿的关键。
2025-03-03 11:55:23
784
原创 35岁程序员突围指南:转战AI大模型,年薪翻倍不是梦!
近年来,大龄程序员的职业困境愈发凸显。技术迭代加速、年轻竞争者涌入、企业降本增效等因素,让许多35岁以上的程序员面临裁员、降薪或职业天花板。例如,某大厂程序员被裁后只能降薪加入小公司,或被迫创业却因缺乏市场推广能力而陷入窘境。这些困境背后,既有行业对“高性价比”劳动力的偏好,也暴露出传统开发岗位可替代性增强的危机。
2025-03-03 11:45:55
1193
原创 构建企业专属大模型知识库,解决企业知识管理与应用难点
大部分企业的知识管理有三个不足:缺乏长期规划、缺乏组织机制和文化、缺乏智能化,大模型+知识库的体系建设,从知识管理的底层切入,帮助企业探索多场景的知识应用形态,提升企业知识应用价值。本文从[知识库](建设的挑战、AI+知识库建设框架与路径、4个不同场景的知识库落地案例,三个部分详细展开。企业目前在建设知识库过程中会遇到非常多困难,主要总结有以下三个部分。企业无论有无构建知识库,大都采取纸质化办公方式,很多的数字甚至还处于非电子化版本,企业需要去做更多的工作完成这个电子的转换。
2025-03-02 09:30:00
1697
原创 deepseek爆火后,30+程序员如何抓住AI风口,转行大模型!!!
别再犹豫转不转行,只看理论不行动了!作为一位30+北漂男程序员,2个月零基础转行大模型,成功拿下月薪2w+的offer!今天我来分享一下我的亲身经历, 希望能给还在迷茫中的你一些启发!
2025-03-01 13:41:09
1414
原创 AI大模型真正落地的四大应用场景,学会了可大大提高工作效率
随着AI技术的不断发展,AI的通用能力会越来越强,行业化的专有应用也会越来越多。在不久的将来,每个人都无法避免的遇到AI,每个人都不得不学习AI,不得不使用AI。读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用如果你是零基础小白,想快速入门大模型是可以考虑的。一方面是学习时间相对较短,学习内容更全面更集中。二方面是可以根据这些资料规划好学习计划和方向。包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。
2025-03-01 12:44:01
984
原创 太强了,又一本大模型神书问世! 还未出版已经40.2K标星-《从零构建大型语言模型》附免费PDF下载
《从零构建大模型》是一本超实战、超透彻的 LLM 入门书。作者手把手带你亲手**构建**、**训练**、**微调**一个属于自己的大模型。从数据准备到预训练,从指令微调到模型部署,每一步都讲得清清楚楚,还配有代码、示意图,手把手带你实现。
2025-02-27 15:28:11
1068
原创 2025大模型入门必看-LLM大语言模型导读,零基础入门到精通,看这篇就够了!赶紧收藏!
前言在规模扩展定律(Scaling Laws)被证明对语言模型有效之后,研究者构建出了许多大语言模型。尤其是 2022 年底面向普通消费者的 ChatGPT 模型的出现,正式标志着自然语言处理进入大语言模型时代。本章将简要梳理大语言模型的技术要点以及构建过程,并且列举了可用于预训练以及微调模型的常用数据集,介绍了目前开发大语言模型常用的代码库、预训练大语言模型的步骤以及涉及的关键技术,包括数据准备阶段、模型架构以及实际的预训练操作。全文大概28000字,涵盖了大语言模型使用过程中涉及到的RLHF、DPO、指
2025-02-27 14:33:01
942
原创 牛啊!本地化搭建DeepSeek+RAGFlow,构建个人知识库!【附带详细视频教程】
最近DeepSeek异常火爆,我也积极的体验,研究它的API和模型,确实很Nice,搞私活真的很香,搭建个人的知识库也很爽!今天继续给大家带来手把手的教学,本地化搭建DeepSeek+RAGFlow,构建个人知识库!掌握了本文的方法, 你也可以在骚气的搭建个人知识库,首先要说明下为啥要构建个人知识库呢?在线版DeepSeek需要将数据传输到云端服务器处理,存在日志留存的可能,用户需要信任服务商的隐私政策。对于涉及敏感数据的场景,如金融、医疗等行业,数据隐私和合规性要求极高,在线版可能无法满足这些需求。
2025-02-25 14:03:34
1200
原创 2025年大模型爆发,这5大行业即将崛起!抓住风口你就是下一个赢家!
2025年,全球大模型技术迎来爆发临界点,DeepSeek-V3等国产模型以1/30的成本实现GPT-4级性能,AI不再是科技巨头的专利,而是普通人逆袭的杠杆。现如今大模型岗位需求越来越大,但是相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元,AI工程师薪资平均值约37336元,大模型算法薪资平均值约39607元。很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,下面是我整理好的一套完整的学习路线,希望能够帮助到你们学习AI大模型。为了让大家少走弯路,少碰壁,
2025-02-25 13:58:12
654
原创 大模型减肥秘籍:蒸馏、RAG和微调,让AI更轻盈
下面我们将用通俗易懂的方式详细讲解模型蒸馏、RAG(检索增强生成)和微调这三个概念,并通过图表来辅助说明。它们都是优化大模型的常用方法,但目的和实现方式各有不同。我们会一步步拆解,让你彻底明白这些“黑科技”是怎么回事!
2025-02-24 18:02:38
1013
原创 已入职华为大模型算法岗,面试真的很水的…
觉得大中厂面试太难的,完全是准备不够充分,没准备就去面试完全浪费时间,更是对自己的不负责!今天给大家分享一下我整理的大模型面试专题和答案,其中大部分都是面试常见高频面试题,可以参考下查漏补缺祝大家早日拿offer呀!
2025-02-24 17:57:24
1002
原创 2025年AI大模型行业现状与发展趋势分析
2025年,AI大模型行业正经历着前所未有的变革与发展。从基础层的技术设施建设,到技术层的算法创新,再到模型层的多样化应用,整个产业链呈现出蓬勃发展的态势。1. 市场规模与增长2025年中国AI大模型市场规模预计将突破495亿元。这一数字不仅反映了AI大模型行业的快速增长,也预示着未来巨大的市场潜力。2. 技术层的发展技术层是AI大模型的核心驱动力,主要包括机器学习和计算机视觉等关键技术。机器学习开发平台市场规模稳步增长,2023年达35.1亿元,预计2025年将突破35.8亿元。
2025-02-21 15:14:17
1037
原创 DeepSeek爆火,2025年AI大模型专业型人才是未来就业的主旋律!
近期,深度求索公司发布的大语言模型DeepSeek-R1引发轰动,世界瞩目。DeepSeek-R1仅用OpenAI十分之一的成本,就达到顶尖大模型的性能,高性能低成本让企业接入AI成为必然趋势,同时到2030年AI人才缺口将有400万!这也意味着职场越来越卷,越来越多的人面临着被社会淘汰,普通程序员也将被AI替换,未来5年,市场需要的是能驾驭AI的那20%程序员,或是懂大模型应用开发技术、会落地的人才。等岗位都会成为市场抢手的香饽饽。2025年,无论是企业还是程序员,又或者是具体到个人,
2025-02-21 15:11:20
1005
1
原创 想学AI大模型应用技术的!懂方法很关键—零基础入门从屁都不懂到精通我是怎么做到的
我发现!这两年越来越多的职场人或者普通程序员,开始转型学AI大模型应用开发技术了,特别是在DeepSeek爆火🔥后!AI大模型应用领域就成了新兴行业,当下正处于行业的发展上升期📈。真心建议在职场上迷茫、看不到任何晋升空间的,冲一冲AI大模型应用开发!像有开发经验的真的轻松拿捏🤏!这不是说说而已,AI技术的发展从稚嫩走向成熟,对于企业用人的需求和技术要求也会越来越完善和规范化!🎯**懂方法很重要!**千万别盲目跟风,建议跟着专业的学,能少走弯路!
2025-02-20 10:45:22
983
原创 什么是AI大模型?(超详细)大模型从入门到精通,看这一篇就够了【附学习路线+全套学习籽料】
随着大模型的持续爆火,各行各业都在开发搭建属于自己企业的私有化大模型,那么势必会需要大量大模型人才,同时也会带来大批量的岗位?“雷军曾说过:站在风口,猪都能飞起来”可以说现在大模型就是当下风口,是一个可以改变自身的机会,就看我们能不能抓住了。
2025-02-20 10:32:47
580
原创 放心,你不会吃不透大模型(LLM)的……
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;同时也要跟已有的技能结合,辅助编程提效,或上手实操应用,增加自己的职场竞争力。
2025-02-19 21:52:36
1198
原创 DeepSeek R1幻觉下,GraphRAG 为什么能实现更好的决策?
Vectara HHEM人工智能幻觉测试结果DeepSeek-R1模型在众多方面表现亮眼,但随着应用越来越广泛,其幻觉副作用也日益被正视。根据Vectara HHEM人工智能幻觉测试的结果,DeepSeek-R1的幻觉率高达14.3%,远超其前代模型DeepSeek-V3(3.9%)。这一现象表明,尽管R1在推理能力上取得了显著提升,但同时也牺牲了一定的事实准确性。在实际应用中,幻觉问题可能导致模型生成不准确或误导性的内容,影响其可靠性和可信度。
2025-02-19 21:45:18
955
原创 2025大模型学习路线(超全面!超详细!)收藏这一篇就够了!
在使用诸如DeepSeek、ChatGPT、豆包、文心一言等大模型之余,你是否知道这些大模型背后的技术原理是什么?假如让你从头开始学习大模型,你知道应该遵循什么样的路线嘛?今天给大家介绍一下Ai大模型的学习路线,顺序千万不要搞反了!,大家可以按照这个路线进行学习。
2025-02-18 11:15:45
757
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人