- 博客(499)
- 收藏
- 关注

原创 AI 正在颠覆编程,程序员的出路在哪里?
AI 的飞速发展,让程序员群体感受到了前所未有的压力。我们的工作,真的会被 AI 取代吗?未来的职业发展方向究竟在哪?今天,我们就来聊聊 AI 时代下,程序员的出路到底在哪里。AI 在编程领域的应用正在飞速普及。从 GitHub Copilot 可以自动生成代码,到 ChatGPT 几秒内解答编程问题,这些工具正在迅速改变开发者的工作方式。想象一下,过去需要花几个小时、几天写出来的代码,现在 AI 可以在几分钟内帮你搞定。是的,这个场景听起来像科幻小说,但它正在成为现实。答案是:不会。至少不会完全被取代。
2024-10-09 10:20:29
1875

原创 终于有人把多模态大模型讲这么详细了
多模态大型语言模型(Multimodal Large Language Models, MLLM)的出现是建立在大型语言模型(Large Language Models, LLM)和大型视觉模型(Large Vision Models, LVM)领域不断突破的基础上的。这里给大家总结了多模态大模型的结构,训练,评估方法以及幻觉问题的解决办法,通俗易懂!!
2024-10-06 11:03:36
1971

原创 最详细的AI产品经理学习路径|精确到天
⏩这里,我整理了一份详细的AI产品经理学习路径,大家只要按照思维导图,进行学习就可以了💎整个学习框架和体系是精心打磨的,无脑跟着学,转行AI产品经理就很简单了✊系统框架👇:1️⃣AI产品全局了解2️⃣Python编程3️⃣机器学习4️⃣深度学习5️⃣AI产品设计6️⃣AI产品项目管理7️⃣简历准备与面试。
2024-09-25 10:24:32
1377

原创 面试面经|大模型算法岗常见面试题100道
大模型LLM(Large Language Models) 通常采用基于Transformer的架构。Transformer模型由多个编码器或解码器层组成,每个层包含多头自注意力机制和前馈神经网络。这些层可以并行处理输入序列中的所有位置,捕获长距离依赖关系。大模型通常具有数十亿甚至数千亿个参数,可以处理大量的文本数据,并在各种NLP任务中表现出色。
2024-09-21 10:27:39
2418

原创 初学者如何快速入门大语言模型(LLM)?
在大模型时代,我们如何有效的去学习大模型?现如今大模型岗位需求越来越大,但是相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元,AI工程师薪资平均值约37336元,大模型算法薪资平均值约39607元。掌握大模型技术你还能拥有更多可能性• 成为一名全栈大模型工程师,包括Prompt,LangChain,LoRA等技术开发、运营、产品等方向全栈工程;• 能够拥有模型二次训练和微调能力,带领大家完成智能对话、文生图等热门应用;
2024-09-18 14:32:20
1656

原创 救命!真的不要盲目去自学AI大模型!!!
不要盲目去自学AI大模型!!!不要盲目去自学AI大模型!!!不要盲目去自学AI大模型!!!重要的事情说三遍,大模型内容特别多!东学一个西学一个,真的费时又费力!这里给大家分享大模型学习路线 ,让你不在盲目自学大模型适合零基础想系统学习大模型的你
2024-09-11 11:18:49
1340
原创 6000字!一文全览大模型微调方法
大模型微调,顾名思义,就是在已经训练好的大模型基础上,再进行一次“加工”。具体来说,就是利用特定领域的数据,对预训练模型进行进一步训练,让模型更好地适应特定的任务或领域。就好比一个通用的机器,经过微调后,能够精准地完成某个特定的工作任务。微调的重要性不言而喻。首先,它赋予了模型定制化的功能。不同的领域和任务对模型的要求各不相同,通过微调,可以使模型更好地满足这些特定需求。比如在医疗领域,微调后的模型能够更准确地识别医学影像中的病变特征;在金融领域,微调后的模型可以更精准地预测股票走势。
2025-04-07 23:35:35
849
原创 面了五六个大模型算法,这水平真没法给过…..
1.1介绍逻辑回归,逻辑回归是一个分类算法,那么它是在回归什么呢?分类时也是用的那个吗?4.1、输入一个数组,统计数组中有多少个数是7的倍数或者含有数字。5.6 gbdt和 bagging的区别,样本权重为什么会改变?2.1常见的损失函数,常见的激活函数,ELU 函数了解吗?1.2 编程题:颜色分类(leetcode 75)2.6 编程题:跳跃游戏(leetcode55)5.2 逻辑回归损失函数,并推导梯度下降公式,5.5 kmn的k设置的过大会有什么问题.3.9 判断链表是否有环、链表环的入口。
2025-04-07 23:34:30
750
原创 垂直领域大模型有哪些创业机会?
过去一年,以 ChatGPT 为代表的生成式 AI,在最具挑战性的自然语言处理领域取得了革命性的突破,在行业掀起了新的一轮发展热潮。当前,以大模型为代表的人工智能科技浪潮席卷而来,既是国家抢占全球产业链高点的关键,也是企业发展的重要驱动力。大模型具备了推演、举一反三的能力,在一定程度上,具备类似人类的脑神经,可以替代不少人类的工作。“过去最大的创业成本是人,而利用好大模型,重塑工作流,可以极大降低创业成本,这对创业公司来说是极大的利好。
2025-04-01 23:51:15
975
原创 推荐大模型书籍|《扩散模型从原理到实战》_扩散模型 从原理的到实战
本书既适合所有对扩散模型感兴趣的AI研究人员、相关科研人员以及在工作中有绘图需求的从业人员阅读,也可以作为计算机等相关专业学生的参考书。
2025-04-01 23:46:24
698
原创 一文彻底搞懂AI大模型:使用AI大模型的步骤和技巧详解_ai使用方法与操作流程
在数字化时代,AI大模型已成为推动科技进步的重要力量。它们不仅在规模上庞大无比,拥有数十亿甚至上万亿的参数,而且在处理复杂任务时展现出了惊人的能力。然而,要想充分发挥AI大模型的潜力,并不是一件简单的事情。下面,我将详细列出使用AI大模型的步骤和技巧,帮助大家更好地掌握它们的精髓。一、明确任务目标和需求在使用AI大模型之前,首先要明确你想要模型完成的任务是什么。任务目标的明确性将直接影响模型的设计、训练和评估。例如,如果你想进行自然语言处理任务,那么你可能需要选择一个适合处理文本数据的模型;
2025-04-01 23:41:44
771
原创 全新发布!大模型LLM学习路线图:全面掌握学习路径,非常详细收藏我这一篇就够了_大模型学习路径
ChatGPT的出现在全球掀起了AI大模型的浪潮,2023年可以被称为AI元年,AI大模型以一种野蛮的方式,闯入你我的生活之中。从问答对话到辅助编程,从图画解析到自主创作,AI所展现出来的能力,超出了多数人的预料,让不少人惊呼:“未来是属于AI的”。AI大模型——成为互联网从业者必备技能。
2025-03-28 23:48:12
936
原创 AI时代,如何做一个合格的产品经理?
最近,产品经理社群大家火热讨论着各类AI产品工具的使用体验:需要一下午产出的原型图,借助AI,1小时快速成型,但还是需要人手动调整需要3天完成的产品方案,借助AI,1小时就能生成初稿;埋头苦干一周的用户研究报告,借助AI,2小时就能得出1个基础结论…大家都感受到技术的变革,正在重塑产品经理的工作模式、角色定位、能力要求、思维方式。产品经理也再一次站在时代的路口,面对AI的重塑,有兴奋,也有迷茫&焦躁。主要体现在:➢ 传统产品经理 vs AI产品经理有哪些不同?
2025-03-28 23:27:20
736
原创 年薪50W,AI产品经理薪资真相!0经验、不懂技术可以转吗?
今年,无论是一些头部厂商,中小厂商,从海外到国内,大中小公司都在积极拥抱讨论AI和拥抱AI。AI 相关的人才缺口已达 500 万,其中AI产品经理需求旺盛,薪资中位数再创新高,36k/月。如果是在头部公司,加上年终奖、项目奖金和期权等,一年50W不是梦想!随着Ai在不同业务场景中价值体现,AI产品经理岗位要求也越发细分,B端方向成为主阵地。没有赶上移动互联网的红利,这波AI蓝海一定不能错过。不少人纷纷规划转岗AI产品经理。一番改简历、面试之后发现,根本拿不到offer。说白了是1很明确告诉你:能。
2025-03-28 23:25:08
678
原创 AI Agent企业应用场景全解:30个智能体落地案例剖析【万字长文,建议收藏】_ai agent实战宝典:30个企业应用案例
【深度研究】AI Agent赋能传统企业转型:30个智能体应用案例剖析【实战指南】AI Agent商业案例精选,助你技术选型和落地实施AI Agent商业应用指南:30个典型场景解读【案例精选】AI Agent改变企业效率的革命:30个应用项目复盘AI Agent重塑企业未来:30个创新应用与发展方向双12期间,电商领域没有激起太多波澜,人工智能界仍然声浪迭起。这一边,OpenAI开启12场直播的第五天,ChatGPT与Apple设备的集成升级没有引起热议,却被很多用户打上了“平平无奇”的标签。
2025-03-27 23:27:59
1082
原创 产品经理为什么要学习AI大模型?_为什么产品经理要学习ai大模型
在AI大模型时代,技术的迅猛进步正在重塑各行各业的面貌。作为产品经理,我们不仅要紧跟时代步伐,更要深入探索与运用这一前沿技术。学习大模型等AI技术,不仅是为了理解其背后的工作原理和应用潜力,更是为了将智能化、个性化的体验融入我们的产品中,为用户创造更大的价值。产品经理学习AI大模型到底有什么好处呢?AI大模型是当前科技发展的一个重要趋势,它们正在逐渐改变我们与技术的交互方式。产品经理需要紧跟技术发展的步伐,了解AI大模型的工作原理、应用场景和潜在影响。
2025-03-27 23:25:00
319
原创 DeepSeek R1之后的推理大模型后训练增强技术解析
本文给大家分享个人亲手复现R1-Zero的全过程,包括对关键源码的解读、训练过程和实验结果分析。TL;DR,整个项目只需要定制2处地方:另外在main_ppo.py训练入口中的注册该reward function即可。如果想定制训练自己的推理任务,只需要处理上述两处代码即可。又可以愉快地调包了 (:中途遇到问题:基于Qwen2.5-3B复现。下载作者上传的数据集Jiayi-Pan/Countdown-Tasks-3to4。数据集包括target和nums两列。此处要注意,veRL框架存在1处
2025-03-24 23:51:08
975
原创 导师说这个LLM知识库傻子都能看懂
无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。现如今大模型岗位需求越来越大,但是相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元,AI工程师薪资平均值约37336元,大模型算法薪资平均值约39607元。很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,下面是我整理好的一套完整的学习路线,希望能够帮助到你们学习AI大模型。第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。
2025-03-24 23:40:54
1038
原创 大模型发展史!从Transformer(2017)到DeepSeek-R1(2025)!
语言模型」是一种「人工智能系统」,旨在处理、理解和生成类似人类的语言。它们从大型数据集中学习模式和结构,使得能够产生连贯且上下文相关的文本,应用于翻译、摘要、聊天机器人和内容生成等领域。
2025-03-22 23:56:30
744
原创 2025大模型算法岗面试经典20 题(含答案)
大型语言模型(LLM)是一种通过大量文本材料训练的人工智能系统,能够像人类一样理解和生成语言。通过使用机器学习技术识别训练数据中的模式和关联,这些模型能够提供逻辑上和上下文上适当的语言输出。
2025-03-21 11:06:20
724
原创 DeepSeek扫盲1:不要混淆大模型与应用,谈一谈RAG应用框架
了解了RAG,我们就清楚了LLM应用的结果是否靠谱,不只取决于LLM本身,还跟RAG的向量数据库和检索有关,并且不同LLM对于提示词的处理也会有所区别。就拿DeepSeek来说,现在很多平台争相接入,但各平台的性能和产出质量有很大差别,就是因为硬件和RAG上的差别。读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用如果你是零基础小白,想快速入门大模型是可以考虑的。一方面是学习时间相对较短,学习内容更全面更集中。二方面是可以根据这些资料规划好学习计划和方向。
2025-03-21 10:57:09
841
原创 爆火的大模型入门书:《大模型应用开发极简入门:基于GPT-4和ChatGPT》,150 页就能让你上手大模型应用开发
书如其名,这是一本有关大模型应用开发的极简入门手册,为初学者提供了一份清晰、全面的“最小可用知识”,带领大家快速了解 GPT-4 和 ChatGPT 的工作原理及优势,并在此基础上使用流行的 Python 编程语言构建大模型应用。总结一下:短短 150 页的篇幅,讲解简单、通俗、透彻,带大家上手大模型应用开发。先让我们细细看看这本书有哪些特别之处(因为本书封面上是一种很特别的动物——刺蛇尾,本书别名「蛇尾书」)。
2025-03-17 23:41:33
667
原创 2025年,基于大模型的 Agent 如何在企业落地?
在展开之前,有必要澄清下当下大家经常听到的 AI 产品的概念,我对它的定义是基于生成式 AI 技术构建的软硬件产品,而生成式 AI 是人工智能的一个分支,其核心是能够生成随机内容的计算机模型,常见的生成式 AI 模型包括生成式对抗网络 (GAN),变分自动编码器 (VAE),大型语言模型 (LLM)等,基于生成式 AI 技术的应用示例有 ChatGPT、DALL-E、Google Bard、Midjourney、Adobe Firefly 和 Stable Diffusion 等。
2025-03-17 23:37:12
781
原创 人工智能成最热门赛道,大模型算法工程师年薪可达50万至200万
2月19日,整体人才解决方案服务商科锐国际发布《2025人才市场洞察及薪酬指南》报告,助力企业和人才洞察市场新变,把握趋势先机。作为连续13年发布的人才市场趋势权威风向标,报告基于内部专家顾问访谈、实际委托招聘岗位及人才库数据分析、大数据对比,深度揭示了在科技创新、产业升级和结构调整等多重因素共振下,企业增长模式变革、组织能力与个人能力升级面临新要求,而这些新要求正加速人才市场的结构性趋势变革。在全球革命的风口浪尖,中国聚焦AI大模型、算力基建和产业智能化,抢占数字经济制高点。
2025-03-14 21:53:06
1252
原创 行业落地分享:Dify在顺丰内部AI Agent落地
Dify 是一个开源的大语言模型(LLM)应用开发平台,融合了后端即服务(Backend as a Service, BaaS)和 LLMOps 的理念,旨在帮助开发者快速构建和部署生成式 AI 应用。
2025-03-14 21:48:39
1110
原创 2025大模型入门必看书籍 | 浙大最新发布《大模型基础》教程,开源分享!(附PDF)
由浙江大学DAILY实验室毛玉仁研究员、高云君教授领衔撰写的《大模型基础》教材第一版。这本教材为对大语言模型感兴趣的读者系统地讲解相关基础知识、介绍前沿技术。本书包括传统语言模型、大语言模型架构、提示工程、高效参数、模型编辑、搜索增强增加生成等六章内容。为便于阅读,每章分别以一种动物为内容为背景,对具体技术进行说明,故本册以六种动物作为封面。
2025-03-11 20:45:20
548
原创 彻底搞懂!Transformer整体架构 !!
今儿和大家聊一个非常重要的话题:Transformer整体架构,记得收藏!~Transformer编码器-解码器堆叠结构与信息流动路径,希望通过这部分内容,让大家理解Transformer的整体架构。
2025-03-11 20:41:41
580
原创 AI大模型学习路线,巨详细!,从零基础入门到精通,收藏我这一篇就够了!
想转型AI大模型应用工程师的码住了❗没规划的真先别动,这个AI大模型学习路线详细的介绍了每个阶段需要掌握的内容,自己也是跟着这个路径掌握的大模型技术。🎯想学AI大模型技术但还不知道学那些?没有完整大模型知识体系的,跟着这个路线走:📌第一阶段:先从AI大模型开发基础入手,讲解大模型的主要方法;📌第二阶段:在通过大模型提示词工程从Prompts角度入手会更好的掌握大模型的应用;📌第三阶段:学习大模型微调开发,以大健康、新零售、新媒体等领域构建适合当前领域的大模型;
2025-03-10 23:32:50
756
原创 搭建RAG系统,主流向量数据库如何选择?如Milvus、Qdrant、Weaviate、FAISS、RediSearch等
在搭建RAG系统时,选择合适的向量数据库是至关重要的。向量数据库能够 高效地 存储和检索大规模的 向量数据,为RAG系统提供快速、准确的检索支持。今天针对当下主流的 Milvus、Qdrant、Weaviate、FAISS、RediSearch 等主流向量数据库,他们也都是 开源 的向量数据库,给大家简单介绍下,供您参考。Milvus支持多种高效的索引结构,如IVF、HNSW等,能够在 毫秒级响应 时间内完成相似性搜索。它采用 分布式架构,可以轻松应对大规模数据集的需求,支持水平扩展。
2025-03-10 23:25:28
1102
原创 『喂饭级』大模型教程来了(从入门到实战),2025入局AI大模型必看!!
2025年初deepseek爆火,AI大模型,正在构建的颠覆力,为了更好的入局AI大模型,,包含🔻 压缩技术中,为什么量化要优于剪枝、蒸馏?🔻 如何搜索裁剪阈值用于裁剪outlier?🔻 包含有异常值outlier的特征如何量化?🔻 模型剪枝的技术背景🔻 模型剪枝具体方法🔻 模型剪枝前沿方法🔻 语言模型剪枝实例🔻 AI作画–以文生图🔻 扩散模型是什么🔻 扩散模型工作拓展🔻 扩散模型带来的机遇🔻 RLHF的优点和挑战🔻 RLHF如何改善大模型性能🔻 RLHF的实际应用案例。
2025-03-05 23:21:47
1177
原创 deepseek爆火后,盘点2025:AI大模型在医疗健康领域的应用
2025年,随着deepseek的爆火,AI大模型在医疗健康领域展现出强大的创新活力和商业潜力,各类应用场景不断深化,市场规模持续扩大。本文将从应用领域、市场发展及未来趋势等维度,全面回顾AI大模型在医疗健康领域的发展现状。1. 药物研发医药研发领域成为AI大模型最具突破性的应用场景之一。华为云"盘古大模型"和英矽智能"ChatPandaGPT"在肿瘤标志物挖掘和新药研发加速方面取得显著成果。
2025-03-05 23:14:46
1245
原创 【2025年超全汇总】大模型常见面试题及详细答案解析(非常详细)收藏这一篇就够了!
觉得大中厂面试太难的,完全是准备不够充分,没准备就去面试完全浪费时间,更是对自己的不负责!今天给大家分享一下我整理的大模型面试专题和答案,其中大部分都是面试常见高频面试题,可以参考下查漏补缺祝大家早日拿offer呀!
2025-03-03 18:20:31
1132
原创 LangChain+RAG+Agent本地部署DeepSeek-R1商用级知识库,完美实现低代码可视化流程编排
使用 LangChain 封装的模型实例通过 get_model_instance_by_model_user_id、embed_query、invoke 以及 stream 等方法,实现 LLM 整体调用,无缝对接大语言模型推理服务。构造上下文和消息列表利用 HumanMessage、SystemMessage 等消息类型将系统提示、历史对话、用户输入等进行整合,作为调用 LLM 的输入。调用向量库进行语义检索。
2025-03-03 18:15:02
1230
原创 2025程序员转行做大模型职业发展前景好吗?可以选择哪些岗位,如何选择?
2025年,随着DeepSeek的出现和大模型技术的发展,AI行业迎来了前所未有的热潮。对于许多程序员来说,这是一个不容错过的转行良机。
2025-03-02 00:27:14
832
原创 最新「大模型简史」整理!从Transformer(2017)到DeepSeek-R1(2025)
语言模型」是一种「人工智能系统」,旨在处理、理解和生成类似人类的语言。它们从大型数据集中学习模式和结构,使得能够产生连贯且上下文相关的文本,应用于翻译、摘要、聊天机器人和内容生成等领域。
2025-03-01 23:55:39
759
原创 谷歌发布40页AI Agent白皮书,简单易懂的智能体认知架构,附PDF
简单易懂,谷歌发布生成式AI智能体白皮书谷歌终于发布了官方AI Agent白皮书,快来一起研读谷歌发布的AI Agent白皮书,了解智能体一定不要错过谷歌官方出品的AI Agent白皮书,简单易懂的智能体认知架构2025智能体商用元年来袭,谷歌40页AI Agent白皮书深度认知行业全文约4500字,阅读时间8分钟文/王吉伟随着AI Agent市场的越发火爆,为了让用户全面了解AI Agent并积极参与生态构建,一些公司相继推出了官方智能体相关的解读及白皮书。
2025-02-25 14:53:54
964
原创 对话“AI教母“李飞飞:我们究竟需要什么样的AI Agent?如何正确把握这个风口(附视频)
2025年,随着Claude 、ChatGPT、Gemini Pro等大模型能力的跃升,AI Agent成为科技领域最炙手可热的话题。这些Agent不再只是被动回应,而是展现出惊人的主动性:它们能理解复杂指令、分解任务目标、持续追踪进度,甚至在完成任务时像人类助手一样主动提供建议。
2025-02-25 14:20:38
1141
原创 程序员不会使用大模型将来只能送外卖?“积极拥抱,没什么可焦虑”
在当今科技飞速发展的时代,人工智能(AI)特别是大型语言模型(LLMs),如GPT、BERT等,正在改变各行各业的工作方式。对于程序员来说,是否掌握这些技术不仅影响着他们的职业前景,还可能决定他们未来的职业路径。然而,许多程序员对学习和应用大模型感到困惑甚至焦虑。本文将详细探讨为什么程序员应该积极拥抱大模型,并提供一些实用的建议来帮助他们入门。
2025-02-24 18:22:24
601
原创 使用LLaMA-Factory快速训练自己的专用大模型
本文聊聊 LLama-Factory,它是一个开源框架,这里头可以找到一系列预制的组件和模板,让你不用从零开始,就能训练出自己的语言模型(微调)。不管是聊天机器人,还是文章生成器,甚至是问答系统,都能搞定。而且,LLama-Factory 还支持多种框架和数据集,这意味着你可以根据项目需求灵活选择,把精力集中在真正重要的事情上——创造价值。使用LLama-Factory,常见的就是训练LoRA模型,增强模型在某方面的生成能力。
2025-02-24 18:12:43
778
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人