- 博客(464)
- 收藏
- 关注
原创 2025最新大模型算法岗面试八股文【基础篇100题】,金九银十季,涨薪涨薪(精简、纯手打)_大模型算法发八股文
最近春招正在如火如荼地进行中,看到很多人的简历上都包含大模型相关的工作,各家大厂和初创都很舍得给钱,动辄百万年包也变得不再稀奇。因此在大模型纵横的这个时代,不仅大模型技术越来越卷,就连大模型相关的岗位和面试也开始越来越卷了。本文总结了100道大模型算法岗常见的面试题(含答案),篇幅限制,部分内容如下。一、基础篇1、目前主流的开源模型体系有哪些?Transformer体系:由Google提出的Transformer 模型及其变体,如BERT、GPT 等。PyTorch Lightning:一个基于PyTorc
2025-04-01 23:37:36
479
原创 2025最新AI大模型应用开发的核心技术学习线路看这里
现如今大模型岗位需求越来越大,但是相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元,AI工程师薪资平均值约37336元,大模型算法薪资平均值约39607元。很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,下面是我整理好的一套完整的学习路线,希望能够帮助到你们学习AI大模型。第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。大模型的开源意味着AI时代更需要的是基于大模型的新生产力工具,而非纯粹的算法研究。
2025-04-01 23:34:07
512
原创 检索增强生成(RAG)深度解析
RAG通过检索与生成的协同,突破了传统生成模型的静态知识局限,成为解决时效性与专业性的有效方案。随着多模态检索(如图文结合)和自适应学习的发展,RAG或将成为下一代AI系统的核心架构之一。
2025-04-01 23:28:09
344
原创 2025年3月份我放弃了前端,转行了!!!猜我得到了什么?_前端转行不干互联网了
![为什么离开这个行业这个问题其实 我真的真的想了很多很多,我也分享给你们我的想法,希望可以帮助想继续深耕这个行业的继续深耕,犹豫想转行的帮助你们确定转行。综上考虑,我个人直接决定离开前端,因为这4个,都让我觉得在前端深耕会更好。但往往对于我最好的,却让我无法走出下一步,我挣扎,焦虑,走不出自己的舒适圈。害怕未知事物,这一切,都让我忘记了,我20年去上海找工作的日子,那时候蠢蠢的,呆呆的,啥也不会,靠着几个面试题,东奔西走,到处面试。失败远远大于成功,但我敢于去做。现在呢,面对前端行业,乃至于整体行业的经济
2025-03-27 23:03:57
344
原创 一文读懂「Lang Chain」_langchain
LangChain是一个强大的框架,旨在帮助开发人员使用语言模型构建端到端的应用程序。它提供了一套工具、组件和接口,可简化创建由大型语言模型 (LLM) 和聊天模型提供支持的应用程序的过程。LangChain 可以轻松管理与语言模型的交互,将多个组件链接在一起,并集成额外的资源,例如 API 和数据库。官方文档:https://python.langchain.com/en/latest/中文文档:https://www.langchain.com.cn/
2025-03-27 23:02:04
798
原创 2024大模型安全实践白皮书|附42页PDF文件下载
本报告在分析了大模型发展趋势挑战的基础上,提出了大模型安全实践总体框架,并从安全性、可靠性、可控性以及评测四个角度对大模型安全技术进行了深度剖析。最后,在大模型安全未来发展趋势基础上,提出了大模型安全“五维一体”治理框架,对于大模型安全生态形成、大模型可持续发展具有非常重要和积极的意义。
2025-03-25 22:20:34
296
原创 全景解读 LLM Posting-Train(后训练)技术
2023 年,当 ChatGPT 惊艳世界时,很多人第一次意识到:原来 AI 不仅能背课文,还能写代码、编故事、解数学题。(Pretraining)和预训练阶段通过海量文本数据(通常达到 TB 级别)的自我监督学习,使模型掌握基本的语言规律和世界知识。但仅有预训练的LLM,就好像刚学会六脉神剑的段誉,一身内功,但不会施展。这时,我们就需要通过「后训练」来给模型能力进行「塑型」—— 通过特定方法让模型在医疗诊断、法律咨询、编程开发等专业领域大显身手,同时学会遵守伦理规范、避免信口开河。
2025-03-23 00:00:10
993
原创 浙江大学强势出品!《大模型基础》教材已开源!附PDF文档_大模型基础pdf
这本浙大出品的大模型基础入门书籍:《大模型基础》你绝对不能错过!本书包含语言模型基础、大语言模型架构演化、Prompt工程、参数高效微调、模型编辑、检索增强生成等六部分内容。本书共9章,深入探讨了大模型的工作原理和使用方法-一提示工程,并研究了提示工程在电子商务、创意营销、内容创作、办公和编程等场景中的应用,以及如何赋能软件生态的发展等。本书旨在帮助读者了解提示工程的应用场景和实践案例,无论您是技术领域的专业人士,还是对新兴技术充满好奇心的读者,希望本书能激发您的思考,并为您展示一个崭新的创作世界。
2025-03-21 10:48:41
387
原创 手把手教你用Docker部署Dify平台,打造可视化LLM应用环境_dify docker部署
Dify是一款开源的大语言模型(LLM)应用开发平台。它融合了后端即服务(Backend as Service)和LLM Ops的理念,使开发者可以快速搭建生产级的生成式AI应用。即使你是非技术人员,也能参与到AI应用的定义和数据运营过程中。Dify内置了构建LLM应用所需的关键技术栈,包括对数百个模型的支持、直观的Prompt编排界面、高质量的RAG引擎、稳健的Agent框架、灵活的流程编排,并同时提供了一套易用的界面和API。这为开发者节省了许多重复造轮子的时间,使其可以专注在创新和业务需求上。”
2025-03-21 10:47:30
406
原创 2025大模型算法入行&转行?我建议你这样做!
当然有很多大佬他们全方位的强,比如我看到guidance、exllama这些一两个人开发的库,作者对数学原理的熟悉、以及极强的工程实现、性能优化能力让人叹为观止,让人心向往之,但是我又不是活不到明年了,也未必就不能至吧。剩下的人做的事情我觉得都不是那么有意义,不是说洗数据啥的不重要,重要,但对大多数人来说,对个人价值提升不大。其实除了上面说这些,还存在一些其他的方向,比如类似guidance这样在align模型之后的,和推理框架绑定比较强的组件,我觉得以后应该会融入到推理框架的范围内。
2025-03-17 23:47:54
1035
原创 大模型本地部署教程 | 搭建本地AI问答系统_embeddingstore
大家好,因为对AI大模型很感兴趣,相信很多兄弟们跟我一样,所以最近花时间了解了一些,有一些总结,分享给大家,希望对各位有所帮助。本文将讲解如何在本地搭建一个简易的AI问答系统,主要用java来实现,也有一些简单的python知识;网上很多例子都是以 ChatGPT来讲解的,但因为它对国内访问有限制,OpeAi连接太麻烦,又要虚拟账号注册账号啥的,第一步就劝退了,所以选择了 llama和qwen替代,但是原理都是一样的。
2025-03-17 23:44:19
828
原创 2025年2月份我放弃了前端,转行了!!!猜我得到了什么?
为什么离开这个行业这个问题其实 我真的真的想了很多很多,我也分享给你们我的想法,希望可以帮助想继续深耕这个行业的继续深耕,犹豫想转行的帮助你们确定转行。我能干什么? 这么一想,我觉得除了前端我好像什么都不会,吃不了苦,进不了厂,当不了服务员,送外卖又觉得这么年轻就要送外卖吗?干自媒体,可是觉得自己的生活好平淡。想来想去还是前端, 我已经快四年经验了,虽然只是专科,但还是优势哈。
2025-03-14 22:24:45
1035
原创 企业落地 AI 大模型,一个 DeepSeek 远远不够
本文整理自 InfoQ 策划的 DeepSeek 系列直播第九期节目。在直播中,极客邦科技创始人 &CEO 霍太稳对话神州数码集团首席 AI 专家谢国斌,深入探讨了 DeepSeek 爆火背后,AI 竞争格局将发生哪些变化,以及在新的格局下,AI 企业会面临哪些新的机会和挑战,企业又该如何抓住这些机遇。谢国斌表示,随着 AI 接入门槛和成本的降低,金融、医疗、教育和汽车等行业的应用可能会率先爆发。除此之外,制造业、办公行业等也有很大的发展空间。
2025-03-14 22:20:45
728
原创 缺人!高薪!今年春招最热职业AI大模型,大厂争夺AI大模型人才,年薪最高120万元
2025年以来,人工智能持续高热。随着2025年春招拉开帷幕,人工智能成为最热专业方向,供需缺口明显。各大用人单位“扩招”人工智能岗,应届毕业生的选择面变广。为了招揽优秀人才,用人单位提高薪酬待遇,甚至提前布局,为网罗2026届毕业生努力。
2025-03-11 20:59:30
1038
原创 AI医疗大模型:医疗行业的智能化解决方案
在科技飞速发展的今天,AI 医疗大模型正以前所未有的态势重塑医疗行业格局。这些智能模型宛如拥有超凡智慧的医疗助手,在疾病诊断、治疗方案制定、医学研究等诸多关键领域大显身手,为解决医疗难题、提升医疗效率与质量带来了全新的希望与路径。接下来,让我们一同深入探寻几款极具代表性的 AI 医疗大模型。华佗 GPT 作为港中大(深圳)在医疗健康领域推出的大模型,于 2023 年 2 月横空出世,成为国内首个类 ChatGPT 的医疗大模型。
2025-03-11 20:50:39
981
原创 [建议收藏]LLM-Universe —小白也能上手的AI大模型开发学习教程:帮你快速入门大模型
在人工智能(AI)大模型席卷全球的今天,如何快速入门大模型开发成了许多初学者和开发者的心头难题。今天给大家推荐一个专为小白设计的学习大模型开发的开源项目——LLM-Universe,它由Datawhale团队打造。这个项目以“动手学大模型应用开发”为口号,旨在帮助零基础的开发者通过实践掌握大模型开发技能。让我们一起来看看它的魅力吧!
2025-03-10 23:44:52
422
原创 一文讲明白初学者怎么入门大语言模型(LLM)?从基础到扩展,超级适合新手入门!
关于如何入门LLM,大多数回答都提到了调用API、训练微调和应用。但是大模型更新迭代太快,这个月发布的大模型打榜成功,仅仅过了一个月就被其他模型超越。训练微调也已经不是难事,有大量开源的微调框架(llamafactory、firefly等),你只要懂部署,配置几个参数就能启动训练。甚至现在有大量云上项目,你根本不需要部署,直接上传数据,就能启动。
2025-03-10 23:40:45
722
原创 2025年中国AI大模型架构深度解读:从理论到应用的全面探索_通义千问大模型架构
商汤领先发布“日日新 SenseNova”大模型体系,提供自然语言、内容生成、自动化数据标注、自定义模型训练等多种大模型以及能力,结合决策智能大模型,为 AGI 实现提供重要起点。除语言大模型“商 量 SenseChat”外,“如 影SenseAvatar”、“琼宇 SenseSpace”、“格物SenseThings”、“秒画 SenseMirage”一系列生成式 AI 模型,能够在文生图创作、2D/3D数字人生成、大场景/小物体生成实现应用。
2025-03-05 23:32:29
1235
原创 零基础入门AI大模型开发必读书籍(非常详细),2025AI大模型开发入门,收藏这一篇就够了!
本文即将推荐几本适合AI大模型开发的书籍,这些书籍涵盖了从基础理论到实际操作的各个方面。不论你是刚刚入门的初学者,还是希望深入了解并应用AI大模型的开发者,这些书籍都将为你提供宝贵的知识与实用的技巧,助你在这个快速发展的领域中取得突破。乘风破浪。1 《基于GPT-3,ChatGPT,GPT-4等Transformer架构的自然语言处理》主要内容了解用于解决复杂语言问题的新技术。将GPT-3与T5、GPT-2和基于BERT的Transformer的结果进行对比。
2025-03-05 23:28:27
832
原创 一文读懂AI Agents:让大模型拥有行动力(基础篇)
“从2024年底,各大头部LLM 公司开始逐步发布 AI Agent产品,最新的如 xAI发布的基于 Grok3 的 Deepsearch;OpenAI发布的DeepReseach;Perplexity的Deepsesearh。后面会深度解析以上各产品,在此之前,我们先再从基础理解下什么是 AI agent,基本概念,key components,基本的方法等 ”
2025-03-03 23:49:25
611
原创 大模型时代,程序员如何突出重围,避免被裁?
在科技飞速发展的当下,大模型技术的浪潮正以前所未有的态势席卷而来。DeepSeek等大模型的出现,让整个编程领域发生了翻天覆地的变化。这一变革在提升编程效率的同时,也让众多程序员陷入了被裁员的焦虑之中。初级程序员,尤其是从事重复性编码工作的人员,需求锐减,因为AI工具在代码生成、测试调试、代码优化等方面展现出强大的自动化能力,企业更倾向于用少量高级程序员配合AI完成项目。但危机之下亦有机遇,程序员只要积极求变,就
2025-03-03 23:43:49
1077
原创 大模型本地部署 | 详细教程,私有化部署体验 Dify!_dify 本地部署
Dify是一个开源的 LLM 应用开发平台。其直观的界面结合了 AI 工作流、RAG 管道、Agent、模型管理、可观测性功能等,让您可以快速从原型到生产。
2025-03-02 00:35:34
1364
原创 学大模型一定要知道的实战项目!!三天练完,没有大模型难的住你
练习项目不仅是对原理和概念的加深理解,更是对如何结合业务,业务逻辑的深度理解。而要做到这一点,你需要对所使用的大模型有足够的了解和项目实践经验。去年侧重大模型和GPT的原理,今年就侧重项目实战了。找到的这个合集不仅收集了大模型训练实战,还有微调实战,分布式训练,真的很全。这些项目不仅收集了大模型训练实战,还有微调,分布式等训练,从6B到65B,从全量微调到高效微调,再到RLHF,涵盖得非常全面了。下文内容涉及到:LLM项目+学习笔记+电子书籍+学习视频,都已经打包好了。🔨 服务器基础环境安装及常用工具。
2025-03-02 00:33:07
243
原创 关于基于大模型智能知识库落地的一些思考
基于大模型的应用往往需要用到GPU资源,仅推理对算力的资源要求较低,如果需要对基础大模型进行微调则对算力的要求会更高。从官网获取的信息来看,深蓝小鱼智答首席知识官融入了深蓝专利技术原子化知识搜索能力,将企业的知识库内容接入大模型,支持统一搜索、企业知识问答、阅读辅助等能力,支持私有化部署,能够充分保护企业数据安全。相信通过对上述问题的思考,能够帮助企业在决策“是否要上基于大模型的智能知识库项目”时,对前置条件和应用预期有比较基本的认识和理解,在此基础上能够与技术服务商一起更加顺利地实现应用的落地。
2025-03-02 00:29:33
733
原创 2025金三银四拿到大模型(LLM)offer,面试八股
从事大模型的朋友在金三银四拿到了一份不错的offer,面试十几家公司,通过了六家。好在分享了大佬总结的大模型方向面试的常见题目(含答案),短时间内过了一边,能针对的回答。有了面试框架更容易拿到offer,分享给大家,祝大家都能拿到自己心仪的offer。
2025-02-24 23:18:39
1014
原创 通俗易懂!智能体(Agent)、AIGC、AGI:大模型时代的“三剑客”
最近,AI领域火出了圈,各种专业词汇也频繁冒出来,比如AGI、AIGC和智能体(Agent)。这些词听起来高大上,但它们到底是什么意思呢?今天,咱们就来唠唠这几个概念,顺便举几个例子,让大家更好理解~智能体(Agent)就像是 AI 的“行动派代表”,它是一种能够自主感知环境、做出决策并采取行动的计算实体。简单来说,Agent就像是AI的“行动派”,它不仅能思考,还能通过工具和行动去完成复杂的任务。你可以把它想象成《钢铁侠》里的贾维斯,它不仅能听懂钢铁侠的指令,还能自己做出决策,去完成各种任务。
2025-02-20 11:42:41
784
原创 2025最新高薪岗位大爆料,大模型算法工程师!凭什么人均月薪50K
总而言之,作为一名大模型工程师,深入了解CPU和GPU的工作原理、优化技巧和性能特性,将让你在大型模型的训练和推理中更具竞争力,提高工作效率和性能。掌握CPU和GPU的知识,将使你能够设计和优化适用于特定硬件平台的算法和模型架构,实现更高效的计算和更快速的推理速度。作为大模型工程师,了解CPU和GPU的最新技术动态和趋势,能够让你及时应对新技术的挑战和机遇,保持在领域的前沿。懂得CPU和GPU的特性和优化方法,你能够全面考虑系统的整体性能,合理分配计算资源,优化算法和数据流程,提高模型训练和推理的效率。
2025-02-20 11:39:21
1499
原创 大模型本地部署 | 详细教程,私有化部署体验 Dify!_dify 本地部署
Dify是一个开源的 LLM 应用开发平台。其直观的界面结合了 AI 工作流、RAG 管道、Agent、模型管理、可观测性功能等,让您可以快速从原型到生产。
2025-02-19 23:20:52
2188
2
原创 大模型学习路线(2025最新)从零基础入门到精通,看完这一篇就够了
通过以上七个阶段的学习,您将能够建立起对大规模预训练模型的深刻理解,并掌握其在实际应用中的技巧。记得在学习过程中保持好奇心和探索精神,积极尝试新技术并参与社区讨论。希望这份学习路线图能帮助您成功踏上大规模模型的学习之旅!如果您对某个特定阶段或主题有更详细的问题,欢迎随时提问!
2025-02-19 23:13:21
826
原创 2025大模型入门必看:写给小白的大模型入门科普
大模型,英文名叫Large Model,大型模型。早期的时候,也叫Foundation Model,基础模型。大模型是一个简称。完整的叫法,应该是“人工智能预训练大模型”。预训练,是一项技术,我们后面再解释。我们现在口头上常说的大模型,实际上特指大模型的其中一类,也是用得最多的一类——语言大模型(Large Language Model,也叫大语言模型,简称LLM)。除了语言大模型之外,还有视觉大模型、多模态大模型等。现在,包括所有类别在内的大模型合集,被称为广义的大模型。
2025-02-18 13:56:07
409
原创 企业AI智能化不得不看的一本书—《AI赋能 企业智能化应用实践》,PDF免费分享!!!
随着科技的飞速发展,人工智能(AI)已经逐渐从理论走向了实践,成为推动社会进步的重要力量。在当前这个信息化、智能化的时代,企业作为经济发展的主体,其智能化应用实践显得尤为重要。《AI赋能:企业智能化应用实践》一书正是在这样的背景下应运而生。本书旨在通过深入剖析AI技术在企业的实际应用案例,帮助企业更好地理解和运用AI技术,从而提升企业的竞争力和创新能力。
2025-02-17 12:14:43
1061
原创 真的零基础5分钟快速部署AI大模型:一台电脑+Windows PowerShell命令轻松搞定!
无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。现如今大模型岗位需求越来越大,但是相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元,AI工程师薪资平均值约37336元,大模型算法薪资平均值约39607元。很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,下面是我整理好的一套完整的学习路线,希望能够帮助到你们学习AI大模型。第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。
2025-02-17 11:27:33
523
原创 厦大团队:大模型概念、技术与应用实践(140页PPT读懂大模型)
大模型通常指的是大规模的人工智能模型,是一种基于深度学习技术,具有海量参数、强大的学习能力和泛化能力,能够处理和生成多种类型数据的人工智能模型。
2025-02-15 13:42:31
888
原创 聊聊大模型微调训练全流程的思考
对于模型的微调,一开始我是想的太简单了,觉得只要按照基座官方模型文档调试即可;随着了解的深入与不断的学习,微调是个大工程而且对于领域模型来说,其训练流程:预训练 --> 监督微调 --> RHLF 中包含的事项与知识太多。读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用如果你是零基础小白,想快速入门大模型是可以考虑的。一方面是学习时间相对较短,学习内容更全面更集中。二方面是可以根据这些资料规划好学习计划和方向。
2025-02-15 13:36:34
622
原创 薪资达到50k的人工智能算法工程师有什么技能要求?
人工智能(AI)领域正在迅速发展,人工智能算法工程师作为这一领域的重要角色,承担着设计、开发和优化各种算法的职责。本文将深入探讨人工智能算法工程师的岗位职责、技能需求,以及如何在这一不断变化的环境中保持技术更新。
2025-02-13 13:39:12
1113
原创 Cherry Studio+DeepSeek R1 + 嵌入模型:企业与个人都能用的知识库(附详细教程)
Cherry Studio 是一款功能强大且灵活的桌面客户端工具,支持多模型服务,适用于 Windows、Mac 和 Linux 系统。它不仅集成了主流的 LLM 云服务和 AI Web 服务,还支持本地模型运行。它的核心亮点包括:完整的 Markdown 渲染文件上传与多模态对话智能体创建与管理友好的界面设计与灵活的主题选项更重要的是,Cherry Studio 能通过可视化界面和远程 API 接口调用各类模型,大幅降低对本地硬件的依赖,为个人和企业提供了一个高效的解决方案。👉[
2025-02-13 12:00:25
1833
原创 写给大模型新人的经验,刷到少走三年弯路!
这篇文章,我将结合自己在大模型领域的经验,给大家详细聊聊新人应该如何转行大模型赛道?比如大模型都有哪些方向?各方向的能力要求和岗位匹配?新手转行大模型常踩的坑和常见的误区?以及入行大模型最顺滑的路径?如果你是正打算入行大模型的校招/社招同学,请一定看完,可能会让你在入行大模型的路上,少走很多弯路。
2025-02-12 12:00:05
894
原创 不管你信不信,2025年是大学生就业历史上的分水岭!
未来,**人工智能、大数据和网络、网络空间安全等技能需求预计增长最快,**但分析思维、认知技能、韧性等依然是关键的核心技能。很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,下面是我整理好的一套完整的学习路线,希望能够帮助到你们学习AI大模型。这些大方向,你一定要知道!报告显示,到2030年,技术革新如人工智能、机器人技术的进步以及数字接入的增加,将强力驱动相应就业岗位的大幅增长,等新兴技术的崛起,不仅为互联网注入了新的活力,更推动了**产业数字化、网络化、智能化转型升级的纵深发展,**
2025-02-12 11:58:11
1375
原创 2025大模型入门好书推荐 - 《大规模语言模型:从理论到实践》附PDF
《大规模语言模型:从理论到实践》是一本由复旦大学计算机科学技术学院张奇教授领衔的团队编写的书籍,该书于2024年1月由电子工业出版社出版。这本书不仅基于作者团队在自然语言处理领域的深厚研究经验,还融合了分布式系统和并行计算的教学经验,旨在帮助读者深入理解大语言模型的原理,并提供实际操作的指导和案例。
2025-02-11 23:08:23
827
原创 LLM的现状&2025年的新兴趋势
2024年对人工智能而言是极为出色的一年。在文本生成和图像生成这两方面,我们目睹了模型能力全方位出现了类似阶跃函数般的巨大提升。这一年起始时OpenAI占据主导地位,而到了年末,Anthropic的Claude成了我常用的大型语言模型,并且还涌现出了若干实验室,它们都在试图开拓前沿领域,从xAI到诸如深度求索(DeepSeek)和通义千问(Qwen)之类的中国实验室皆是如此。过去两年对研究工作来说同样很棒。
2025-02-11 23:02:55
1097
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人