- 博客(606)
- 收藏
- 关注
原创 AI大模型应用落地的痛点与策略分析_大模型智能体行业应用痛点
AI大模型目前正在成为企业转型升级的关键,同时,政策牵引、技术突破和转型需求等因素也驱动B端企业逐步推进了对于AI大模型的深度应用。AIGC时代的第一波浪潮是大模型的预训练和训练集群规模的不断扩大,紧随其后,第二波浪潮接踵而至,当前和未来将更加聚焦AI大模型的应用落地。算力、网络等基础设施构筑起高效的计算和存储能力,并基于自然语言处理、算法与模型优化等底层技术保障大模型稳定运行,在此基础上,通用大模型能力逐步完善,并基于专业领域数据涌现出垂直行业和细分场景大模型。
2025-03-28 23:44:03
726
原创 斯坦福李飞飞最新巨著《AI agent综述》_李飞飞 ai agent 综述
AGENT AI: SURVEYING THE HORIZONS OF MULTIMODAL INTERACTION》这份综述深入探讨了多模态人机交互(Human-Computer Interaction, HCI)的当前发展状态和未来的研究方向。多模态HCI旨在通过语音、图像、文本、眼动和触觉等多种信息模式来实现人与计算机之间的信息交换,这种交互方式在生理心理评估、办公教育、军事仿真和医疗康复等领域具有广泛的应用前景。
2025-03-28 23:43:01
413
原创 干货:中科院出品 DeepSeek-V3/R1 满血版 671B 全参数微调指南发布:本地化部署和微调的权威参考来了!
在大模型应用快速发展的背景下,如何高效地进行本地化部署,让企业和研究机构能够在自有算力环境中稳定运行和微调大模型,成为当前的技术挑战。DeepSeek-V3/R1 671B 满血版 的全参数微调方案,正是针对这一痛点,由中国科学院自动化研究所与中科闻歌联合推出的一份 完整的开源指南(DeepSeek-671B-SFT-Guide),为有本地化部署需求的团队提供了从训练到推理的全流程方案,并总结了关键的优化策略和实践经验。
2025-03-24 23:31:24
479
原创 万字长文!从AI Agent到Agent工作流,一文详细了解代理工作流(Agentic Workflows)
AI Agent、Agentic AI、Agent架构和Agent工作流等概念如今备受关注,但它们究竟是什么?它们能做什么?新技术常常伴随着混乱的术语和炒作。本文将深入解析代理型AI的关键概念——代理工作流(Agentic Workflows)。
2025-03-24 23:22:44
874
原创 2025最新最全【大模型学习路线规划】零基础入门到精通!
通过以上阶段的学习和实践,你将能够逐步掌握大模型的核心技术和应用技能,实现从零基础到精通的转变。现如今大模型岗位需求越来越大,但是相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元,AI工程师薪资平均值约37336元,大模型算法薪资平均值约39607元。很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,下面是我整理好的一套完整的学习路线,希望能够帮助到你们学习AI大模型。第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。
2025-03-22 23:52:02
920
原创 大语言模型技术点总结_qwen llama
本文将开源文本大模型中的LLaMA系列和Qwen系列的各个版本技术点对比总结成表格形式,方便查看和阅览,然后基于一些共性的技术点进行详细介绍。
2025-03-21 11:30:14
294
原创 开发RAG应用,你必须知道的7个Embedding模型
在自然语言处理(NLP)领域,Embedding模型是将文本数据转化为数值向量的核心技术,从而让计算机能够便捷地衡量文本间的语义关联,这种表示法已成为多种基础NLP任务的核心,如文本相似度判定、语义搜索、信息检索、文本重新排序、聚类以及作为下游任务的特征输入。
2025-03-17 23:31:59
530
原创 2025年AI行业6大高薪职位揭秘:薪资曝光!_ai研究科学家年薪
如果你正在考虑转行,并希望赚更多的钱,AI领域的职业可能是一个不错的选择。深入了解这些角色,找出你需要的技能,然后开始重新学习或提升自己。AI浪潮才刚刚开始,还有很多时间让你踏入这个领域,开始规划你的未来,成为一个高收入者。为什么不去看看有什么可能性呢?
2025-03-17 23:27:37
761
原创 从零开始打造自己的Manus:学学如何使用 LangChain 快速构建 AI Agent
最近,随着 Manus 的强势出圈,「智能体(Agent)」这一概念一下子占据了人们的视野,成为AI领域最新的流量密码。那么,智能体到底是什么?我们又该如何快速入门打造自己的智能体应用呢?其实,作为大模型开发热门框架的LangChain,就能帮助我们轻松实现这一目标。今天,就让我们从零开始,一起看看如何用LangChain打造一个专属于自己的Agent智能系统吧!
2025-03-14 17:59:05
680
原创 大模型入门必读的9本硬核好书,值得反复研读!豆瓣评分超9.0_大模型书籍推荐知乎
模型大师们,准备好踏上一段深度学习与模型构建的路了吗?这里有八本经典之作,它们将是你攀登知识高峰的阶梯
2025-03-14 17:38:22
1103
原创 Transformer到底解决什么问题?
本文希望围绕“Transformer到底是解决什么问题的”这个角度,阐述NLP发展以来遇到的关键问题和解法,通过这些问题引出Transformer实现原理,帮助初学者理解。
2025-03-11 20:41:47
683
原创 259页-DeepSeek企业落地应用讲义精华全版来了,附pdf下载
DeepSeek企业落地应用讲义精华全版》是由大任智库AI应用创新团队编写的企业级AI实践指南,共259页,聚焦AI技术在企业数字化转型中的系统性应用。核心内容与亮点如下:一、技术架构与创新突破DeepSeek模型家族通过混合专家(MoE)、多头注意力优化、动态稀疏激活等技术创新,显著提升了推理效率与多模态能力。例如,DeepSeek-V3在6710亿参数规模下,推理能耗降低58%,图像识别准确率超94.7%,训练成本仅为行业平均的1/5。
2025-03-11 20:32:53
1027
原创 Github超2万星,OpenManus核心作者聊Agent发展趋势
如果大家熟悉 MetaGPT,就会了解MGX是一款多智能体同时在线协作、帮助用户解决问题的产品。用户只需类似于 ChatGPT 一样输入需求,便会有一个较强的智能体对任务进行拆解,再将任务分发到不同的智能体去执行。整个产品目前主要专注于代码生成领域,例如用户想做个人网站、游戏或者数据分析的应用程序等,我们的智能体都可以很好地完成任务。在开发过程中用户可以随时修改需求,例如调整前端项目的风格、排版或布局,我们的智能体也能够很自然地完成,使整个开发成本明显降低。
2025-03-10 23:20:54
1039
原创 2025全网最详细的零基础大模型学习路线!巨详细,这可能会是你见过最全的大模型学习路线!!
Github项目上有一个,它全面涵盖了大语言模型的所需的基础知识学习,LLM前沿算法和架构,以及如何将大语言模型进行工程化实践。这份资料是初学者或有一定基础的开发/算法人员入门活深入大型语言模型学习的优秀参考。这份资料重点介绍了我们应该掌握哪些核心知识,并推荐了一系列优质的学习视频和博客,旨在帮助大家系统性地掌握大型语言模型的相关技术。
2025-03-10 23:17:27
904
原创 带你了解三种大模型的应用技术范式: Prompt、Agent、 RAG
大模型(LLM,Large Language model)是基于大量数据进行预训练的超大型深度学习模型。从2019年发展到现在,其能力已经得到了极大的提升,其中以OpenAI ChatGPT的发布为关键里程碑事件。技术上的突破致使基于大模型的应用层出不穷,诸如Chatgpt, 文心一言, ChatDoc, ChatPPT等。应用虽多,但是技术范式却不外乎提示词工程、Agent和RAG三种。是指在与LLM交互时,精心设计和优化输入(即提示词或问题)的过程,以获得更准确、更有用或更具创造性的回答。
2025-03-05 23:06:13
666
原创 大模型应用案例集:2025年中国52个领域的成功实践,大模型应用落地必看!!
近日,中国信通院联合上海人工智能实验室成立的大模型测试验证与协同创新中心牵头,首次面向全国范围征集全行业优秀应用实践,并形成《2023大模型落地应用案例集》(以下简称“《案例集》”)。《案例集》一共119页pdf,作为首部聚焦落地应用的权威研究成果,全面展示了大模型前沿技术和发展成果,推动了大模型为代表的人工智能技术赋能社会经济高质量发展。经专家组的多轮评审,共52个各自领域的典型大模型技术落地应用成功入选。
2025-03-05 23:00:47
497
原创 AI大语言模型在工业控制领域应用初探
这个武痴影响了一代人,深度学习的另外两个支柱人物Bengio和杨立昆,还有后来加入百度最终创办地平线的余凯,都是读了Hinton的论文,成为神经网络坚定的信仰者。这还不是数据的全部,还有现场没有进L1,L2和L3系统的数据,比如操作工记录的炉温,因为PLC不需要,是存在现场的本地电脑里面的。Sutskever思绪飞扬,他认为这种方法不仅可以用来翻译,只要有合适的数据,还可以用来进行一系列生成场景,比如很快提炼文章核心要义,比如提炼图片中核心意思,只要有足够大的模型,足够多的数据,成功是确定的。
2025-03-03 23:40:21
731
原创 程序员未来黄金赛道:AI与大模型引领职业新机遇
无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。现如今大模型岗位需求越来越大,但是相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元,AI工程师薪资平均值约37336元,大模型算法薪资平均值约39607元。很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,下面是我整理好的一套完整的学习路线,希望能够帮助到你们学习AI大模型。第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。
2025-03-03 23:35:24
1040
原创 工业大模型:体系架构、关键技术与典型应用
近年来,大模型(如 GPT-4o 等)凭借大规模训练数据、大规模参数、大规模算力,涌现出传统 AI 模型所不具备的强大生成能力、泛化能力和交互能力。在自然语言处理领域,大模型能够生成高质量的文本并完成复杂的对话任务;在计算机视觉领域,大模型能够实现精准的图像识别并生成高保真的图像或视频。此外,大模型还在医学、教育等专业领域展现出巨大的应用潜力,通过对领域数据的学习,提供准确的问答、诊断、预测和决策支持,已成为迈向通用人工智能的里程碑技术。
2025-03-02 10:30:00
627
原创 2025大模型应用落地的必看!建议死磕这本中国信通院的《2024大模型典型示范应用案例集》!
2024 年是大模型深入赋能千行百业,融入实体经济,助力科技创新的一年。截 至今年 5 月,我国国产大模型的数量已经超过 300 个,预示着大模型在各行业场景的创新应用和深度拓展,对培育新质生产力、高水平赋能新型工业化、推动高质量发展发挥了重要作用。今年,国务院政府工作报告首次提出“人工智能 +” 行动以来,全国各地进一步加速大模型技术与产业的落地融合。《2024 大模型典型示范应用案例集》(以下简称《案例集》)自 4 月启动征集以来, 得到社会广泛关注。
2025-03-01 22:41:02
1156
原创 从零打造RAG检索系统:BM25让检索快到飞起
为了能够让大家理解什么是RAG,本作者专门在本次教程中使用BM25检索的方式构建一个RAG系统。至于为什么没有用向量检索的形式,主要是为了降低大家体验RAG的成本,因为向量模型一般都比较大(也不算特别大),或者是去调用别人的模型服务,大多要钱,而且也会提升系统的复杂度,且向量化也是需要时间的,我们先用BM25算法构建出来一个RAG系统闭环最后持续快速迭代这个系统,先将优秀的方式加进去,不管是后面加Agent模式,或者是加入图谱检索的模式都可以,不过我们在这之前要做的是先构建出来一个闭环,是否加入向量检索其实
2025-03-01 22:37:25
668
原创 2025最新最全【大模型学习路线规划】零基础入门到精通_大模型 开发 学习路线
目标:了解大模型的基本概念和背景。内容:人工智能演进与大模型兴起。大模型定义及通用人工智能定义。GPT模型的发展历程。目标:深入学习大模型的关键技术和工作原理。内容:算法的创新、计算能力的提升。数据的可用性与规模性、软件与工具的进步。生成式模型与大语言模型。Transformer架构解析。预训练、SFT、RLHF。目标:掌握大模型开发所需的编程基础和工具。内容:Python编程基础。Python常用库和工具。提示工程基础。目标:通过实战项目深化理论知识和提升应用能力。
2025-02-26 00:06:37
1036
原创 DistilQwen2.5发布:通义千问蒸馏小模型再升级
因高计算成本和复杂性,在例如移动设备和边缘计算场景等资源有限的环境中,限制了大语言模型的普及。如何在保留模型性能的同时提高计算效率并降低部署成本,已成为研究和工业界必须面对的关键挑战。在此背景下,我们正式推出基于 Qwen2.5 的轻量化大模型系列 DistilQwen2.5。该模型通过创新的双层蒸馏框架实现突破,基于数据优化策略重构指令数据集强化模型理解能力,并且采用参数融合技术实现细粒度知识迁移。实验表明,DistilQwen2.5 在多项基准测试中性能超越原模型,同时显著降低计算资源消耗。
2025-02-26 00:02:45
858
原创 大模型算法岗常见面试题100道(值得收藏)
大模型应该是目前当之无愧的最有影响力的AI技术,它正在革新各个行业,包括自然语言处理、机器翻译、内容创作和客户服务等等,正在成为未来商业环境的重要组成部分。截至目前大模型已经超过200个,在大模型纵横的时代,不仅大模型技术越来越卷,就连大模型相关的岗位和面试也开始越来越卷了。Transformer体系:由Google提出的Transformer 模型及其变体,如BERT、GPT 等。PyTorch Lightning:一个基于PyTorch的轻量级深度学习框架,用于快速原型设计和实验。
2025-02-24 23:11:35
894
原创 企业定制AI知识库:打造专属智能体
在当今数据爆炸的时代,虽然AI强大,但常规的AI工具或搜索引擎在面对复杂、专业领域的问题时,可能给出模棱两可的回应,无法满足企业精细化的需求。这就是为什么,企业需要一个专属的AI知识库—— 它不仅能存储你的数据,还能真正帮助你提取出所需的关键答案,训练你的模型。想象一下:当你需要某个项目的核心文档、某个复杂问题的精准解决方案时,不必再苦苦翻阅无数资料、盲目等待AI的回应。借助定制化的AI知识库,你可以随时在自己的知识库中,快速、准确地获得答案。这不仅节省了时间,也极大提升了工作效率和决策质量。
2025-02-24 23:03:35
1109
原创 厦大团队:大模型概念、技术与应用实践(140页PPT读懂大模型)
在数字化浪潮汹涌澎湃的当下,大模型如同一颗璀璨新星,强势崛起并迅速成为科技领域的焦点。从最初的理论探索到如今在各个行业的广泛应用,大模型正以惊人的速度重塑着我们的生活与工作模式。它不仅是人工智能技术发展的重大突破,更是推动经济增长、提升社会治理效能、促进科技创新的关键力量。本报告将深入剖析大模型的核心概念、原理特点以及丰富多元的应用实践案例,旨在让大家全面了解大模型这一前沿技术,明晰其在当下及未来发展中的重要地位与深远影响 ,共同探索如何借助大模型的力量推动社会各项事业迈向新的高度。
2025-02-20 11:32:55
767
原创 一文解析大模型微调7种方法,零基础入门大模型(非常详细)看一篇就够了!
本篇文章深入分析了大型模型微调的基本理念和多样化技术,细致介绍了LoRA、适配器调整(Adapter Tuning)、前缀调整(Prefix Tuning)等多个微调方法。详细讨论了每一种策略的基本原则、主要优点以及适宜应用场景,使得读者可以依据特定的应用要求和计算资源限制,挑选最适合的微调方案。
2025-02-20 11:20:01
1115
原创 零基础学AI大模型要多久?真的能学会吗?
随着人工智能技术的迅猛发展,AI大模型成为了当前最热门的技术领域之一。很多人对AI大模型既充满好奇又感到陌生,特别是对于那些完全没有编程基础的人来说,从零开始学习AI大模型似乎是一项艰巨的任务。但实际上,只要有足够的决心和正确的方法,任何人都有可能成为AI大模型领域的专家。本文将探讨从零基础学习AI大模型需要多长时间,以及如何确保你能够真正学会。
2025-02-19 22:59:14
1220
原创 什么是大模型?一文彻底搞懂大模型的基本概念
大模型是指具有大规模参数和复杂计算结构的机器学习模型。本文从大模型的基本概念出发,对大模型领域容易混淆的相关概念进行区分,并就大模型的发展历程、特点和分类、泛化与微调进行了详细解读,供大家在了解大模型基本知识的过程中起到一定参考作用。
2025-02-19 22:54:34
3121
原创 LLM模型之高质量数据选择和微调方法
Entropy Law:多数据集组合时的数据筛选方法数据是大型语言模型(LLM)的基石。大多数方法侧重于评价单个样本的质量,而忽略了样本间的组合效应。受LLMS信息压缩特性的启发,我们发现了一个将LLM性能与数据压缩比和第一个epoch训练损失联系起来的“熵定律”,它们分别反映了数据集的信息冗余度和对该数据集中编码的固有知识的掌握。基于熵定律的结果,我们提出了一种非常有效和通用的数据选择方法ZIP来训练LLMS,该方法旨在对压缩比较低的数据子集进行优先排序。
2025-02-18 13:53:29
677
原创 AI大模型岗位月薪最高6万元!实探上海2025年春季首场大型招聘会
在DeepSeek搅弄大模型市场风云之际,AI人才也再度被卷入热潮。2月14日,上海2025年春季首场综合性大型招聘会在上海体育馆举行。时报记者实探发现,(AI)领域的岗位薪酬最高,大模型数据开发工程师、架构开发工程师、训练平台工程师等关键岗位最高月薪可达6万元。多位受访人士告诉记者,DeepSeek火出圈,再次激活了AI人才市场,吸引众多人才积极投身其中,招聘企业数量也在增加。但由于头部公司重金求才的虹吸效应,企业招聘难度也直线上升。
2025-02-18 13:47:25
799
原创 35岁程序员转行大模型:详细学习路线、岗位推荐,从零基础到精通2025最新
随着人工智能技术的快速发展,特别是大模型(如语言模型、图像生成模型等)在各行各业的应用日益广泛,越来越多的专业人士考虑转向这一充满潜力的新领域。对于35岁的程序员而言,转行至大模型不仅能够提供职业发展的新机遇,还能帮助他们保持技术前沿性,增强自身竞争力。
2025-02-17 11:24:44
554
原创 利用DeepSeek-R1构建简单的本地知识库
初期接触LLM即大语言模型,觉得虽然很强大,但是有时候AI会一本正经的胡说八道,这种大模型的幻觉对于日常使用来说具有很大的误导性,特别是如果我们要用在生成环境下,由于缺少精确性而无法使用。为什么会造成这种结果那,简单来说就是模型是为了通用性设计的,缺少相关知识,所以导致回复的结果存在胡说八道的情况,根据香农理论,减少信息熵,就需要引入更多信息。从这个角度来说,就有两个途径,一是重新利用相关专业知识再次训练加强模型,或进行模型微调;
2025-02-17 11:19:58
1024
原创 全球AI 大模型全栈技术研究报告 2024
经过大规模预训练的大模型,能够在各种任务中达到更高的准确性、降低应用的开发门槛、增强模型泛化能力等,是AI 领域的一项重大进步。大模型最早的关注度源于 NLP 领域,随着多模态能力的演进,CV 领域及多模态通用大模型也逐渐成为市场发展主流。政企的极大关注带动了行业领域大模型的高速发展,逐渐形成了多模态基模型为底座的领域大模型和行业大模型共同发展的局面。伴随基于大模型发展的各类应用的爆发,尤其是生成式 AI,为用户提供突破性的创新机会,打破了创造和艺术是人类专属领域的局面。AI 不再仅仅是“分类”,而且开始进
2025-02-15 14:23:54
931
原创 人人都是程序员时代:程序员如何通过AI大模型续命?
很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,下面是我整理好的一套完整的学习路线,希望能够帮助到你们学习AI大模型。,如何基于自身的专业优势和个人能力优势,抓住AI大模型的风口,设计出比较成熟的Agent,既能提升工作效率,还能用它获得兼职收入。,在如今各类产品都在想办法融入AI能力的时代,搞懂大模型的能力边界,可以用AI大模型能力给当前产品赋予更多的能力和价值。这两年,随着 AI 技术的飞速发展,特别是大模型的出现,传统的程序员角色也因此经历着深刻的变革。
2025-02-15 14:14:11
549
原创 什么是大模型?一文读懂大模型的基本概念_看完这篇就足够了
大模型是指具有大规模参数和复杂计算结构的机器学习模型。这些模型通常由深度神经网络构建而成,拥有数十亿甚至数千亿个参数。大模型的设计目的是为了提高模型的表达能力和预测性能,能够处理更加复杂的任务和数据。大模型在各种领域都有广泛的应用,包括自然语言处理、计算机视觉、语音识别和推荐系统等。大模型通过训练海量数据来学习复杂的模式和特征,具有更强大的泛化能力,可以对未见过的数据做出准确的预测。
2025-02-14 17:22:59
1303
原创 【AI大模型必看教程】手把手带你学AI 应用实战——《LangChain 实战课》附PDF讲义
课程精心设计 4 大模块,带你从各个角度吃透 LangChain 精髓。启程篇:从 0 到 1。介绍 LangChain 系统的安装流程,以及如何进行快速的入门操作。同时,详细指导如何使用 LangChain 来构建一个基于“易速鲜花”本地知识库的智能问答系统,让你直接感受 LangChain 强大的功能。
2025-02-13 11:57:24
1530
原创 2025年最火大模型DeepSeek-R1资源汇总
01DeepSeek-R1 是人工智能开源模型生态系统中的一大进步,其最新模型在多种指标上与 OpenAI 的 o1 持平。围绕他们以更少的资金和计算资源实现这一目标,存在许多炒作和铺天盖地的新闻。我没有选择从那些热衷于炒作发布的 AI 影响者的帖子中去了解它,而是决定制作一份阅读清单,链接到许多基础研究论文。这份清单意在让人慢慢地、一篇一篇地阅读,可以加深对这一现象级模型的深刻认知。闲话少说,我们直接开始吧!02本质上,DeepSeek 是基于 Transformer 神经网络架构构建的。
2025-02-13 11:03:19
876
原创 2025年deepseek爆火,普通人如何抓住风口!转行AI大模型,收入暴涨10倍+
本篇文章比较适合以下几类朋友:1.适合想要了解AI到底是怎么回事的小白和入门朋友;2.适合有意愿转型从事AI相关的产品和岗位的朋友,包括产品经理,运营人员;3.适合已经初步了解AI,但是想要进阶学习AI,减少AI认知焦虑的朋友;4.适合有兴趣在AI领域创业搞事情的朋友。
2025-02-12 11:47:22
1473
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人