自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1068)
  • 收藏
  • 关注

原创 盘点国产十大最实用的AI大模型!(深度解析)

在这个由数据驱动的时代,人工智能(AI)已经成为推动世界进步的超级引擎。从日常的语音助手到复杂的医疗诊断,AI的应用无处不在,它的影响力正以前所未有的速度扩展。今天我们来聊聊那些国产的AI大模型,深度盘点一下国产最实用的十大AI大模型百度文心大模型包含NLP(自然语言处理)、CV(计算机视觉)和跨模态大模型。在自然语言处理领域,文心ERNIE系列模型具有强大的小样本学习能力和基本推理能力。在计算机视觉领域,百度提出了基于视觉掩码技术的文心VIMER-CAE,具有强大的图像分割能力。

2024-12-10 14:08:23 8765

原创 我们为什么要用本地大模型?——坤叔的本地大模型入门指南

大模型,在2023年主要称之为大型语言模型(Large Language Models),是一种基于人工智能和机器学习技术构建的先进模型,旨在理解和生成自然语言文本。这些模型通过分析和学习海量的文本数据,掌握语言的结构、语法、语义和上下文等复杂特性,从而能够执行各种语言相关的任务。LLM的能力包括但不限于文本生成、问答、文本摘要、翻译、情感分析等。我们最熟悉的大模型,莫过于CHATGPT。但我们最常用的大模型,未必是CHATGPT。

2024-05-23 10:52:45 11420

原创 值得收藏!十大中国流行的AI大模型企业及平台汇总

在当今这个信息化迅速发展的时代,人工智能技术已经成为推动社会进步的重要力量。特别是在我国,AI大模型技术的发展速度令人瞩目,各种平台纷纷涌现,表现出强大的技术实力和广泛的应用前景。

2024-05-16 13:37:12 10960

原创 一文读懂 LLM 训练:从预训练到微调【大模型行业应用入门系列】

LLM Training 是指大型语言模型(LLM)的训练过程。作为一种采用超大规模数据进行预训练的深度学习模型,LLM 训练目标是培养出一个能够理解和生成自然语言文本的模型。在这个过程中,LLM 通过处理海量文本数据来学习语言的规律、语义和上下文关系等训练方式,可以获得丰富的语言知识和智能,从而使得能够自动理解和生成人类语言。通常而言,这种训练过程通常需要大量的计算资源和时间,以便模型能够充分地学习语言的各个方面。

2024-04-16 15:39:20 7909

原创 全民AI时代:手把手教你用Ollama & AnythingLLM搭建AI知识库,无需编程,跟着做就行!

本地运行大模型耗资源,需要选择较小的模型作为基础模型。在终端中运行时可能会出现 CUDA 错误,表示显存不足,导致提供的端口失效。中文支持不够完善。3. 文中提到的技术软件工具有:Ollama、Chatbox、Open WebUI、向量数据库、嵌入模型、本地模型 Gemma、AnythingLLM。

2024-04-10 11:10:50 10041

原创 一文吃透多模态:多模态大模型的探索 五大研究方向与十大应用领域!

理想中的多模态大模型具备跨模态的泛化理解和生成能力,其更符合人类感知世界的方式,其或能进一步打开AI能力的上限。产业界也在积极探索多模态大模型可行的技术路径,在多模态领域“复刻”大语言模型的成功。但目前多模态大模型的技术栈也尚未收敛,多模态学习和跨模态对齐仍为技术难点,未来产业发展仍有无限可能。在大模型兴起之后,产业也试图在图像、视频、音频等更多模态领域复现“Scaling Law”的成功,继续实现大模型的“智能涌现”。• 薪资上浮10%-20%,覆盖更多高薪岗位,这是一个高需求、高待遇的热门方向和领域;

2024-04-07 18:30:11 8591

原创 【必藏】2026届AI校招真相:大模型人才抢疯了!小白/程序员速看的成长指南

整体来看,2026 届 AI 校招市场正呈现 “需求稳增、结构优化、薪酬分化” 三大特征:需求端,企业从 “泛 AI 招聘” 转向 “精准筛选”,技术深度与垂直能力成核心;供给端,具备扎实数学基础、实战项目经验的应届生更具竞争力;薪酬端,核心技术岗与支持岗的差距持续拉大,行业资源向高端人才集中。随着 AI 技术进一步深入产业,企业对 “高素质、高潜力”AI 应届生的需求将持续增长。

2025-11-24 15:41:03 570

原创 大模型入门必看:AI智能体核心解析(小白&程序员速藏)

在人工智能的技术体系中,AI智能体是一种融合多专业组件的高级系统,但真正让它区别于传统AI的核心,在于其突破性的自主决策与动态适应能力。传统混合AI系统好比“按剧本演戏”,只能遵循固定的操作流程完成任务;而AI智能体则像“即兴表演者”,能借助基础模型的推理能力,根据实时场景灵活调整策略。这种运作模式的差异,使其在复杂场景中展现出无可替代的优势。举个形象的例子:传统混合系统就像自动售货机,投币后仅能输出预设品类的商品;

2025-11-24 15:39:43 570

原创 【收藏必看】从遍地offer到石沉大海:AI时代程序员的生存法则与大模型转型指南

文章分析了程序员就业市场变化的四大原因:市场需求见顶、AI编程冲击、企业降本增效、供需失衡。指出虽然行业红利消失,但机会仍在。未来程序员需向上深耕底层技术,向外拓展AI等新领域,或向下熟练使用AI工具,成为更懂技术或业务的开发者。AI时代,程序员可通过转型升级依然保持竞争力,关键在于适应技术变革,提升自身价值。

2025-11-22 18:10:06 580

原创 上下文工程:AI智能体高效开发的必学收藏指南,程序员必看!

上下文工程是提示词工程的演进,关注如何有效筛选和管理AI智能体的有限上下文资源。由于大模型注意力预算有限,需精心筛选高价值tokens以优化性能。文章探讨了高效上下文的构成(系统提示词、工具、示例)及长期任务的处理技术(压缩、结构化笔记、多智能体架构)。核心原则是找到最小规模的高价值tokens,确保预期结果,构建可靠高效的AI智能体。

2025-11-22 18:08:03 540

原创 收藏必备:大模型技术革命,程序员生存与发展的关键技能

在AI大模型时代,仅掌握CRUD技能的程序员价值下降,而融入大模型技术的开发者更具竞争力。掌握Prompt设计、RAG构建、模型微调等技能的技术人就业更受欢迎,薪资涨幅可达50%以上。文章推荐实战营帮助程序员全方位提升能力,实现职业跃迁,抢占AI时代就业红利。

2025-11-22 18:06:01 648

原创 紧急收藏!大模型学习逆向指南:小白靠“问题”入门,程序员用“项目”破局

大模型学习的逆向思维,本质是回归技术学习的核心——技术是为了解决问题,不是为了“学会技术本身”。小白不用羡慕别人“懂大模型原理”,能靠Prompt解决工作问题,就是合格的“大模型使用者”;程序员不用追求“掌握所有框架”,能靠项目落地技术,就是稀缺的“大模型开发者”。当你用大模型解决第一个问题、跑通第一个项目时,你会发现:学习大模型,原来这么简单。

2025-11-22 15:33:14 868

原创 【干货收藏】为什么你的AI智能体总是半途而废?DeepAgents深度智能体框架全解析

DeepAgents的出现标志着AI智能体从"浅尝辄止"的工具向"深度思考"的协作者转变。通过规划工具、子智能体系统、文件系统和提示词工程的有机结合,DeepAgents为构建真正智能的AI系统提供了强大框架。无论是研究人员、开发者还是企业用户,现在正是拥抱这一技术变革的最佳时机。通过本文介绍的实战指南和进阶技巧,你可以快速掌握DeepAgents的核心能力,构建属于自己的深度智能体,在AI驱动的未来竞争中占据先机。

2025-11-22 15:31:44 784

原创 【必学收藏】为什么知识图谱是大模型RAG的进阶选择?从理论到实战

知识图谱通过抽取实体及关系构建包含内容分析的知识库,解决了传统向量RAG在长文档处理中忽视块间联系、难以还原文档概括性见解的问题。GraphRAG擅长全局查询和关系密集型任务,但成本高;LightRAG在检索效率和增量更新方面更具优势,支持多种检索模式,能够更好理解事物间的复杂关系,帮助LLM生成更全面的回答,适用于学习目的或个人轻量级场景。

2025-11-21 15:22:28 278

原创 【程序员必看】解锁大模型潜能:AI Agent三大核心技术详解(收藏级干货)

单纯的大模型,只能对话和生成文本,是“思想的巨人,行动的矮子”。配上Agent的大模型,能感知环境、使用工具、执行任务,成为“万能助手”。MCP、Function Calling 和 A2A。这三项技术,并不是有你无我的排斥关系,而是可以通力协作的互补关系。大模型通过 Prompt 学习工具使用,实现非结构化任务处理,克服传统规则的“刚性”,使得AGI(Artificial General Intelligence,通用人工智能)成为可能。

2025-11-21 15:21:03 708

原创 收藏必备!程序员如何在AI大模型时代突围:2025年职业发展全攻略

2025年程序员就业市场面临挑战,包括裁员潮和薪资分化。AI技术既是冲击也是机遇,AI编程工具崛起,AI工程师需求激增。程序员需通过三大路径转型:技术深耕(如AI/ML工程师)、业务融合(如技术产品经理)和创新探索(如鸿蒙开发者)。核心在于持续学习、拥抱变化、提升自我,才能在行业变革中找到出路。

2025-11-20 18:08:43 982

原创 程序员如何快速学习AI大模型应用工程开发,从后端转行为AI工程师

文章提供了后端工程师转行AI大模型工程化的学习路线,包括掌握Python、深度学习框架、transformer架构,学习训练微调流程和RAG技术,使用开发平台和向量数据库,最终构建高可用AI应用。

2025-11-20 18:07:35 680

原创 程序员必看!2025年十大高薪转型方向收藏指南(含大模型应用领域)

文章为程序员提供了2025年十大高薪转型方向,包括数据科学、产品管理、技术咨询、网络安全等,每个方向详述了转型优势、核心技能、发展前景等关键信息。同时指出转型成功需注重技能迁移、知识补充、人脉建设和渐进过渡。无论选择哪个方向,程序员的结构化思维和持续学习能力都是最宝贵资产,建议结合个人兴趣与市场趋势选择最适合的转型路径。

2025-11-20 18:06:03 895

原创 【珍藏】RAG系统开发避坑指南:17个技巧提升大模型应用效果

本文介绍了RAG系统的17种优化技术,涵盖数据质量、索引结构、检索优化、后处理、模型选择和评估等方面。强调RAG开发需不断测试调整,通过这些技巧可解决内容区分、块大小优化、系统监控等常见问题,提高应用效果和稳定性,避免重复踩坑。毫无疑问,LLM变得越来越强大,但如果我们仔细看看,真正完全依赖纯大模型的产品其实并不多。大多数情况下,大模型只是扮演一个辅助角色。那么,提升RAG性能的关键因素是什么呢?其实还是那些不那么炫酷的东西:数据质量——数据准备——数据处理。

2025-11-20 15:59:55 972

原创 收藏必备!RAG技术架构深度解析:从Embedding模型到GraphRAG的创新实践

在数据呈指数级增长的今天,企业内部积累了海量的信息数据,其中,结构化数据因其格式规整、语义明确,蕴含着巨大的商业价值。然而,如何让非技术人员也能轻松访问和分析这些数据,一直是业界的难题。结构化数据:具有固定格式和明确语义,如数据库表格,便于计算机快速查询和处理。非结构化数据:如文本文档、图片,无固定格式,语义理解难度大。为应对结构化数据查询的挑战,我们基于经典RAG框架融合Text2SQL技术,通过“理解-检索-生成”的模式,将用户的自然语言问题高效转化为精准的数据结果。2.2、方案总览。

2025-11-20 15:39:46 594

原创 【必学收藏】为什么程序员和小白都必须掌握大模型技术?2025年AI革命的核心引擎

大模型已成为AI变革核心引擎,应用广泛。学习大模型是把握AI革命主动权的关键,RAG和AI Agent等前沿技术人才需求旺盛,薪资优厚。"大模型之心Tech"社区提供全栈学习路线、技术交流和行业资源,帮助小白入门,助力进阶提升,是把握AI革命的重要平台。

2025-11-19 22:22:44 1033

原创 95%的企业AI应用都是“假智能体“!收藏这篇,一文读懂智能体与工作流的本质区别

文章揭示了AI智能体热潮背后的真相:95%的企业AI应用仍使用传统工作流而非真正的智能体。真正的智能体具备运行时涌现的规划能力,而当前智能体面临规划幻觉、错误放大等挑战。企业选择工作流是出于可靠性和成本效益考量。未来发展方向是结合智能体适应性与工作流可靠性的混合架构,关键在于明确区分两种范式并在正确场景应用正确架构。

2025-11-19 22:21:36 510

原创 【收藏】AI大模型时代:程序员会被替代?零基础也能掌握编程能力的真相

AI大模型正深刻改变程序员职业,提高各行业工作效率。未来AI+岗位将成为趋势,普通人通过学习大模型技术可提升职场竞争力。提供从零基础到实战的完整学习路径,适合产品经理、运营、管理者等各行业人士学习,帮助掌握AI赋能业务的能力,抓住AI时代红利。

2025-11-19 22:18:29 765

原创 大模型学习避坑指南:3类人群精准匹配,从入门到进阶不绕路

我零基础能学大模型吗?”“做了5年Java开发,转岗大模型该从哪下手?”在大模型学习热潮中,这类疑问最为常见。事实上,大模型技术体系庞大,并非只有一条“标准赛道”——无论是零基础小白、传统开发转岗者,还是资深技术人,都能找到适配自己的入门方式。👉 字节跳动“大模型青训营”推出分层课程:针对零基础学员开设Python+AI基础班,转岗学员聚焦“业务代码与大模型融合”实战,资深开发者则对接“模型压缩与部署”前沿课题,首期结业率89%,就业率达85%;

2025-11-19 14:13:03 813

原创 收藏必备!MCP协议详解:大模型与外部工具交互的统一标准,小白也能看懂!

MCP(Model Context Protocol,模型上下文协议)是一种由Anthropic于2024年11月提出并开源的开放标 准,旨在统一大语言模型与外部数据源和工具的交互方式。传统模式下,每个数据源或工具都需要单独的适配器和函数调用;不同模型又各自有不同的函数调用格式,导致开发者面对“N×M”的集成难题。MCP解决了这一碎片化问题,提供了一个类似于“AI扩展坞”或“AI的USB-C接口”般的标准化方案。

2025-11-19 14:11:17 586

原创 【收藏】大模型实战指南:企业AI应用从入门到精通

本文全面介绍了大模型技术在企业中的应用实践,从基础概念到落地实施,为企业AI转型提供指导。文章详细解析了大模型的工作原理、技术架构及主流应用场景,通过真实案例展示如何将大模型融入企业业务流程,提升运营效率与创新能力。同时探讨了企业在实施大模型过程中可能面临的挑战及应对策略,为不同规模企业提供了实用的技术路线图和最佳实践建议。

2025-11-18 19:09:19 372

原创 三个月从0到1:程序员转型大模型开发者的完整学习路线(建议收藏)

文章为程序员提供了转型大模型开发者的三个月系统学习路线:第一个月打基础,学习大模型原理和API调用;第二个月掌握Prompt工程、微调、Agent架构和RAG四大核心技能;第三个月通过实战项目巩固能力并准备简历。文章强调大模型开发并非高不可攀,有编程基础的人通过系统学习和项目实践,三个月内可具备大模型应用开发能力,成功转型。关键在于选择正确学习路径并坚持行动。

2025-11-18 19:08:32 1209

原创 DeepSeek&企业知识库:大模型员工助手,助力企业人效提升和业务增长

2025年伊始,AI技术浪潮汹涌,正在深刻重塑程序员的职业轨迹:

2025-11-18 19:05:21 653

原创 【收藏】转行大模型前必读:算法岗门槛高不可攀,应用岗需谨慎选择,别盲目跟风!

本文分析大模型领域两类岗位:算法工程师门槛极高,需顶尖学历和理论基础;应用工程师要求相对较低,但仍需深入理解业务。作者建议不要盲目追逐热门,应先利用业余时间研究确认兴趣和适合度,尤其是已在有业务和技术壁垒领域工作的人无需换赛道,避免"自废武功"。

2025-11-18 19:03:12 262

原创 【值得收藏】大模型业务应用实战:从需求分析到稳定性保障

文章详细介绍了大模型从开发到实际业务场景部署的关键环节,包括业务需求分析(功能性需求与非功能性需求)、性能优化(处理速度、减少运算量)、用户感知优化(流式输出、错误处理)和稳定性保障(自动缩扩容、监控预警、容灾设计)四大方面,旨在帮助开发者实现大模型应用的高效、低成本部署和运营。

2025-11-18 19:02:10 324

原创 【必读】大模型小白必学:一文彻底搞懂Token概念、计算与限制

本文详细解释了大模型中Token的概念,它是大模型能理解的最小语言单位,如同语言积木。文章阐述了Token如何将文字转化为数字向量供模型处理,再转回文字,以及Token数量的计算方法和限制。中文1Token约1-2字,英文约0.75单词。了解Token原理对使用大模型和API开发至关重要,能帮助优化输入、避免超限,并控制成本。

2025-11-18 19:01:08 712

原创 Java程序员转型大模型开发:从入门到高薪的实战路径

从Java开发到大模型研发,绝非对过往的否定,而是技术能力的延伸与升级。AI大模型的浪潮正在重构技术人才市场,对于愿意跳出舒适区、以工程化能力为基石、逐步搭建AI知识体系的Java程序员而言,这是实现职业跃迁的黄金窗口。转型无需追求“一步到位”,可从工具链学习切入,以项目实践积累经验,充分复用Java开发的核心优势。只要保持学习节奏,循序渐进,就能在AI时代构建起不可替代的核心竞争力,让职业发展之路越走越宽。

2025-11-18 14:23:01 715

原创 【值得收藏】ReAct Agent详解:构建融合推理与行动的大模型智能体

ReAct是一种融合推理(Reasoning)与行动(Acting)的AI智能体框架,通过动态思考链和工具调用实现多步推理与复杂任务执行。它解决了传统LLM的"幻觉"问题,支持长任务分解,并能无缝集成领域工具。ReAct采用Thought→Act→Observation循环机制,使智能体能主动思考、决策并执行任务,代表着LLM从内容生成向决策智能的跨越,在自动编程、智能运维等领域有巨大应用潜力。

2025-11-18 14:19:11 752

原创 【强烈收藏】AI不会取代程序员,但会用AI的程序员会取代别人:大模型工具定制全攻略

文章探讨了AIGC热潮下程序员如何应对AI工具变革。分析了当前AI工具的两类来源(头部公司通用能力和社区开源生态)及其优缺点,提出将两者结合是最佳策略。通过CLI智能提示助手的定制化实践,展示了如何使用Dify服务扩展开源工具,使其能够学习公司内部工具,帮助程序员提升效率,完成能力升级。

2025-11-17 18:46:00 736

原创 大模型时代,程序员的竞争力金字塔:收藏这篇,构建你的AI时代护城河

文章探讨了AI工具对程序员工作的影响,指出AI虽提高效率但也可能压缩新手成长路径。作者认为,程序员应将AI视为"超级陪练",通过重拾基本功、深度追问AI、提升技术沟通能力,构建从"码代码"到"设计系统"再到"定义问题"的竞争力金字塔。未来程序员的不可替代性在于高阶思维、系统设计能力和驾驭AI的工具,从"代码工人"进化为"系统思考者"、"问题解决者"和"AI的驾驭者"。

2025-11-17 18:44:24 564

原创 【干货收藏】RAG技术深度解析:让大模型突破知识局限,提升AI应用能力

RAG(Retrieval Augmented Generation,检索增强生成)是一种创新技术,旨在通过融合外部知识源来提高生成式人工智能模型的准确性和可靠性。这种方法针对了大型语言模型(LLM)的一个固有缺陷:LLM虽然擅长捕捉语言的统计模式,但缺乏对具体事实知识的深入理解。事实上,在LLM的引擎盖下,其核心是基于深度神经网络,通常以巨大的参数量来衡量模型的能力。这些参数代表了人类使用语言构建句子的一般模式和规律,是对自然语言处理的参数化理解。

2025-11-17 14:29:39 988

原创 【收藏学习】从零开始学多模态大模型:视觉语言与语音语言模型架构详解

本文详细介绍了多模态大模型的架构设计,重点讲解了视觉语言模型(VLM)和语音语言模型(SLM)的实现方法。VLM部分阐述了对比学习、掩码预测、生成式学习和映射学习四种训练思路;SLM部分介绍了三种输入输出模式及语音表示学习方法和文本融合技术。这些架构让AI能够同时处理图像、语音和文本,实现更自然的人机交互。随着的成功,人工智能不仅在语言处理上突飞猛进,在视觉、语音等领域也迎来了突破。如今,研究者们已经能够把“看”和“听”的能力与“语言”结合起来,形成了功能强大的和。随着研究的深入,这些架构也在不断进化。

2025-11-17 14:27:59 765

原创 【收藏必看】从零掌握大模型微调:让通用AI变身专业助手的实战指南,附真实案例与代码

微调必要性:让通用模型适应专业场景方法选择:根据资源和需求选择合适方法LoRA优势:参数高效、训练快速Freeze策略:选择性优化、保留核心能力成本控制:合理配置、云环境选择。

2025-11-16 11:15:00 960

原创 【必学收藏】RAG技术深度解析:从RAGFlow到GraphRAG的架构演进与实战指南

本文对RAG(检索增强生成)技术进行全景解析,重点比较分析了RAGFlow和GraphRAG两种主流框架的架构设计。RFlow是基于深度文档理解的流水线范式,适合企业级快速部署;GraphRAG通过引入知识图谱实现了从"词袋式检索"到"知识图谱推理"的架构飞跃,具备更强的全局推理能力和可解释性。未来RAG架构将向混合知识表示、智能查询路由和端到端优化闭环方向发展,开发者应以积木式思维灵活汲取各架构范式精华,构建最适合业务场景的现代RAG系统。

2025-11-16 09:30:00 689

原创 【收藏必备】AI Agent深度解析:让大模型从“应答工具“进化为“自主执行者“

AI Agent 是一个能够感知环境、自主决策、执行行动以达成特定目标的软件系统。它赋予了大型语言模型(LLM)主动性(Proactivity)。它的核心价值在于:它能将一个模糊的、复杂的“目标”,转化为一系列可执行的、自主的步骤。它不等待你的每一步指令,而是根据环境反馈,像人类一样迭代工作。核心机制:迭代的“三段论”接收用户指令和外部环境(如互联网搜索结果、数据库数据)的反馈。将大目标拆解成小的分步计划(如应该先查哪些资料、做哪些计算、用哪些工具),并根据感知到的信息实时修正计划。

2025-11-16 09:15:00 616

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除