D998998998-优快云博客

原创什么是大模型？一图全面了解大模型

引申到模型层面，涌现能力指的是当模型的训练数据突破一定规模，模型突然涌现出之前小模型所没有的、意料之外的、能够综合分析和解决更深层次问题的复杂能力和特性，展现出类似人类的思维和智能。简而言之，大模型是指利用海量数据，通过先进的算法和技术，训练得到的具有强大预测和决策能力的模型。它们利用大算力、使用海量的开放数据与具有巨量参数的深度学习算法，在大规模无标注数据上进行训练，以寻找特征并发现规律，进而形成可“举一反三”的强大泛化能力，可在不进行微调或少量微调的情况下完成多场景任务，相当于AI完成了“通识教育”。

2025-06-12 17:59:50 1212

原创【大模型微调】一文让你掌握7种大模型微调的方法

这种方法的优势在于不需要调整模型的所有权重，而是通过在输入中添加前缀来调整模型的行为，从而节省大量的计算资源，同时使得单一模型能够适应多种不同的任务。与传统的微调范式不同，前缀调整提出了一种新的策略，即在预训练的语言模型（LM）输入序列前添加可训练、任务特定的前缀，从而实现针对不同任务的微调。直观上，大型模型微调即是向模型“输入”更多信息，对模型的特定功能进行“优化”，通过输入特定领域的数据集，使模型学习该领域知识，从而优化大模型在特定领域的NLP任务中的表现，如情感分析、实体识别、文本分类、对话生成等。

2025-06-12 17:57:23 1043

原创你知道大模型到底是什么吗？大模型与小模型之间有什么区别

一年多来，业界发布了非常多的大模型，从去年OpenAI GPT-3 1750亿参数开始到年初华为盘古大模型 1000亿，鹏程盘古- 2000亿参数，及谷歌最近发布的大模型是PaLM-E，拥有5620亿参数，号称史上最大规模视觉语言模型，快手1.9万亿参数推荐精排模型，阿里达摩院M6 10万亿参数等。ChatGPT对大模型的解释更为通俗易懂，也更体现出类似人类的归纳和思考能力：大模型本质上是一个使用海量数据训练而成的深度神经网络模型，其巨大的数据和参数规模，实现了智能的涌现，展现出类似人类的智能。

2025-06-06 17:59:34 763

原创大模型改造互联网巨头：从广告到电商，旧业务装上新引擎

通俗讲，技术浪潮的演进，往往是层层叠加、不断放大的，**每一波新的技术，都会站在前一波技术的肩膀上，爆发出更强的能量。总的来看，此刻的AI行业，和当年的PC端，移动端的技术大变革一样，虽然主流的基础大模型很可能会被大厂完全掌控，但是留下的可开发的机会依然不少，对创业者来说，这依然是个无限可能的世界。AI模型的训练和推理，用到的资金，是天文数字。腾讯的业务线为社交，游戏，支付，AI+云计算，视频，音乐，短视频，广告，涵盖了这个行业多数板块，从管理层的表述来看，AI可能会从五个方面来提振腾讯的收入。

2025-06-05 21:20:34 685

原创这一篇详解A2A(Agent2Agent)协议就够你了解A2A

A2A（Agent2Agent）协议是由 Google Cloud 推出的一个开放协议，旨在促进不同 AI 代理之间的互操作性。其主要目标是允许这些代理在动态的、多代理的生态系统中进行有效的通信和协作，无论它们是由不同的供应商构建的还是使用不同的技术框架。A2A（Agent2Agent）协议的设计原则旨在提升代理之间的协作能力，确保灵活性、安全性和与现有系统的兼容性。拥抱代理能力• 允许代理在其自然、非结构化的模式下进行协作，无需共享内存、工具或上下文，从而实现真实的多代理场景。基于现有标准构建。

2025-06-04 14:52:47 1676

原创【大模型微调】一文让你彻底掌握7种大模型微调的方法

本篇文章深入分析了大型模型微调的基本理念和多样化技术，细致介绍了LoRA、适配器调整(Adapter Tuning)、前缀调整(Prefix Tuning)等多个微调方法。详细讨论了每一种策略的基本原则、主要优点以及适宜应用场景，使得读者可以依据特定的应用要求和计算资源限制，挑选最适合的微调方案。大型语言模型(LLM)的训练过程通常分为两大阶段：阶段一：预训练阶段在这个阶段，大型模型会在大规模的无标签数据集上接受训练，目标是使模型掌握语言的统计特征和基础知识。

2025-06-03 18:02:28 628

原创值得深思：企业级大模型落地为什么非常难？

从技术验证到规模化落地，企业需要跨越的不仅是构建私域数据和大模型的桥梁，更是在进行一场涉及系统架构升级与业务流程再造的数字化转型手术，需要同步升级数据治理体系和业务协同机制。同时，大模型训练数据常为静态，但企业在反欺诈等场景中，急需依据动态、实时数据生成风险预测，传统数据处理流程难以满足这一诉求。在医疗、法律、金融等强监管行业，模型输出的错误或虚构信息，极易引发严重合规问题，金融机构若依据错误模型输出进行信贷审批，可能面临巨额罚款甚至法律诉讼。部署大模型时，可能过度聚焦性能优化，忽略用户体验与界面设计。

2025-05-30 18:03:32 470

原创什么是大模型？一文读懂大模型的基本概念

引申到模型层面，涌现能力指的是当模型的训练数据突破一定规模，模型突然涌现出之前小模型所没有的、意料之外的、能够综合分析和解决更深层次问题的复杂能力和特性，展现出类似人类的思维和智能。在探索期，以 Transformer 为代表的全新神经网络架构，奠定了大模型的算法架构基础，使大模型技术的性能得到了显著提升。ChatGPT 对大模型的解释更为通俗易懂，也更体现出类似人类的归纳和思考能力：大模型本质上是一个使用海量数据训练而成的深度神经网络模型，其巨大的数据和参数规模，实现了智能的涌现，展现出类似人类的智能。

2025-05-30 17:38:27 602

原创国内企业到底需要什么样的大模型？

摘要：自ChatGPT爆火以来，中国大模型领域快速跟进，已涌现180多个模型，国内外头部模型在中文通用能力上的差距从2023年的30%缩小至2024年的1.29%。国外OpenAI、Anthropic和谷歌持续领跑，推出多模态、高效响应的最新模型；国内互联网大厂（如百度、腾讯、阿里）纷纷布局细分场景应用，推动AI与行业深度结合。未来AI将重塑职场生态，掌握大模型工具或成基础技能，企业加速“AI替代”以实现降本增效。文末附独家大模型学习资料包。

2025-05-30 17:34:43 636

原创【大模型科普】大模型：人工智能的前沿技术

在数字化浪潮汹涌澎湃、日新月异的当今时代，大模型犹如一颗璀璨夺目的新星，在科技的天幕上强势崛起，迅速吸引了全球范围内的广泛关注与热烈讨论，成为科技领域一颗耀眼的焦点。从最初的理论探索与初步尝试，到如今在各行各业中的广泛渗透与深度应用，大模型正以令人瞠目结舌的速度和不可阻挡的态势，重塑着我们的生活方式、工作模式乃至整个社会的运行逻辑。大模型不仅是人工智能技术发展历程中的一个重大突破和里程碑式的成就，更是推动全球经济持续增长、提升社会治理效能、加速科技创新步伐的关键力量。

2025-05-29 09:36:58 1626

原创 AI 是一个广博的领域，涵盖许多不同的学科

本文是一篇人工智能科普指南，主要分为两部分内容：科普入门和细分领域。在科普入门部分，文章首先介绍了人工智能的定义——通过计算机程序模拟人类智能的技术，涵盖机器人、语音识别、图像识别等多个领域。随后区分了弱AI（专注于特定任务，如Siri、自动驾驶）和强AI（理论上的类人智能）。接着解释了人工智能、深度学习与机器学习的关系，指出深度学习是机器学习的一个子领域，使用神经网络自动提取特征。文章还列举了人工智能的主要应用场景，包括语音识别、计算机视觉、客户服务等，并梳理了AI的发展历史和产业架构。最后提及了人工

2025-05-28 18:13:19 862

D998998998的博客