- 博客(15)
- 收藏
- 关注
原创 什么是大模型?一图全面了解大模型
引申到模型层面,涌现能力指的是当模型的训练数据突破一定规模,模型突然涌现出之前小模型所没有的、意料之外的、能够综合分析和解决更深层次问题的复杂能力和特性,展现出类似人类的思维和智能。简而言之,大模型是指利用海量数据,通过先进的算法和技术,训练得到的具有强大预测和决策能力的模型。它们利用大算力、使用海量的开放数据与具有巨量参数的深度学习算法,在大规模无标注数据上进行训练,以寻找特征并发现规律,进而形成可“举一反三”的强大泛化能力,可在不进行微调或少量微调的情况下完成多场景任务,相当于AI完成了“通识教育”。
2025-06-12 17:59:50
1212
原创 【大模型微调】一文让你掌握7种大模型微调的方法
这种方法的优势在于不需要调整模型的所有权重,而是通过在输入中添加前缀来调整模型的行为,从而节省大量的计算资源,同时使得单一模型能够适应多种不同的任务。与传统的微调范式不同,前缀调整提出了一种新的策略,即在预训练的语言模型(LM)输入序列前添加可训练、任务特定的前缀,从而实现针对不同任务的微调。直观上,大型模型微调即是向模型“输入”更多信息,对模型的特定功能进行“优化”,通过输入特定领域的数据集,使模型学习该领域知识,从而优化大模型在特定领域的NLP任务中的表现,如情感分析、实体识别、文本分类、对话生成等。
2025-06-12 17:57:23
1043
原创 你知道大模型到底是什么吗?大模型与小模型之间有什么区别
一年多来,业界发布了非常多的大模型,从去年OpenAI GPT-3 1750亿参数开始到年初华为盘古大模型 1000亿,鹏程盘古- 2000亿参数,及谷歌最近发布的大模型是PaLM-E,拥有5620亿参数,号称史上最大规模视觉语言模型,快手1.9万亿参数推荐精排模型,阿里达摩院M6 10万亿参数等。ChatGPT对大模型的解释更为通俗易懂,也更体现出类似人类的归纳和思考能力:大模型本质上是一个使用海量数据训练而成的深度神经网络模型,其巨大的数据和参数规模,实现了智能的涌现,展现出类似人类的智能。
2025-06-06 17:59:34
763
原创 大模型改造互联网巨头:从广告到电商,旧业务装上新引擎
通俗讲,技术浪潮的演进,往往是层层叠加、不断放大的,**每一波新的技术,都会站在前一波技术的肩膀上,爆发出更强的能量。总的来看,此刻的AI行业,和当年的PC端,移动端的技术大变革一样,虽然主流的基础大模型很可能会被大厂完全掌控,但是留下的可开发的机会依然不少,对创业者来说,这依然是个无限可能的世界。AI模型的训练和推理,用到的资金,是天文数字。腾讯的业务线为社交,游戏,支付,AI+云计算,视频,音乐,短视频,广告,涵盖了这个行业多数板块,从管理层的表述来看,AI可能会从五个方面来提振腾讯的收入。
2025-06-05 21:20:34
685
原创 这一篇 详解A2A(Agent2Agent)协议 就够你了解A2A
A2A(Agent2Agent)协议 是由 Google Cloud 推出的一个开放协议,旨在促进不同 AI 代理之间的互操作性。其主要目标是允许这些代理在动态的、多代理的生态系统中进行有效的通信和协作,无论它们是由不同的供应商构建的还是使用不同的技术框架。A2A(Agent2Agent)协议的设计原则旨在提升代理之间的协作能力,确保灵活性、安全性和与现有系统的兼容性。拥抱代理能力• 允许代理在其自然、非结构化的模式下进行协作,无需共享内存、工具或上下文,从而实现真实的多代理场景。基于现有标准构建。
2025-06-04 14:52:47
1676
原创 【大模型微调】一文让你彻底掌握7种大模型微调的方法
本篇文章深入分析了大型模型微调的基本理念和多样化技术,细致介绍了LoRA、适配器调整(Adapter Tuning)、前缀调整(Prefix Tuning)等多个微调方法。详细讨论了每一种策略的基本原则、主要优点以及适宜应用场景,使得读者可以依据特定的应用要求和计算资源限制,挑选最适合的微调方案。大型语言模型(LLM)的训练过程通常分为两大阶段:阶段一:预训练阶段在这个阶段,大型模型会在大规模的无标签数据集上接受训练,目标是使模型掌握语言的统计特征和基础知识。
2025-06-03 18:02:28
628
原创 值得深思:企业级大模型落地为什么非常难?
从技术验证到规模化落地,企业需要跨越的不仅是构建私域数据和大模型的桥梁,更是在进行一场涉及系统架构升级与业务流程再造的数字化转型手术,需要同步升级数据治理体系和业务协同机制。同时,大模型训练数据常为静态,但企业在反欺诈等场景中,急需依据动态、实时数据生成风险预测,传统数据处理流程难以满足这一诉求。在医疗、法律、金融等强监管行业,模型输出的错误或虚构信息,极易引发严重合规问题,金融机构若依据错误模型输出进行信贷审批,可能面临巨额罚款甚至法律诉讼。部署大模型时,可能过度聚焦性能优化,忽略用户体验与界面设计。
2025-05-30 18:03:32
470
原创 什么是大模型?一文读懂大模型的基本概念
引申到模型层面,涌现能力指的是当模型的训练数据突破一定规模,模型突然涌现出之前小模型所没有的、意料之外的、能够综合分析和解决更深层次问题的复杂能力和特性,展现出类似人类的思维和智能。在探索期,以 Transformer 为代表的全新神经网络架构,奠定了大模型的算法架构基础,使大模型技术的性能得到了显著提升。ChatGPT 对大模型的解释更为通俗易懂,也更体现出类似人类的归纳和思考能力:大模型本质上是一个使用海量数据训练而成的深度神经网络模型,其巨大的数据和参数规模,实现了智能的涌现,展现出类似人类的智能。
2025-05-30 17:38:27
602
原创 国内企业到底需要什么样的大模型?
摘要: 自ChatGPT爆火以来,中国大模型领域快速跟进,已涌现180多个模型,国内外头部模型在中文通用能力上的差距从2023年的30%缩小至2024年的1.29%。国外OpenAI、Anthropic和谷歌持续领跑,推出多模态、高效响应的最新模型;国内互联网大厂(如百度、腾讯、阿里)纷纷布局细分场景应用,推动AI与行业深度结合。未来AI将重塑职场生态,掌握大模型工具或成基础技能,企业加速“AI替代”以实现降本增效。文末附独家大模型学习资料包。
2025-05-30 17:34:43
636
原创 【大模型科普】大模型:人工智能的前沿技术
在数字化浪潮汹涌澎湃、日新月异的当今时代,大模型犹如一颗璀璨夺目的新星,在科技的天幕上强势崛起,迅速吸引了全球范围内的广泛关注与热烈讨论,成为科技领域一颗耀眼的焦点。从最初的理论探索与初步尝试,到如今在各行各业中的广泛渗透与深度应用,大模型正以令人瞠目结舌的速度和不可阻挡的态势,重塑着我们的生活方式、工作模式乃至整个社会的运行逻辑。大模型不仅是人工智能技术发展历程中的一个重大突破和里程碑式的成就,更是推动全球经济持续增长、提升社会治理效能、加速科技创新步伐的关键力量。
2025-05-29 09:36:58
1626
原创 AI 是一个广博的领域,涵盖许多不同的学科
本文是一篇人工智能科普指南,主要分为两部分内容:科普入门和细分领域。 在科普入门部分,文章首先介绍了人工智能的定义——通过计算机程序模拟人类智能的技术,涵盖机器人、语音识别、图像识别等多个领域。随后区分了弱AI(专注于特定任务,如Siri、自动驾驶)和强AI(理论上的类人智能)。接着解释了人工智能、深度学习与机器学习的关系,指出深度学习是机器学习的一个子领域,使用神经网络自动提取特征。 文章还列举了人工智能的主要应用场景,包括语音识别、计算机视觉、客户服务等,并梳理了AI的发展历史和产业架构。最后提及了人工
2025-05-28 18:13:19
862
原创 人工智能在商业中的应用
人工智能正深刻改变商业与生活,在医疗、电商、人力资源等领域广泛应用。医疗方面辅助诊断、机器人手术等提升效率;电商通过推荐系统、智能客服优化体验。生活场景如地图导航、语音助手等也广泛渗透。AI人才需求激增但供给不足,相关岗位如机器学习工程师、数据科学家年薪丰厚,需掌握编程、算法等技能。随着技术发展,AI行业将持续扩张,转型从业者薪资普遍增长60-70%,未来发展潜力巨大。
2025-05-28 18:10:49
825
原创 人工智能 (AI) 是什么?
再到上世纪 40 年代和 50 年代,大量来自于不同领域的科学家发起了关于构建类脑的可能性的讨论,掀起了有关人工智能的研究热潮,并且于 1956 年在新罕布尔州汉诺威市达特茅斯学院的一次学术会议上,明确成立了人工智能这一学科。这个方法存在一定的问题,因为原则意义上 (完全严格按照思维规则)的解决问题的方式,和实际解决问题的方式是有很大差异的,往往需要依赖于语义的细微差别。现阶段的人工智能,其作用和过去千百年中所发明的所有工具和技术一样,都是为了简化人类的工作,帮助我们做出更好的决定。
2025-05-28 18:05:45
1231
原创 AI,即人工智能(Artificial Intelligence)
AI(人工智能)概述 AI是通过计算机模拟人类智能的技术,旨在执行学习、推理、语言处理等任务。其发展始于1956年,经历了从规则系统到深度学习的演变。核心包括机器学习、自然语言处理、计算机视觉等,广泛应用于医疗、金融、自动驾驶、智能家居等领域。AI正推动各行业智能化,未来将向泛在智能和人机协作方向发展。
2025-05-28 18:04:37
1578
原创 预见2025:《2025年中国大模型行业全景图谱》
讯飞星火在智能办公上优势明显,2024年4月,公司推出了业界性能最优的130亿参数的大模型,在效果损失仅3%以内的情况下,输出效率、语义理解准确率等均得到提升,在讯飞星火大模型的飞速发展下,讯飞自有的硬件产品也受到消费市场的关注,搭载讯飞星火的讯飞智能办公本、讯飞听见、讯飞智能录音笔以及讯飞AI学习机等销量不断攀升;从未来趋势来看,具备强大预测能力的预测大模型、强大决策能力的决策大模型和能够自主学习、实时交互的具身智能大模型最有可能成为继自然语言大模型和多模态大模型后的下一个大模型行业风口。
2025-05-28 15:36:14
1312
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅