自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(670)
  • 收藏
  • 关注

原创 盘点国产十大最实用的AI大模型!(深度解析)

在这个由数据驱动的时代,人工智能(AI)已经成为推动世界进步的超级引擎。从日常的语音助手到复杂的医疗诊断,AI的应用无处不在,它的影响力正以前所未有的速度扩展。今天我们来聊聊那些国产的AI大模型,深度盘点一下国产最实用的十大AI大模型百度文心大模型包含NLP(自然语言处理)、CV(计算机视觉)和跨模态大模型。在自然语言处理领域,文心ERNIE系列模型具有强大的小样本学习能力和基本推理能力。在计算机视觉领域,百度提出了基于视觉掩码技术的文心VIMER-CAE,具有强大的图像分割能力。

2024-12-10 14:08:23 7748

原创 我们为什么要用本地大模型?——坤叔的本地大模型入门指南

大模型,在2023年主要称之为大型语言模型(Large Language Models),是一种基于人工智能和机器学习技术构建的先进模型,旨在理解和生成自然语言文本。这些模型通过分析和学习海量的文本数据,掌握语言的结构、语法、语义和上下文等复杂特性,从而能够执行各种语言相关的任务。LLM的能力包括但不限于文本生成、问答、文本摘要、翻译、情感分析等。我们最熟悉的大模型,莫过于CHATGPT。但我们最常用的大模型,未必是CHATGPT。

2024-05-23 10:52:45 9551

原创 值得收藏!十大中国流行的AI大模型企业及平台汇总

在当今这个信息化迅速发展的时代,人工智能技术已经成为推动社会进步的重要力量。特别是在我国,AI大模型技术的发展速度令人瞩目,各种平台纷纷涌现,表现出强大的技术实力和广泛的应用前景。

2024-05-16 13:37:12 9251

原创 一文读懂 LLM 训练:从预训练到微调【大模型行业应用入门系列】

LLM Training 是指大型语言模型(LLM)的训练过程。作为一种采用超大规模数据进行预训练的深度学习模型,LLM 训练目标是培养出一个能够理解和生成自然语言文本的模型。在这个过程中,LLM 通过处理海量文本数据来学习语言的规律、语义和上下文关系等训练方式,可以获得丰富的语言知识和智能,从而使得能够自动理解和生成人类语言。通常而言,这种训练过程通常需要大量的计算资源和时间,以便模型能够充分地学习语言的各个方面。

2024-04-16 15:39:20 7138

原创 全民AI时代:手把手教你用Ollama & AnythingLLM搭建AI知识库,无需编程,跟着做就行!

本地运行大模型耗资源,需要选择较小的模型作为基础模型。在终端中运行时可能会出现 CUDA 错误,表示显存不足,导致提供的端口失效。中文支持不够完善。3. 文中提到的技术软件工具有:Ollama、Chatbox、Open WebUI、向量数据库、嵌入模型、本地模型 Gemma、AnythingLLM。

2024-04-10 11:10:50 9318

原创 一文吃透多模态:多模态大模型的探索 五大研究方向与十大应用领域!

理想中的多模态大模型具备跨模态的泛化理解和生成能力,其更符合人类感知世界的方式,其或能进一步打开AI能力的上限。产业界也在积极探索多模态大模型可行的技术路径,在多模态领域“复刻”大语言模型的成功。但目前多模态大模型的技术栈也尚未收敛,多模态学习和跨模态对齐仍为技术难点,未来产业发展仍有无限可能。在大模型兴起之后,产业也试图在图像、视频、音频等更多模态领域复现“Scaling Law”的成功,继续实现大模型的“智能涌现”。• 薪资上浮10%-20%,覆盖更多高薪岗位,这是一个高需求、高待遇的热门方向和领域;

2024-04-07 18:30:11 7733

原创 2025年推理模型综合测评报告|附35页PDF文件下载

在大模型竞争转向垂直赛道的当下,推理模型至关重要。该报告对各类推理模型进行综合测评,虽不知具体测评维度,但必然涵盖模型性能、效率、准确性等关键指标。通过对不同模型的横向对比,清晰展现各推理模型的优势与不足。这能帮助企业和研究人员在模型选型时,依据自身需求做出更优决策。对于模型研发者,也可参考报告结果,明确改进方向,从而推动推理模型技术的发展,促进 AI 在各行业更高效、精准地落地应用 。

2025-06-13 14:54:03 145

原创 大模型扫盲系列——用9 张图搞懂大模型核心技术

在 AI 工程领域,RAG(检索增强生成)、LLM(大语言模型)和 AI Agent(智能体)无疑是当下最热门的技术方向。今天为大家整理了 9 张精心设计的可视化图表,用通俗语言拆解核心概念、对比技术差异、展示应用场景,无论是 AI 从业者还是技术爱好者都能快速抓住重点。

2025-06-13 14:47:39 435

原创 2025年大模型就业:核心技术趋势、技能要求与职业发展全景解析

随着大语言模型(Large Language Models, LLMs)的技术飞速迭代,人工智能领域正经历从通用对话工具向高度智能化、任务导向的智能体(Agent)系统的深刻转型。到2025年4月,企业对掌握LLM相关技术的专业人才需求持续高涨,核心能力聚焦于检索增强生成(RAG)、智能体任务自动化、模型对齐优化以及多模态融合。本文将全面剖析2025年大模型就业市场的技术演进路径、核心技能要求、行业应用场景、推荐实践项目以及职业发展建议,旨在为从业者提供详尽的职业规划指南,帮助其精准把握行业机遇。

2025-06-12 13:49:13 893

原创 大语言模型(LLM)是什么?大语言模型(LLM)综述,看这一篇就够了!

前段时间无意中刷到了Andrej Karpathy大神的视频(Deep Dive into LLMs like ChatGPT)。这是我看过的最好LLM讲解视频,我最欣赏的一点就是Andrej大神在讲解抽象概念时,会给出生动具体的例子,即便是像我这样对编程一窍不通的小白,也能看懂其中的关键概念。视频全长三个半小时,强烈建议对LLM有兴趣的同学观看。

2025-06-12 13:45:56 844

原创 大语言模型是什么?一文带你了解大语言模型(LLM)

近年来,OpenAI 推出的 ChatGPT 等大语言模型作为深度神经网络模型的代表,为自然语言处理(natural language processing,NLP)领域带来了革命性的变化。

2025-06-11 14:22:52 964

原创 清华大学:DeepSeek+DeepResearch应用报告|附59页文件下载

DeepSeek+DeepResearch应用报告一共有59页PPT,主要的内容有Deep Research的内容概述、参与式观察一个团队的大模型应用与内化和推理大模型的使用心得三大部分。

2025-06-11 14:13:21 988

原创 复旦大学:大模型能力来源与边界报告(附免费下载)

复旦大学张奇团队在《大语言模型能力来源与边界》研究中揭示了多项重要发现。该团队首次提出语言核心区理论,实验显示仅修改LLaMA2-13B核心区1个维度即导致模型混乱(PPL从5.877飙升至3.76亿),而非核心区修改影响轻微。

2025-06-10 14:18:48 477

原创 Agent综述论文火了,10大技术路径一文看尽

智东西5月28日报道,近日,来自美国康奈尔大学等高校研究团队的一篇智能体研究综述论文爆火出圈,相关推文在社交媒体平台X上收获超70万阅读量,过万收藏。这篇长达32页的综述,深度分析了Agent(智能体)研究中最容易混淆的一组核心概念——AI Agents和Agentic AI,并讨论了智能

2025-06-10 14:13:42 1120

原创 【科普】AI、AGI、AIGC、AI Agent、RAG:深度解析定义、特点与应用

在科技飞速发展的今天,人工智能(AI)已然成为人们茶余饭后热议的焦点。随之而来,AGI、AIGC、AI Agent、RAG 等术语也频繁出现,让人既好奇又困惑。这些概念究竟是什么意思?它们各自有何特点和应用场景?接下来,就让我们深入探究一番。

2025-06-09 16:21:05 1079

原创 深入解析:一文讲清楚AI Agent 的八大核心概念!

所谓智能体,指的是能独立采取行动以实现特定目标的 AI 实体。想象你有一个贴心的小跟班,你让他干啥他就干啥。比如你让他查明天的天气,他立马就给你整得明明白白。

2025-06-09 14:41:49 1271

原创 一文读懂 AI Agents 与 Agentic AI:别再傻傻分不清了!

随着AI系统功能日益强大并逐渐融入日常工作流程,一个新的区别正在重塑我们设计、构建和评估这些系统的方式:AI Agents 与 Agentic AI。虽然这两个术语常被混用,但它们指的是不同的系统架构、功能和协调模型。

2025-06-07 14:06:09 747

原创 非技术出身,怎么转AI?这9个爆火高薪岗位比你想象中更简单!赶紧收藏!

“非技术出身,还能转型AI吗?”最近很多想要转型AI的职场人,都有类似的问题,大多数人一听“AI”,脑子里就是代码、模型、算法……于是下意识想放弃了。

2025-06-07 13:57:06 4558

原创 搞不懂Transformer?那是你还不了解输入嵌入与位置编码!

Transformer 的输入嵌入和位置编码常常被一带而过,然而它们对于像 GPT 这样的模型理解和处理语言确是至关重要的。

2025-06-06 14:05:07 1022

原创 一文洞悉:大语言模型在电子商务领域的应用与实践

在数字化浪潮的推动下,电子商务行业正经历着前所未有的变革。随着人工智能技术的飞速发展,尤其是大语言模型的突破性进展,电子商务领域迎来了新的增长动力和创新机遇。 本文将分析大语言模型技术如何重塑电商生态,讨论大语言模型在电子商务领域的最新实践,揭示其在智能营销、直播赋能、供应链优化和客户管理等关键领域的重要应用。

2025-06-06 13:52:53 750

原创 一文搞明白!AI 产品经理怎样绘制 AI 产品架构图?

在生成式AI浪潮席卷各行业的当下,越来越多企业都在思索:大模型究竟能为企业经营创造怎样的实质性价值?而AI产品经理,正处于这场产业升级的“核心枢纽”——不仅要懂模型、懂业务,更需凭借一张“看得懂、讲得通、落得下”的架构图,将技术蓝图转化为企业经营的实际解决方案。

2025-06-05 14:54:59 719

原创 一文深析:Agent 与 Workflow 架构设计的差异解析

在 AI 大模型技术飞速发展的当今,我们见证了 AI 应用架构模式走向多样化。 尤其是 AI Agent 智能体与 AI Workflow 工作流这两种迥异的理念,正重塑着我们对 AI 应用的认知。 这两种模式恰似一枚硬币的正反两面:一面秉持创新与灵活的追求,另一面则坚守稳定与效率的导向。 下文将深入剖析这两种架构模式的核心差异、应用特性及其未来发展趋势,以期助力大家更好地掌握和运用这些技术。

2025-06-05 14:48:35 1026

原创 2025年大模型翻译技术及产业应用蓝皮书|附32页PDF文件下载

本文主要探讨了大模型翻译技术的发展及其在科研、企业全球化、国际传播和专业翻译等领域的应用。文章指出,大模型翻译技术通过深度语义理解、交互式翻译和外部知识增强等能力,显著提升了翻译的准确性和流畅度。文中引用了多项调研数据,如86.67%的受访者认可“大模型+译后编辑”将成为未来主要翻译工作模式,以及63.46%的受访者表示其所在单位计划或已经应用大模型。文章还提到,新一代智能翻译平台具备多模型协同、知识增强体系和场景化解决方案等核心特征,能够提供更精准、高效的翻译服务。此外,大模型翻译技术在科研创新、企业全球

2025-06-04 14:34:37 548

原创 大模型时代,你还不懂Transformer?(图解Transformer,一文搞懂)

Transformer模型是由Vaswani等人在2017年发表的论文 《Attention is All You Need》 中提出的。该模型的核心创新在于自注意力机制(Self-Attention),它通过对全局上下文依赖关系进行并行计算,有效解决了传统RNN和CNN在处理长序列时存在的效率与长程依赖问题。自注意力机制能够让模型动态地关注输入序列中的不同位置,同时结合多头注意力(Multi-Head Attention)来增强语义捕捉能力,还通过位置编码(Positional Encoding)将序列顺

2025-06-04 14:10:33 1198

原创 一文讲清:AI大模型轻量化的5个主流方法,看完你就懂了!

在机器学习中,我们需要用数值的方式表达数据,尤其是在神经网络中,数据和模型参数都表示成张量的形式,而神经网络的计算过程就是这些张量相互作用的过程。

2025-06-03 15:18:36 652

原创 深度解析:一文详解RAG 技术!从基础原理到优化实战

在人工智能快速发展的时代,大语言模型(LLM)展现出强大的自然语言处理能力,但也存在知识更新滞后、缺乏个性化等问题。检索增强生成(Retrieval Augmented Generation,简称 RAG)技术应运而生,为解决这些痛点提供了新的思路。它打破了传统 LLM 仅依赖预训练知识的局限,实现了动态知识注入与个性化内容生成,在智能客服、文档问答、知识图谱等领域有着广泛的应用前景。下面,我们将从基础原理到优化实战,全面解析这项技术。

2025-06-03 15:14:08 923

原创 2025人工智能行业人才供需趋势报告(免费下载)

在当今数字化浪潮席卷全球的背景下,人工智能(AI)行业宛如一颗璀璨明珠,闪耀着无限光芒,正以前所未有的速度重塑着世界产业格局。从智能家居到自动驾驶,从医疗诊断到金融风控,AI技术正深度融入各个领域,催生出一系列新业态、新模式,成为推动社会进步与经济发展的关键力量。

2025-06-02 09:30:00 825

原创 RAG是什么?一文讲清楚RAG原理与典型系统架构!

RAG,全称为Retrieval Augmented Generation,即检索增强生成。它是一种将外部知识检索与大型语言模型的生成能力相结合的人工智能技术框架。其核心思想是在大型语言模型(LLM)处理用户查询并生成回答之前,首先从一个或多个外部知识源(如数据库、文档集合、API等)中检索与查询相关的、最新的信息片段。然后,这些检索到的信息将作为额外的上下文(Context)注入到LLM的提示(Prompt)中,从而引导LLM生成更准确、更相关、更具事实性的内容。

2025-06-02 07:30:00 1312

原创 AI大模型知识点:一文讲清楚MCP、RAG、Agent概念和关系

RAG 是一种融合信息检索与文本生成的人工智能技术框架,它打破传统大语言模型仅依赖预训练参数生成内容的局限,通过动态检索外部知识库中的相关信息,将这些精准数据作为生成依据,从而输出更具针对性、准确性和可靠性的文本回应。

2025-05-31 09:00:00 589

原创 普通人如何成功转型AI产品经理?大厂AI产品经理揭秘3个关键

在AI技术日新月异的今天,产品经理的角色正在经历一场革命性的转变。你是否也在思考如何从传统岗位转型为AI产品经理?AI时代的产品经理该如何拥抱AI,实现自我提升与产品创新?

2025-05-31 07:00:00 760

原创 【新手必看】大模型100个基础知识点,你知道多少?

从智能对话到图像生成,从文本创作到数据分析,大模型的应用场景无处不在。然而,对于初入大模型领域的小白来说,面对众多的专业术语和复杂的概念,可能会感到无从下手。别担心,本文为你整理了大模型基础知识点近100个名词解释,助你轻松开启大模型的学习之旅!

2025-05-30 12:13:23 1022

原创 DeepSeek-R1-0528版本:全球推理之王,新巅峰背后的硬核进化

2025年5月28日,DeepSeek 团队低调开源了 DeepSeek-R1-0528。虽被官方称为“小版本试升级”,但实测表现却堪称“推理能力大爆炸”——在数学、编程等核心推理任务中,它一举将开源模型推至接近 GPT-o3 的顶级水平。作为长期追踪大模型技术演进的研究者,我认为此次更新揭示了一条以深度后训练优化撬动基座模型潜能的全新路径。下面,我将从架构设计、训练策略、能力边界及产业影响等维度,为你层层拆解 R1-0528 的硬核技术原理。

2025-05-30 12:04:00 1153

原创 AI智能体|扣子(Coze)搭建工作流入门教程,看完这篇你也可以!

简单来说,就是把大模型,插件,工具等连接在一起让它们帮你自动完成多个步骤的任务。

2025-05-29 14:42:58 1197

原创 终于把AI大模型三种模式agent、copilot、embedding弄清楚了

这张「人类与 AI 协同的三种模式」图,是我想搞清楚这三个概念热词的关系,自己花了些时间找资料总结后,让 Claude 3.7 Sonnet 生成出来的。之所以做这个对比图,是觉得在当下很有价值,有助于自己更好地理解和应用 AI。也挺适合大家去了解学习的,今天就在这里分享一下。

2025-05-29 14:38:55 862

原创 Dify+数据库+Echarts终极避坑指南!从自然语言到炫酷图表,一篇文章解决你90%的难题!

Dify+数据库+Echarts终极避坑指南!从自然语言到炫酷图表,一篇文章解决你90%的难题!

2025-05-28 15:53:41 913

原创 大模型入门:一文讲清楚微调(Fine-Tuning)

微调(Fine-tuning)是一种在自然语言处理(NLP)中使用的技术,用于将预训练的语言模型适应于特定任务或领域。Fine-tuning的基本思想是采用已经在大量文本上进行训练的预训练语言模型,然后在小规模的任务特定文本上继续训练它。

2025-05-28 15:27:46 664

原创 一文了解,什么是大模型,智能体、AIGC,关系及应用

人工智能技术飞速发展,各种新概念层出不穷。AIGC、大模型、Agent等术语频繁出现在新闻和社交媒体中,但很多人对这些概念感到困惑,不清楚它们之间的区别和联系。本文将用简单易懂的语言,为大家解释这些概念,即使是完全的"小白"也能轻松理解。

2025-05-27 14:09:48 1233

原创 清华大学.智灵动力-《DeepSeek行业应用实践报告》附PPT下载方法

今天分享是由清华大学.智灵动力:《DeepSeek行业应用实践报告》,主要介绍了DeepSeek模型的概述、优势、使用技巧、与其他模型的对比,以及在多个行业中的应用和未来发展趋势。为理解DeepSeek模型的应用和未来发展提供了深入的分析,并通过多个行业的具体案例,展示了DeepSeek在提升工作效率和创造价值方面的巨大潜力。

2025-05-27 14:00:50 436

原创 算力深度报告:算力研究框架——产业链全梳理(PDF文件下载)

今天分享的是人工智能AI研究报告:《算力深度报告一:算力研究框架-产业链全梳理》。

2025-05-26 13:55:38 973

原创 一文说清楚什么是基础模型(Base LLM)、指令微调模型(Instruction-Tuned LLM)

在自然语言处理(NLP)领域,大语言模型(LLM)已成为推动人工智能进步的关键技术。随着模型规模的扩大和训练数据的增长,LLM 在各种文本生成和理解任务中展现了卓越的能力。在做开发的过程中,可能会接触到两种不同的模型类别,这两个类别是 Base LLM(基础大语言模型) 和 Instruction-Tuned LLM(指令微调大语言模型)。

2025-05-26 13:47:33 1139

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除