自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(820)
  • 收藏
  • 关注

原创 程序员转行:AI大模型工程师,没毛病!非常详细收藏我这一篇就够了

AI大模型工程师:高薪热门的科技前沿职业 AI大模型工程师成为当下热门职业,薪资优势显著——AI运营平均月薪约1.8万,AI工程师约3.7万,大模型算法工程师约4万。行业需求激增,但人才供给不足,腾讯、阿里等大厂正大量招募相关岗位。大模型技术应用广泛,涵盖自然语言处理、计算机视觉等领域,职业发展路径清晰,从研究员到架构师均有广阔空间。 学习建议: 初阶应用(10天):掌握Prompt工程、业务架构及基础开发; 高阶应用(30天):学习知识库构建、向量检索等实战技能。 权威数据显示,国内AI市场年增长超30%

2025-08-01 22:26:28 1478

原创 AI产品经理风口已来!普通人转行也能拿85万年薪,这机会你抓不抓?

近期有很多社招的小伙伴都在看转行的机会,同时马上要到了秋招的季节,校招生们都在积极选择第一份工作。所有人想要进入一个有前景、高薪高潜力的黄金赛道。2025年如果大家看新机会,重点给大家推荐AI领域的岗位。先看一组数据:

2025-08-01 22:24:11 588

原创 Dify 技术文档工程实践:如何构建面向 AI 时代的知识系统?

如果文档是产品的一部分,你希望获得怎样的阅读体验?文档又应该以何种姿态面向新读者——即无所不在的 LLM?

2025-08-01 22:21:25 581

原创 GraphRAG变种进化论:HippoRAG 2.0来了!

HippoRAG2通过改进知识图谱结构显著提升RAG系统性能。其核心创新包括:1)整合概念节点与上下文段落节点,模拟人脑记忆机制;2)引入三元组直接匹配机制,提升语义对齐精度;3)新增LLM过滤层优化检索质量。实验表明,在NQ、HotpotQA等7个数据集上,该方法在事实记忆、多跳推理等任务中优于传统RAG方案。当前大模型人才缺口达47万,掌握RAG等核心技术可显著提升职业竞争力。学习路径建议分四阶段:从提示工程到RAG开发,再到模型微调及商业部署,完整资料可通过优快云免费获取。

2025-08-01 22:19:30 461

原创 从DeepSeek到K2:大模型架构如何进化出惊人效果?

开源大模型架构演进速览(2025) 2025年主流开源大语言模型(LLM)在架构设计上呈现多样化创新: DeepSeek-V3/R1:采用多头潜在注意力(MLA)替代分组查询注意力(GQA),结合混合专家(MoE)架构,6710亿总参数仅激活370亿推理,显著提升效率。 OLMo2:坚持传统多头注意力(MHA),引入Post-Norm和QK-Norm设计以增强训练稳定性,注重透明性(公开训练数据与代码)。 Gemma3:优化滑动窗口注意力,调整全局/局部注意力比例为5:1,减少KV缓存内存占用,同时结合Pr

2025-08-01 22:15:07 579

原创 智能体应用进阶:上下文工程与LangChain的强强联合

摘要: 本文探讨了基于LangChain的AI智能体如何通过上下文工程优化性能。上下文工程包含四大组件:行为准则(明确AI角色)、信息接入(连接数据库/API)、会话记忆(存储历史交互)和工具集成(调用计算/搜索功能)。文章详细介绍了利用LangGraph实现上下文管理的技术,包括: 状态图设计:通过节点和边构建工作流,控制上下文传递路径。 记忆管理:短期记忆(暂存区)和长期记忆(跨会话存储)的结合使用。 RAG系统:检索增强生成技术从文档中筛选关键信息,减少大模型token消耗。 多智能体协作:通过子智能

2025-08-01 22:11:58 565

原创 AI Agent是什么?AI Agent的基础架构、AI Agent在各行业的变革

AI Agent:人工智能代理的架构与应用展望 AI Agent是能够自主执行任务、感知环境并做出决策的智能系统,其核心架构包括三个关键层次: 感知层:通过传感器、计算机视觉等技术收集环境数据(如自动驾驶中的激光雷达); 数据处理层:对原始数据进行清洗、存储与分析(如推荐系统的用户行为处理); 决策层:基于机器学习、强化学习等算法生成行动策略(如医疗诊断中的推理模型)。 随着技术进步,到2025年AI Agent将进一步渗透到生产生活,推动自动化与智能化变革,重塑人机交互方式。

2025-07-31 11:00:00 1451

原创 用 python 开发一个可调用工具的 AI Agent,实现电脑配置专业评价

本文介绍了如何使用Python构建一个能够分析电脑配置的AI Agent。项目通过psutil和platform库获取系统硬件信息,包括CPU、内存、磁盘和操作系统等关键配置数据。文章详细展示了项目目录结构,包含主程序文件main.py、工具函数文件tools.py和环境配置文件.env。核心功能通过read_pc_info()函数实现,该函数采集系统信息并格式化为可读文本。这个AI Agent项目为开发者提供了一个实用案例,展示了如何利用Python库实现硬件诊断功能的基础框架。

2025-07-31 10:45:00 741

原创 大模型LLM | 一文彻底搞懂大模型Agent(智能体):Agent、Agent + RAG

摘要: 电影《钢铁侠》中的智能助手J.A.R.V.I.S.展现了未来AI Agent的雏形。基于大语言模型(LLM)的AI Agent正从科幻走向现实,其核心由规划、记忆、工具和行动四大模块构成,能自主拆解任务、存储信息、调用工具并执行决策。结合检索增强生成(RAG)技术,Agent可扩展知识库,增强专业领域处理能力。例如财报分析Agent通过整合LLM、RAG和自动化工具,实现数据收集、深度分析与报告生成,展现了AI在复杂任务中的应用潜力。

2025-07-30 11:32:42 1017

原创 解析大语言模型LLM的幻觉问题:消除错觉、提高认知

摘要:本文探讨了大语言模型(LLM)中的幻觉问题,即模型生成看似合理但实际错误或无关内容的现象。文章分析了幻觉产生的主要原因,包括预训练数据不完整、知识断层以及模型优化过程中的技术缺陷,并讨论了这种现象在高精度场景(如医疗、金融)中的危害性。最后,作者提出了研究幻觉问题对提高LLM可靠性的重要意义,为后续解决方案的探讨奠定基础。

2025-07-30 11:31:06 558

原创 [源力觉醒 创作者计划]_文心大模型4.5开源部署指南:从技术架构到实战落地

百度文心大模型4.5系列开源,提供0.3B到424B的完整模型矩阵,支持从轻量化到多模态的全场景AI应用。其技术亮点包括异构MoE架构、高效训练推理方案,以及单卡部署仅需2.1GB显存的轻量化优势。本文提供从硬件配置到模型优化的全流程部署指南,帮助开发者快速落地应用,推动国产AI生态建设。文章包含开源价值解析、技术架构详解、实战部署教程及常见问题解决方案。

2025-07-29 14:00:00 620

原创 大模型LLM | Qwen2.5 全链路模型体验、下载、推理、微调、部署实战!(非常详细)看这一篇就够了!

通义千问团队发布Qwen2.5系列开源大模型,包含基础版、编程专用版和数学专用版,提供0.5B至72B多种规模选择。该系列在18T tokens数据上预训练,知识量(MMLU 85+)、编程(HumanEval 85+)和数学能力(MATH 80+)显著提升。支持128K长文本、8K生成及29种语言,指令遵循和结构化数据处理能力增强。专业版本Qwen2.5-Coder和Qwen2.5-Math分别针对编程和数学任务优化。基准测试显示,Qwen2.5-72B性能媲美主流开源大模型,小型模型如3B版本也展现出高

2025-07-29 13:30:00 1353

原创 解锁DeepSeek-R1大模型微调:从训练到部署,打造定制化AI会话系统

本文介绍了大模型微调技术的概念、分类方法及常见框架,并以DeepSeek R1大模型为例演示完整微调流程。文章首先分析了通用大模型在特定行业应用中存在的"AI幻觉"问题,提出通过微调技术实现领域定制化的重要性。在技术层面,详细阐述了按学习范式(有监督/无监督/半监督)和参数更新范围(全量/部分)分类的微调方法,重点介绍了结合SFT与LoRA的高效微调策略。实践部分以LLaMA-Factory框架为基础,展示了从环境配置、模型下载、训练部署到集成AI会话系统的完整流程。该内容为需要行业定制

2025-07-28 14:28:54 597

原创 10分钟上手DeepSeek开发:SpringBoot + Vue2快速构建AI对话系统

随着人工智能技术的快速发展,大语言模型在企业和个人应用中扮演着越来越重要的角色。作为国产大语言模型的新秀,DeepSeek以其出色的中文理解能力和开放的API接口,为开发者提供了构建AI应用的新选择。在本文中,我将带领大家使用SpringBoot和Vue技术栈,快速搭建一个具有实时对话功能的AI助手系统。这个系统不仅支持流式响应,还具备优雅的界面展示和Markdown格式的内容渲染,让AI回答更加清晰易读。

2025-07-28 14:25:20 904

原创 【多模态大模型】Qwen2-VL基本原理和推理部署实战

Qwen2-VL是阿里通义千问实验室最新开源的视觉语言模型,在多项评测中表现与GPT-4o相当。文章首先回顾了Qwen-VL的核心技术:位置感知视觉语言适配器和三阶段训练方法。随后详细解析了Qwen2-VL的升级特性,包括统一视觉处理、原生动态分辨率支持和多模态旋转位置编码。在实现部分,重点剖析了单图推理流程:从视觉预处理(尺寸调整、patch划分)到视觉编码器前向计算(3D卷积、旋转位置编码、Transformer处理)。最后介绍了如何通过vLLM框架部署Qwen2-VL模型。该文为理解Qwen2-VL架

2025-07-26 11:45:00 911

原创 DeepSeek R1 本地安装部署(保姆级教程)

摘要: DeepSeek R1是一款开源AI模型,性能媲美商业模型,支持本地离线部署,保障数据隐私且免费使用。本文提供Mac、Windows、Linux系统的本地部署教程,适合入门者。DeepSeek基于Qwen 7B架构,提供1.5B到70B参数版本,硬件要求灵活,甚至支持CPU运行。本地部署优势包括隐私保护、零成本和完全自主控制。文章详细介绍了最低配置方案,确保用户轻松上手,避免高硬件需求带来的门槛。通过简单步骤即可实现AI模型的本地化应用。

2025-07-26 11:15:00 780

原创 【GitHub周榜】WrenAI:开源SQL AI代理,让Text-to-SQL轻松实现,开启自然语言与数据交互新时代

WrenAI是一款由Canner团队开发的开源AI助手,旨在通过自然语言交互简化数据查询与分析流程。其主要功能包括:多语言自然对话支持、智能数据探索推荐、语义索引系统、上下文SQL生成、无代码数据分析、AI驱动可视化以及数据导出集成。采用Python实现,结合NLP技术将文本查询转换为SQL语句,并通过FastAPI后端与TypeScript/Next.js前端构建完整系统。WrenAI包含三大核心组件:交互界面Wren UI、基于向量数据库的AI服务以及语义引擎Wren Engine,采用RAG架构确保数

2025-07-25 11:04:53 736

原创 AI大模型探索之路-基础篇5:GLM-4解锁国产大模型的全能智慧与创新应用

摘要 本文全面对比了国产大模型GLM-4与GPT-4的功能和性能。GLM-4作为新一代多模态大模型,具备128K长文本处理能力,支持图文互译、自动代码执行等功能,综合性能接近GPT-4的95%,中文能力甚至超越GPT-4。文章详细分析了GLM-4的ALL Tools功能,包括文生图、代码解释器等自动化工具调用能力,并通过基准测试数据展示了其在英文基础能力、指令跟随、对齐能力等方面的表现。同时介绍了GLM-4开放平台的使用方法,包括API测试和应用开发。整体而言,GLM-4展现了国产大模型的技术实力,为AI应

2025-07-24 10:25:19 352

原创 大模型之Spring AI实战系列(四):Spring Boot + OpenAI 使用OpenAI Embedding实现文本向量化

在当今人工智能和自然语言处理领域,文本嵌入(Embedding)技术如同基石般至关重要。它巧妙地将文本转化为固定维度的数值向量,使得机器能够跨越语言的障碍,深入理解语义,并精准地进行相似度计算、聚类分析以及语义搜索等复杂任务。本篇文章作为《Spring AI 实战》专栏的第四篇,将带领大家深入探索 spring-ai-openai-embedding 示例项目。我们将详细解读如何借助 Spring AI 无缝集成 OpenAI 的 Embedding API,实现文本的高效向量化处理。不仅如此,我们还将

2025-07-24 10:23:18 1045

原创 GraphRAG 全流程实战指南:从入门到业务落地

GraphRAG是微软开源的新型检索增强生成系统,通过构建文档实体关系图谱实现结构化理解和全局知识洞察。相比传统RAG,它具备知识关系建模、社区聚类分析和高度可解释性等优势。安装使用仅需几行命令:pip install graphrag初始化项目后,放入待处理文档并运行索引构建命令即可。支持全局结构化查询和局部语义搜索两种方式,适用于长文档问答、知识图谱构建等场景。输出结果包含完整的关系图谱和社区摘要,便于回溯验证,是RAG技术的重要升级。

2025-07-23 11:51:09 855

原创 GraphRAG落地难,微软工业级RAG+Agent实施方案

摘要 该研究分析了当前RAG系统在处理复杂工业数据时面临的三大核心问题:知识源多样性复杂、领域专业性不足及"一刀切"解决方案的局限性。针对这些问题,研究提出了PIKE-RAG框架,从知识库构建、任务分类和系统开发三个维度进行解构创新。框架采用多层异构图组织知识库(信息资源层、语料库层、蒸馏知识层),并将任务分为事实性、可链接推理、预测性和创意性四类问题。系统开发采用分阶段演进策略(L0-L4),包含文档解析、知识提取、分块增强等7个关键模块。特别设计了基于滑动窗口的分块增强算法,通过迭代

2025-07-23 11:34:17 943

原创 【2025版】最新大模型LLM学习路线图(非常详细)全面掌握学习路径,收藏我这一篇就够了

2023年是AI大模型爆发元年,以ChatGPT为代表的AI技术正深刻改变社会。文章指出,AI大模型已从问答对话扩展到编程辅助、图像创作等多元领域,成为互联网从业者必备技能。大模型工程师岗位需求激增,平均薪资高达3-4万元,掌握相关技术可拓展职业发展空间。大模型按功能可分为NLP、CV、科学计算和多模态四大类,应用场景广泛。文章还提供了2024年大模型学习路线图,分为7个阶段:从系统设计到提示词工程,再到微调开发和多模态应用,帮助从业者系统掌握大模型技术。

2025-07-22 14:42:10 741

原创 【2025首发】AI大模型学习路线:适合新手和大学生的详细指南与技巧!

如何入门人工智能?本文提供了一份详细的学习路线。首先需要掌握Python编程语言,包括基础语法、函数、面向对象编程和科学计算。其次要打好数学基础,重点学习高等数学、线性代数、概率论和最优化方法。这些核心知识将为后续的机器学习、深度学习等进阶内容奠定坚实基础。建议初学者先系统学习这两部分内容,再逐步深入人工智能的其他领域。

2025-07-22 11:50:50 621

原创 【LLM多模态】LLava模型架构和训练过程 | CLIP模型

本文介绍了CLIP和LLaVA两大视觉-语言模型。CLIP采用对比学习方法,通过最大化匹配图像-文本对的相似度并最小化不匹配对的相似度进行训练,支持zero-shot推理,在ViT架构上表现优异。LLaVA则采用更简单的架构,结合CLIP视觉编码器和LLM语言模型,仅需训练一个映射层即可实现图像到文本的生成。文章还概述了LLaVA 1.5和1.6版本的改进,并比较了LLaVA与InstructBLIP等复杂模型的设计差异,突出了LLaVA在数据效率和训练简洁性上的优势。

2025-07-21 12:00:26 903

原创 TensorFlow深度学习实战(1)——神经网络与模型训练过程详解

本文介绍了神经网络的基础知识及其训练过程。首先概述了神经网络的概念和组成结构,包括输入层、隐藏层和输出层。然后详细讲解了神经网络的前向传播计算过程,包括权重初始化、隐藏层节点值计算、激活函数应用和损失值计算。同时简要介绍了反向传播的基本原理。最后列举了神经网络在不同领域的应用场景,如表1所示。通过一个具体示例,展示了如何从零开始构建神经网络的前向传播过程,包括隐藏层节点值的计算步骤。本文为后续学习神经网络的模型训练和优化奠定了基础。

2025-07-21 11:43:40 851

原创 RAG+GIS实战:离线RAG项目实战01——环境配置+简单对话模型搭建

一个基于Modelscope框架实现的RAG项目实战全流程,注重离线化、私有化部署,欢迎一起学习!

2025-07-18 11:35:19 893

原创 AI Agent调研--7种Agent框架对比!盘点国内一站式Agent搭建平台,一文说清差别!大家都在用Agent做什么?

本文系统梳理了智能代理(Agent)技术的基础架构与主流平台。核心解析Agent的感知-规划-行动决策机制及推理、记忆、工具、行动四大模块,对比了国内外主流Agent平台的核心功能。重点测评了斑头雁(集成多模型)、Coze(字节Bot开发平台)、百度千帆AgentBuilder(低代码开发)和天工SkyAgents(自然语言编程)四大平台,分析其产品形态、开发模式和应用场景差异,为AI代理技术的选型与应用提供参考框架。

2025-07-17 15:14:28 650

原创 【玩转 TableAgent 数据智能分析】股票交易数据分析+预测

本文介绍了智能数据分析工具TableAgent,这是一款基于Alaya大模型的自动化分析工具,能够理解数据需求并自动完成数据处理、模型选择和报告生成。文章详细阐述了TableAgent的核心功能及特点,包括会话式分析、领域化微调等特性,并通过建设银行股票交易数据的实际案例演示了其操作流程。从账号注册、数据准备到需求确认和结果解读,作者完整展示了TableAgent的实践应用过程,验证了其"零编码实现自动化分析"的产品承诺,最后对该工具的发展前景进行了展望。

2025-07-17 14:43:07 942

原创 听张雪峰的!这4个专科专业真香,毕业直接拿高薪,2025届码住!

2025年高考生注意!这4大紧缺专业专科也能拿高薪:1)大模型工程方向,专科技术岗年薪可达30万+;2)计算机科学与技术,AI协同开发者薪资暴涨;3)电子信息工程,芯片国产化带动人才需求;4)口腔医学,专科就业率超90%。文章强调专业选择比学校更重要,建议优先选择开设AI相关课程的院校,掌握Python、云计算等核心技能,考取行业认证证书。在AI重构就业市场的背景下,技术能力比学历更具竞争力,专科生也能实现高薪就业。

2025-07-16 11:45:19 1250

原创 2025年,国内AI大模型发展报告!行业场景探索及应用落地方案_2025中国ai大模型场景探索及产业应用

2025年,国内AI大模型发展报告!行业场景探索及应用落地方案_2025中国ai大模型场景探索及产业应用

2025-07-15 10:48:39 874

原创 深度剖析DeepSeek大模型:技术架构详览、应用场景探索

DeepSeek大模型技术解析与应用展望 DeepSeek是中国深度求索团队研发的高效大语言模型,通过优化Transformer架构(如稀疏注意力、动态路由网络)和混合专家系统(MoE),实现轻量参数与高性能的平衡。其多模态能力融合文本、图像、视频处理,支持金融、医疗等垂直领域深度定制,并凭借低延迟、私有化部署等优势,在客服、工业质检等场景落地显著降本增效。相比GPT-4,DeepSeek在推理效率、领域适配性及数据安全方面更具竞争力。未来将聚焦长上下文建模、具身智能等方向,同时开源轻量模型推动开发者生态。

2025-07-15 10:24:00 327

原创 【AI 大模型】RAG 检索增强生成 ⑥ ( 使用 向量数据库 作为 RAG 知识库 完整实现 )

本文介绍了大模型在数据迟滞和缺失上的局限性,提出通过向量数据库构建本地知识库作为解决方案。文章详细阐述了RAG(检索增强生成)技术的三个阶段:检索阶段通过向量相似度匹配查找相关信息;增强阶段将知识库信息整合到提示词中;生成阶段由大模型输出最终结果。此外,提供了完整的代码示例,包括生成本地知识库和实现RAG服务的具体步骤,展示了如何利用向量数据库chromadb存储和检索文本向量,从而增强大模型的专业性和时效性。

2025-07-12 14:00:00 893

原创 15种高级RAG技术:从预检索到生成全面提升RAG效果

本文探讨了15种高级检索增强生成(RAG)技术,旨在优化生成式AI系统的输出质量和性能。RAG技术通过结合信息检索与AI生成,解决传统系统面临的信息密度不足、检索准确性低和响应质量差等问题。优化策略分为预检索、检索/召回、检索后和生成优化四类。预检索优化包括使用LLM提高信息密度、分层索引检索、创建假设性问答对等方法,以增强数据质量和可检索性。这些技术通过改进RAG管道的每个环节,实现更高效的语义搜索和更准确的响应生成,从而提升系统整体性能。

2025-07-12 13:30:00 1401

原创 【AI 大模型】RAG 检索增强生成 ⑤ ( 向量数据库 | 向量数据库 索引结构和搜索算法 | 常见 向量数据库 对比 | 安装并使用 向量数据库 chromadb 案例 )

文章摘要 本文系统介绍了向量数据库及其在AI领域的应用。首先阐述了向量数据库的概念,作为专门存储和管理高维向量数据的系统,其核心功能是快速执行向量相似性搜索。文章详细对比了传统数据库与向量数据库的区别,并分析了主流向量数据库(如FAISS、Pinecone、Milvus等)的特点和适用场景。通过Python代码示例展示了如何使用chromadb向量数据库,包括创建实例、存储向量和执行相似性搜索等关键操作。最后,文章总结了向量数据库在推荐系统、图像检索、语义搜索等领域的实际应用价值,为开发者提供了实用的技术参

2025-07-11 14:58:06 626

原创 【AI 大模型】RAG 检索增强生成 ④ ( 向量相似度计算 | 余弦距离 | 欧式距离 | OpenAI 文本向量模型 | 手动实现的 余弦相似度 和 欧氏距离 函数计算 )

本文介绍了两种常用的向量相似度计算方法:余弦距离和欧式距离,及其在自然语言处理中的应用。余弦距离通过向量夹角的余弦值衡量相似性,适用于高维稀疏数据(如文本向量),对方向敏感而忽略长度;欧式距离则计算空间中两点直线距离,适用于需要绝对差异的场景(如图像处理)。文章对比了两者的特点与适用场景,并提供了Python代码示例,帮助读者理解如何在实际任务中选择合适的度量方法。此外,还简要介绍了OpenAI的文本向量模型和使用Scikit-learn库计算距离的方法。

2025-07-11 14:53:50 396

原创 【AI 大模型】RAG 检索增强生成 ③ ( 文本向量 | Word2Vec 词汇映射向量空间模型 - 算法原理、训练步骤、应用场景、实现细节 | Python 代码示例 )

Word2Vec是一种将词汇映射到高维向量空间的模型,通过语义相似的词在向量空间中彼此接近的核心思想,实现词汇的向量化表示。该模型包含两种训练方法:连续词袋模型(CBOW)通过上下文词汇预测中心词,而跳字模型(Skip-gram)则通过中心词预测上下文词汇。训练完成后,每个词汇被表示为高维向量(如50维浮点数),可用于计算词义相似度、文本分类、语言翻译、向量检索和命名实体识别等自然语言处理任务。

2025-07-11 14:45:39 651

原创 大模型入门到进阶:什么是 RAG?为什么需要 RAG?RAG 的流程

RAG(检索增强生成)是一种结合外部知识库优化大语言模型输出的技术。其核心流程包括:检索(从知识库获取相关信息)、增强(将检索内容整合到提示词)、生成(大模型基于增强信息输出结果)。RAG解决了大模型的两大局限:1)时效性不足,无法获取训练截止后的新知识;2)覆盖性有限,难以应对专业或私有领域问题。通过外挂知识库,RAG有效减少模型幻觉,提升回答准确性。该技术尤其适用于需要实时、专业信息的应用场景,是当前AI领域的重要研究方向。

2025-07-11 14:11:28 253

原创 浅谈大模型生成类应用的需求分析设计与实践

摘要 生成式AI在通信行业售前方案中的应用探索 本文探讨了生成式AI技术在通信运营商售前方案中的实践应用。针对传统方案制作效率低、质量参差不齐等问题,研究团队聚焦小微企业组网方案场景,构建了包含业务知识规则化、章节内容标准化、智能交互设计等关键环节的系统解决方案。通过文档智能处理、RAG检索增强等技术手段,实现了售前方案的自动化生成和持续优化,显著提升了方案制作效率和质量。该实践为通信行业数字化转型提供了可复用的方法论,也为生成式AI在垂直领域的深度应用提供了参考案例。研究还展望了AI与AR/VR等技术融合

2025-07-08 12:02:04 694

原创 【三大突破正改写AI规则】国产之光DeepSeek架构理解与应用分析

DeepSeek是一个基于Transformer架构的大模型,其核心创新在于动态专家路由算法和稀疏门控注意力机制,显著提升了模型的计算效率和性能表现。文章从架构设计、核心算法、训练策略等方面展开分析,重点探讨了MoE层的实现、三阶段渐进式训练方法以及显存优化技术。在应用层面,DeepSeek可广泛应用于机械电子工程领域的预测性维护、智能质量控制、自动化设计优化等场景。通过与同类模型的对比,凸显其在计算效率与任务适应性上的优势。未来,DeepSeek将进一步与实体产业深度融合,推动AI技术在实际生产中的落地应

2025-07-08 10:57:18 1008

原创 全网最全RAG评估指南:全面解析RAG评估指标并提供代码示例

RAG(检索增强生成)技术存在数据处理、分段优化、Embedding模型选择、Prompt设计、topN设置等关键痛点。优化策略包括:数据清洗预处理(去噪、标准化)、合理设置chunk大小(100-300词)、选用合适Embedding模型(如BERT)、设计清晰Prompt、调整检索topN值(3-10)、选择优质LLM模型(如GPT-4)。通过数据标注、模型微调、混合使用模型等方法,可有效提升RAG系统的检索生成效果。

2025-07-07 17:25:23 1062

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除