
大模型算法实战工程
文章平均质量分 91
以实战为线索,逐步通过构建生产级实战工程快速熟悉及掌握各个常用大模型算法。
power-辰南
一枚热爱技术的老头子,承接各类软件系统,及技术咨询,欢迎咨询!
展开
-
企业级智能对话AI助手(二)基于 DeepSeek-R1 的专业领域意图识别系统实现
在自然语言处理(NLP)领域,意图识别(Intent Classification)是构建智能对话系统的核心任务之一。无论是智能客服、虚拟助手还是专业领域的问答系统,意图识别都能帮助系统准确理解用户的需求并提供相应的响应。本文介绍如何基于 Python 和 Hugging Face 的 Transformers 库,利用 DeepSeek-R1-Distill-Qwen-1.5B 模型实现一个专业领域的意图识别系统,涵盖法律查询、病虫害防治、OA 审批等场景。原创 2025-02-28 13:48:31 · 1133 阅读 · 1 评论 -
企业级智能对话AI助手(一)技术方案设计
NLU+NER构建企业级AI助手原创 2025-02-27 14:51:17 · 7833 阅读 · 1 评论 -
CPU环境使用DeepSeek微调打造智能医学AI博士助手:从原理到实践
微调是指在预训练模型的基础上,通过在特定任务或领域的数据集上进一步训练,使模型适应新的需求。效率高:利用预训练模型已有的知识,收敛速度更快。数据需求少:只需少量标注数据即可实现较好的效果。性能优:继承了预训练模型强大的语言理解能力。对于像DeepSeek这样的语言模型来说,微调的过程通常涉及调整模型参数,使其在特定任务(如医学问答)上的损失函数最小化。然而,传统微调需要更新模型的全部参数,对于亿级参数的模型来说,这不仅计算成本高昂,还需要强大的硬件支持。原创 2025-02-26 10:34:54 · 7073 阅读 · 2 评论 -
人工智能学习(八)之注意力机制原理解析
深入剖析注意力机制的原理,从其诞生的背景出发,逐步揭开全注意力机制、局部注意力机制的神秘面纱,对比其与传统循环神经网络的差异,并探讨其在实际应用中的优势与挑战。原创 2025-02-14 08:30:00 · 10809 阅读 · 0 评论 -
人工智能学习(七)之神经网络
本文深入剖析多种神经网络算法。回顾经典多层感知机后,详细阐述 RNN、GRU、LSTM、双向 RNN 及 CNN 原理,涵盖结构、计算过程等。同时给出实际案例,如用 RNN 预测正弦波、LSTM 做文本情感分析、展现各算法在不同任务的应用。原创 2025-02-10 08:30:00 · 3711 阅读 · 0 评论 -
人工智能学习(六)之语言大模型Word2Vec
本文聚焦于 Word2Vec 底层原理,揭示其作为大语言模型重要基石的关键作用。文章首先对比传统 n - gram 模型在维度灾难和数据稀疏上的困境,凸显神经网络语言模型通过分布式表示解决问题的优势原创 2025-02-09 09:00:00 · 990 阅读 · 0 评论 -
人工智能学习(五)之机器学习逻辑回归算法
下面使用 Python 和 NumPy、scikit - learn库实现一个包含数据预处理、模型训练和评估的逻辑回归模型示例。在这个示例中,我们使用经典的鸢尾花数据集,该数据集包含四个属性列和一个品种类别列,我们的目标是根据四个属性来预测鸢尾花的品种。# 导入必要的库# 1. 加载数据# 使用load_iris函数从scikit - learn的数据集模块中加载鸢尾花数据集# 提取特征数据# 提取目标标签# 2. 数据预处理。原创 2025-02-03 20:57:25 · 961 阅读 · 0 评论 -
人工智能学习(四)之机器学习基本概念
在当今数字化时代,机器学习作为人工智能领域的核心技术之一,正深刻地改变着我们的生活和工作方式。从智能语音助手到图像识别系统,从个性化推荐引擎到自动驾驶汽车,机器学习的应用无处不在。本文将深入探讨机器学习的基本概念,帮助读者全面了解这一充满魅力的领域。原创 2025-02-02 19:18:59 · 1350 阅读 · 0 评论 -
人工智能学习(三)之机器学习基本概念
机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。它专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。简单来说,机器学习让计算机通过数据学习模式和规律,从而能够对新数据进行预测或决策,而无需明确的编程指令。例如,垃圾邮件过滤器通过学习大量邮件样本中的特征,能够自动判断新收到的邮件是否为垃圾邮件,这就是机器学习在实际应用中的一个典型例子。原创 2025-01-22 21:58:36 · 1066 阅读 · 0 评论 -
人工智能学习(二)之Python 科学计算库
NumPy(Numerical Python)是 Python 科学计算的基础库,它提供了一个强大的 N 维数组对象(ndarray),以及一系列用于数组操作的函数和工具。NumPy 的数组对象具有高效的存储和计算性能,能够大大提高数值计算的效率。SciPy(Scientific Python)是基于 NumPy 的一个科学计算库,它提供了更为高级的数学算法和工具,涵盖了优化、插值、积分、线性代数、信号处理等多个领域。原创 2025-01-22 17:34:44 · 1196 阅读 · 0 评论 -
人工智能学习(一)之python入门
在 Python 中,并没有像其他语言(如 Java)那样严格的访问修饰符。但是,通过约定俗成的方式,我们可以模拟类似的效果。公有属性和方法:在 Python 中,所有不以双下划线开头的属性和方法都是公有的,可以在类的外部直接访问。私有属性和方法:以双下划线开头的属性和方法被视为私有,在类的外部不能直接访问。# 以下代码会报错但是,实际上 Python 并没有真正的私有机制,通过 “_类名__属性名” 的方式还是可以在外部访问私有属性和方法,但强烈不建议这样做,因为这违反了代码的封装原则。原创 2025-01-22 17:07:37 · 1179 阅读 · 0 评论 -
AI Agent 原理解析及应用场景深度洞察
AIAgent,即人工智能代理,是一种能够感知其所处环境,并基于所感知的信息自主地采取行动以实现特定目标的软件或硬件实体。它具备自主性、反应性、主动性和社会性等关键特性。自主性意味着AIAgent能够在没有外部直接干预的情况下,自行决定执行何种行动,依据内部的决策机制和策略来运作。例如,一个智能客服AIAgent可以根据用户的提问,自主检索知识库并生成合适的回答,无需人工实时指导。反应性体现为AIAgent能够及时感知环境的变化,并对这些变化做出相应的反应。原创 2025-01-20 09:03:37 · 3855 阅读 · 0 评论 -
2025人工智能学习路线全链路解析
深度学习应用(约 1 - 2 个月):原创 2025-01-10 23:05:18 · 7702 阅读 · 0 评论 -
Transformer入门教程全解析(一)
在当今深度学习领域,Transformer 无疑是一颗璀璨的明星,它如同一股强大的变革力量,席卷了自然语言处理(NLP)乃至更多领域。从机器翻译到文本生成,从问答系统到情感分析,Transformer 都展现出了卓越的性能,打破了传统模型的诸多局限。对于渴望深入探索深度学习奥秘的开发者和研究者来说,掌握 Transformer 已然成为一项必备技能。本教程将从基础概念讲起,逐步深入其架构细节、训练方法以及实际应用,带领大家开启一段精彩的 Transformer 学习之旅。原创 2025-01-10 22:33:29 · 523 阅读 · 0 评论