- 博客(19)
- 资源 (4)
- 收藏
- 关注
原创 【深度学习入门】第5章 深度学习和卷积神经网络
本文通过小恶魔的比喻和数学分析,阐述了卷积神经网络通过卷积层、池化层结构动态检测图像模式的方式,以及利用误差反向传播法和Excel实例验证其高效识别手写数字的实现原理与效果
2025-05-08 14:43:09
59732
原创 【深度学习入门】第4章 神经网络和误差反向传播法
文章阐述了梯度下降法与误差反向传播法在神经网络训练中的应用。梯度下降法通过沿函数最陡方向迭代更新参数以最小化代价函数,但在神经网络中直接计算大量参数的导数会导致“导数地狱”。误差反向传播法通过引入神经单元误差δ,建立层间误差的递推关系,将复杂导数转化为矩阵运算,逐层反向传播误差(如输出层δ由误差项与激活函数导数计算,中间层δ由下一层δ与权重矩阵反向推导),显著降低了计算复杂度。
2025-05-08 07:30:00
59634
原创 【深度学习入门】第3章 神经网络模型的数学表示
本文系统地阐述了神经网络中参数(权重和偏置)与变量的数学定义与区分,通过构建代价函数(如平方误差)并利用最优化方法调整参数以实现模型学习的过程,同时结合回归分析对比和Excel实例验证了学习机制。
2025-05-07 14:49:17
60585
1
原创 【深度学习入门】第2章 神经网络的数学基础
本文系统梳理了神经网络所需的数学基础知识,涵盖函数、数列、向量、矩阵、导数、梯度下降法及回归分析等核心内容,为理解神经网络的底层原理与优化方法奠定理论基础。
2025-05-07 09:00:01
61047
1
原创 【深度学习入门】第1章神经网络的思想
在人工智能领域,神经网络(Neural Network,NN)是近年来的热门话题,由此发展而来的深度学习更是每天都被经济和社会新闻提及。本章将概述神经网络是什么,以及数学是怎样参与其中的。
2025-05-06 16:33:58
56567
原创 深度学习概述
进行着物体的辨别:“那是电影院”“信号灯是红灯”,等等。的模式识别,以前的逻辑是将“玫瑰是具有这样特征的东西”教给机器,看到玫瑰花的图片,我们理所当然就能辨别出“这是玫瑰花”。因为玫瑰花的形状实在是太多了,即使是相同品种的玫。是将模拟动物的神经细胞的神经元聚集起来形成网络,然后让这个网络。去观察大量的玫瑰花的图片,进行“自学习”。专业术语,令人难以看透神经网络的本质,这对于今后人工智能的发展。本专栏的目的在于提供理解神经网络所需的数学基础知识。者直观地理解,本专栏使用大量图片,并通过具体示例来介绍。
2025-04-30 16:14:05
342
原创 写在后面的话
在本专栏中,我们探讨了大型语言模型的工作原理,以及如何将其应用于从简单聊天机器人到搜索引擎等复杂系统的开发。通过掌握这些技术,读者将能释放大语言模型的潜力,创造出受益于其能力的创新解决方案。随着本专栏接近尾声,我们想强调,我们对大语言模型的探索才刚刚开始。未来还有更多激动人心的进展值得期待,我们鼓励您持续关注这一领域的新动态。以本专栏为指引,我们相信您已准备好驾驭大语言模型的广阔天地,并为这一快速发展的领域贡献重要力量。希望本专栏能让您更深入地理解大语言模型在各类应用中的价值,以及它们变革行业的潜力。
2025-04-25 14:44:54
240
原创 第12章 微调生成模型
在本章中,我们将以一个预训练文本生成模型为例,详细讲解微调(fine-tuning)的完整流程。微调是生成高质量模型的关键步骤,也是我们工具包中用于将模型适配到特定预期行为的重要工具。通过微调,我们可以让模型适配特定的数据集或领域。本章将引导您了解两种最常见的文本生成模型微调方法:监督式微调(supervised fine-tuning)和偏好微调(preference tuning)。我们将深入探索微调预训练文本生成模型的变革潜力,帮助您将其转化为更高效的应用工具。
2025-04-25 14:06:31
54002
原创 第11章 面向分类任务的表示模型微调
在第四章中,我们使用了预训练模型对文本进行分类。我们直接使用了未经任何修改的预训练模型。这可能会让你产生疑问:如果我们对模型进行微调会发生什么?如果有充足的数据,微调通常能产生性能最佳的模型。在本章中,我们将探讨几种微调BERT模型的方法和应用:《监督式分类》展示了微调分类模型的通用流程;《少样本分类》将介绍SetFit方法——一种通过少量训练样本高效微调高性能模型的技术;《基于掩码语言建模的继续预训练》探讨了如何对预训练模型进行持续训练;《命名实体识别》研究了基于词元级别的分类任务。
2025-04-25 09:18:00
49428
原创 第10章 构建文本嵌入模型
文本嵌入模型是众多强大自然语言处理应用的基础。它们为文本生成模型等已令人惊叹的技术奠定了根基。在本书中,我们已在多个场景中应用过嵌入模型,包括监督式分类、无监督式分类、语义搜索,甚至为ChatGPT等文本生成模型赋予记忆能力。几乎无法夸大嵌入模型在该领域的重要性,因为它们支撑着众多应用的核心运作。因此,本章我们将探讨多种创建和微调嵌入模型的方法,以增强其表征能力和语义表现力。
2025-04-24 16:21:04
52723
原创 【实践大语言模型】第9章 多模态大语言模型
在本章中,我们将探索多种具备多模态能力的LLMs及其在实际应用场景中的意义。首先,我们将通过改进原始Transformer技术,研究图像如何被转化为数值表示;接着,我们将展示如何通过这种Transformer扩展LLMs以涵盖视觉任务。
2025-04-24 09:32:16
58891
原创 第8章 语义搜索与检索增强生成
大型语言模型(LLM)文本生成能力的提升催生了一种新型搜索系统,这类系统包含一个能根据查询生成答案的模型。这类系统更合适的名称是RAG系统(检索增强生成系统)。RAG系统是整合了搜索功能的文本生成系统,其目的是减少模型生成内容的“幻觉”(即不真实或错误信息)、提高事实准确性,和/或将生成模型的输出锚定在特定数据集上。
2025-04-23 14:36:33
54198
原创 第7章 高级文本生成技术与工具
在本章中,我们将深入探讨几种改进生成文本质量的方法论与核心概念:模型输入输出,加载和使用大语言模型。记忆,帮助大语言模型记忆。智能体:结合复杂行为与外部工具。链式结构:连接方法与模块。
2025-04-23 11:13:38
52876
原创 第6章 提示工程
本章将更详细地探索这些生成式模型,深入研究提示工程、基于生成模型的推理过程、结果验证,乃至评估其输出质量的方法论。通过系统性的学习路径,读者不仅能掌握生成式AI的核心原理,更能获得实际应用中的关键技巧。
2025-04-21 09:15:03
53186
原创 第5章 文本聚类与主题建模
尽管近年来像分类这样的监督技术在行业中占据主导地位,但文本聚类等无监督技术的潜力仍不可小觑。文本聚类的目标是根据语义内容、含义和关系对相似文本进行分组。由语义相似文档形成的聚类结果不仅能够高效地对大量非结构化文本进行分类,还为快速探索性数据分析提供了可能。
2025-04-18 13:53:01
52964
原创 第4章 文本分类
自然语言处理中的一项常见任务是分类任务。该任务的目标是训练模型为输入文本分配一个标签或类别(见图4-1)。文本分类在全球范围内广泛应用于多种场景,包括情感分析、意图检测、实体抽取和语言检测等领域。无论是表示型语言模型(如BERT)还是生成型语言模型(如GPT),它们对分类任务的影响均不可忽视。在本章中,我们将探讨利用语言模型进行文本分类的多种方法。作为使用预训练语言模型的入门指引,我们将呈现这个领域的全景视图。鉴于文本分类的广泛性,我们将通过多种技术方案深入。
2025-04-16 14:19:58
53682
原创 第3章 解析大型语言模型的内部机制
现在我们已经对分词和词嵌入有了基本认识,接下来可以更深入地探讨语言模型的工作原理。本章我们将解析Transformer语言模型的核心技术原理,重点聚焦文本生成模型,以帮助读者特别加深对生成式大语言模型(LLMs)运作机制的理解。我们将同时探讨相关概念,并提供一些代码示例来演示这些原理。首先,我们将加载一个语言模型,并通过声明一个管道来为生成任务做好准备。在初次阅读时,可以选择跳过代码部分,集中精力理解相关概念。随后在第二次阅读时,可以通过代码来实际应用这些概念。
2025-04-14 11:41:40
56723
原创 第2章 分词和嵌入
词元和嵌入是使用大型语言模型(LLMs)的两个核心概念。正如我们在第一章中所看到的,它们不仅对于理解语言AI的历史非常重要,而且如果我们没有对词元和嵌入有一个良好的认识,我们就无法清楚地了解LLMs的工作原理、它们是如何构建的,以及它们将来会走向何方。在本章中,我们将更仔细地研究什么是词元以及用于支持大型语言模型(LLM)的分词方法。
2025-04-10 14:20:17
58785
原创 第1章 对大型语言模型的介绍
自2012年起,基于深度神经网络的人工智能系统研发进入快速通道,将这一技术推向了新高度:至2019年底,首个能够撰写与人类文章真假难辨的软件系统问世,这个名为GPT-2(生成型预训练变换模型2)的AI模型开启了新纪元。2022年ChatGPT的发布标志着技术质变,它不仅革新了人机交互方式(推出5天即突破百万用户,2个月后活跃用户过亿),更展现出从文本生成、多语言翻译到知识提炼的通用能力,迅速成为程序开发、教学科研领域的革命性工具。这些本地模型的一个主要优势是,作为用户的您对模型拥有完全的控制权。
2025-04-09 14:13:46
56368
用Excel体验神经网络的计算过程
2025-05-07
用Excel体验梯度下降法
2025-05-07
mybatis完整工具包(含分页、sql自动生成、cache改造等)完全免费
2013-11-25
mybatis自动sql生成插件源码
2013-07-13
mybatis分页源码
2013-07-07
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人