- 博客(31)
- 资源 (4)
- 收藏
- 关注
原创 【深度学习入门】第5章 深度学习和卷积神经网络
本文通过小恶魔的比喻和数学分析,阐述了卷积神经网络通过卷积层、池化层结构动态检测图像模式的方式,以及利用误差反向传播法和Excel实例验证其高效识别手写数字的实现原理与效果
2025-05-08 14:43:09
5610
原创 【深度学习入门】第4章 神经网络和误差反向传播法
文章阐述了梯度下降法与误差反向传播法在神经网络训练中的应用。梯度下降法通过沿函数最陡方向迭代更新参数以最小化代价函数,但在神经网络中直接计算大量参数的导数会导致“导数地狱”。误差反向传播法通过引入神经单元误差δ,建立层间误差的递推关系,将复杂导数转化为矩阵运算,逐层反向传播误差(如输出层δ由误差项与激活函数导数计算,中间层δ由下一层δ与权重矩阵反向推导),显著降低了计算复杂度。
2025-05-08 07:30:00
4914
原创 【深度学习入门】第3章 神经网络模型的数学表示
本文系统地阐述了神经网络中参数(权重和偏置)与变量的数学定义与区分,通过构建代价函数(如平方误差)并利用最优化方法调整参数以实现模型学习的过程,同时结合回归分析对比和Excel实例验证了学习机制。
2025-05-07 14:49:17
5051
1
原创 【深度学习入门】第2章 神经网络的数学基础
本文系统梳理了神经网络所需的数学基础知识,涵盖函数、数列、向量、矩阵、导数、梯度下降法及回归分析等核心内容,为理解神经网络的底层原理与优化方法奠定理论基础。
2025-05-07 09:00:01
5652
1
原创 【深度学习入门】第1章神经网络的思想
在人工智能领域,神经网络(Neural Network,NN)是近年来的热门话题,由此发展而来的深度学习更是每天都被经济和社会新闻提及。本章将概述神经网络是什么,以及数学是怎样参与其中的。
2025-05-06 16:33:58
5388
原创 深度学习概述
进行着物体的辨别:“那是电影院”“信号灯是红灯”,等等。的模式识别,以前的逻辑是将“玫瑰是具有这样特征的东西”教给机器,看到玫瑰花的图片,我们理所当然就能辨别出“这是玫瑰花”。因为玫瑰花的形状实在是太多了,即使是相同品种的玫。是将模拟动物的神经细胞的神经元聚集起来形成网络,然后让这个网络。去观察大量的玫瑰花的图片,进行“自学习”。专业术语,令人难以看透神经网络的本质,这对于今后人工智能的发展。本专栏的目的在于提供理解神经网络所需的数学基础知识。者直观地理解,本专栏使用大量图片,并通过具体示例来介绍。
2025-04-30 16:14:05
331
原创 写在后面的话
在本专栏中,我们探讨了大型语言模型的工作原理,以及如何将其应用于从简单聊天机器人到搜索引擎等复杂系统的开发。通过掌握这些技术,读者将能释放大语言模型的潜力,创造出受益于其能力的创新解决方案。随着本专栏接近尾声,我们想强调,我们对大语言模型的探索才刚刚开始。未来还有更多激动人心的进展值得期待,我们鼓励您持续关注这一领域的新动态。以本专栏为指引,我们相信您已准备好驾驭大语言模型的广阔天地,并为这一快速发展的领域贡献重要力量。希望本专栏能让您更深入地理解大语言模型在各类应用中的价值,以及它们变革行业的潜力。
2025-04-25 14:44:54
223
原创 第12章 微调生成模型
在本章中,我们将以一个预训练文本生成模型为例,详细讲解微调(fine-tuning)的完整流程。微调是生成高质量模型的关键步骤,也是我们工具包中用于将模型适配到特定预期行为的重要工具。通过微调,我们可以让模型适配特定的数据集或领域。本章将引导您了解两种最常见的文本生成模型微调方法:监督式微调(supervised fine-tuning)和偏好微调(preference tuning)。我们将深入探索微调预训练文本生成模型的变革潜力,帮助您将其转化为更高效的应用工具。
2025-04-25 14:06:31
2416
原创 第11章 面向分类任务的表示模型微调
在第四章中,我们使用了预训练模型对文本进行分类。我们直接使用了未经任何修改的预训练模型。这可能会让你产生疑问:如果我们对模型进行微调会发生什么?如果有充足的数据,微调通常能产生性能最佳的模型。在本章中,我们将探讨几种微调BERT模型的方法和应用:《监督式分类》展示了微调分类模型的通用流程;《少样本分类》将介绍SetFit方法——一种通过少量训练样本高效微调高性能模型的技术;《基于掩码语言建模的继续预训练》探讨了如何对预训练模型进行持续训练;《命名实体识别》研究了基于词元级别的分类任务。
2025-04-25 09:18:00
1932
原创 第10章 构建文本嵌入模型
文本嵌入模型是众多强大自然语言处理应用的基础。它们为文本生成模型等已令人惊叹的技术奠定了根基。在本书中,我们已在多个场景中应用过嵌入模型,包括监督式分类、无监督式分类、语义搜索,甚至为ChatGPT等文本生成模型赋予记忆能力。几乎无法夸大嵌入模型在该领域的重要性,因为它们支撑着众多应用的核心运作。因此,本章我们将探讨多种创建和微调嵌入模型的方法,以增强其表征能力和语义表现力。
2025-04-24 16:21:04
1760
原创 第9章 多模态大语言模型
在本章中,我们将探索多种具备多模态能力的LLMs及其在实际应用场景中的意义。首先,我们将通过改进原始Transformer技术,研究图像如何被转化为数值表示;接着,我们将展示如何通过这种Transformer扩展LLMs以涵盖视觉任务。
2025-04-24 09:32:16
2521
原创 第8章 语义搜索与检索增强生成
大型语言模型(LLM)文本生成能力的提升催生了一种新型搜索系统,这类系统包含一个能根据查询生成答案的模型。这类系统更合适的名称是RAG系统(检索增强生成系统)。RAG系统是整合了搜索功能的文本生成系统,其目的是减少模型生成内容的“幻觉”(即不真实或错误信息)、提高事实准确性,和/或将生成模型的输出锚定在特定数据集上。
2025-04-23 14:36:33
3504
原创 第7章 高级文本生成技术与工具
在本章中,我们将深入探讨几种改进生成文本质量的方法论与核心概念:模型输入输出,加载和使用大语言模型。记忆,帮助大语言模型记忆。智能体:结合复杂行为与外部工具。链式结构:连接方法与模块。
2025-04-23 11:13:38
2102
原创 第6章 提示工程
本章将更详细地探索这些生成式模型,深入研究提示工程、基于生成模型的推理过程、结果验证,乃至评估其输出质量的方法论。通过系统性的学习路径,读者不仅能掌握生成式AI的核心原理,更能获得实际应用中的关键技巧。
2025-04-21 09:15:03
1941
原创 第5章 文本聚类与主题建模
尽管近年来像分类这样的监督技术在行业中占据主导地位,但文本聚类等无监督技术的潜力仍不可小觑。文本聚类的目标是根据语义内容、含义和关系对相似文本进行分组。由语义相似文档形成的聚类结果不仅能够高效地对大量非结构化文本进行分类,还为快速探索性数据分析提供了可能。
2025-04-18 13:53:01
1443
原创 第4章 文本分类
自然语言处理中的一项常见任务是分类任务。该任务的目标是训练模型为输入文本分配一个标签或类别(见图4-1)。文本分类在全球范围内广泛应用于多种场景,包括情感分析、意图检测、实体抽取和语言检测等领域。无论是表示型语言模型(如BERT)还是生成型语言模型(如GPT),它们对分类任务的影响均不可忽视。在本章中,我们将探讨利用语言模型进行文本分类的多种方法。作为使用预训练语言模型的入门指引,我们将呈现这个领域的全景视图。鉴于文本分类的广泛性,我们将通过多种技术方案深入。
2025-04-16 14:19:58
1276
原创 第3章 解析大型语言模型的内部机制
现在我们已经对分词和词嵌入有了基本认识,接下来可以更深入地探讨语言模型的工作原理。本章我们将解析Transformer语言模型的核心技术原理,重点聚焦文本生成模型,以帮助读者特别加深对生成式大语言模型(LLMs)运作机制的理解。我们将同时探讨相关概念,并提供一些代码示例来演示这些原理。首先,我们将加载一个语言模型,并通过声明一个管道来为生成任务做好准备。在初次阅读时,可以选择跳过代码部分,集中精力理解相关概念。随后在第二次阅读时,可以通过代码来实际应用这些概念。
2025-04-14 11:41:40
1346
原创 第2章 分词和嵌入
词元和嵌入是使用大型语言模型(LLMs)的两个核心概念。正如我们在第一章中所看到的,它们不仅对于理解语言AI的历史非常重要,而且如果我们没有对词元和嵌入有一个良好的认识,我们就无法清楚地了解LLMs的工作原理、它们是如何构建的,以及它们将来会走向何方。在本章中,我们将更仔细地研究什么是词元以及用于支持大型语言模型(LLM)的分词方法。
2025-04-10 14:20:17
2540
原创 第1章 对大型语言模型的介绍
自2012年起,基于深度神经网络的人工智能系统研发进入快速通道,将这一技术推向了新高度:至2019年底,首个能够撰写与人类文章真假难辨的软件系统问世,这个名为GPT-2(生成型预训练变换模型2)的AI模型开启了新纪元。2022年ChatGPT的发布标志着技术质变,它不仅革新了人机交互方式(推出5天即突破百万用户,2个月后活跃用户过亿),更展现出从文本生成、多语言翻译到知识提炼的通用能力,迅速成为程序开发、教学科研领域的革命性工具。这些本地模型的一个主要优势是,作为用户的您对模型拥有完全的控制权。
2025-04-09 14:13:46
1532
原创 深入浅出Mybatis-与Spring集成
单独使用mybatis是有很多限制的(比如无法实现跨越多个session的事务),而且很多业务系统本来就是使用spring来管理的事务,因此mybatis最好与spring集成起来使用。本文通过循序渐进的方式讲解了Mybatis与spring集成的各种方案以及原理,让读者可以根据自己项目的实际需求选择适合自己的方案。
2014-03-18 13:48:06
109774
24
原创 深入浅出Mybatis-改造Cache
在前面的文章里,我开发了两个插件:根据注解实现的sql自动生成插件和分页插件。这两个插件在没有开启cache的情况下可以很好的使用,但开启cache后却出现了一些问题,为了解决这些问题,我编写了拦截cache的插件,通过这个拦截器修正了这些问题。问题什么问题最容易出现的问题是开启cache后,分页查询时无论查询哪一页都返回第一页的数据。另外,使用sql自动生成插件生成get方法的sql
2013-11-25 20:14:35
19342
5
原创 深入浅出Mybatis-sql自动生成
本文提供了一种自动生成sql语句的方法,它针对的对象是有主键或唯一索引的单表,提供的操作有增、删、改、查4种。理解本文和本文的提供的代码需要有java注解的知识,因为本文是基于注解生成sql的。本文适配的mybatis版本是3.2.2。
2013-07-13 20:43:00
40903
4
原创 深入浅出Mybatis-分页
Mybatis的分页功能很弱,它是基于内存的分页(查出所有记录再按偏移量和limit取结果),在大数据量的情况下这样的分页基本上是没有用的。本文基于插件,通过拦截StatementHandler重写sql语句,实现数据库的物理分页。本文适配的mybatis版本是3.2.2。
2013-07-07 21:25:19
175451
99
原创 深入浅出Mybatis-插件原理
Mybatis采用责任链模式,通过动态代理组织多个拦截器(插件),通过这些拦截器可以改变Mybatis的默认行为(诸如SQL重写之类的),由于插件会深入到Mybatis的核心,因此在编写自己的插件前最好了解下它的原理,以便写出安全高效的插件。代理链的生成Mybatis支持对Executor、StatementHandler、PameterHandler和ResultSetHandler进行
2013-07-04 22:48:24
66789
6
原创 深入浅出MyBatis-Sqlsession
前面的章节主要讲mybatis如何解析配置文件,这些都是一次性的过程。从本章开始讲解动态的过程,它们跟应用程序对mybatis的调用密切相关。本章先从sqlsession开始。创建正如其名,Sqlsession对应着一次数据库会话。由于数据库回话不是永久的,因此Sqlsession的生命周期也不应该是永久的,相反,在你每次访问数据库时都需要创建它(当然并不是说在Sqlsession里只能执
2013-07-03 22:20:01
129252
4
原创 深入浅出MyBatis-MapperBuilder
上一章节说道,解析mybatis的配置文件的最后一步是解析mapper元素。每个mapper元素对应一个mapper配置文件,这一章节就来讲讲这个mapper配置文件是如何解析的。Mapper文件里有什么mapper配置文件是配置sql映射的地方,它看起来就像下面这个样子: <cache type="PERPETUAL" eviction="LRU" flushInterva
2013-06-14 22:16:12
36164
2
原创 深入浅出MyBatis-Configuration
Configuration是干嘛的Configuration就像是Mybatis的总管,Mybatis的所有配置信息都存放在这里,此外,它还提供了设置这些配置信息的方法。Configuration可以从配置文件里获取属性值,也可以通过程序直接设置。Configuration里可供配置的属性有:1. properties属性 1) 配置示例 2
2013-06-12 20:35:31
49095
2
原创 深入浅出MyBatis-快速入门
简介MyBatis的前身叫iBatis,本是apache的一个开源项目, 2010年这个项目由apache software foundation 迁移到了google code,并且改名为MyBatis。MyBatis是支持普通SQL查询,存储过程和高级映射的优秀持久层框架。MyBatis消除了几乎所有的JDBC代码和参数的手工设置以及结果集的检索。MyBatis使用简单的XML或注解用
2013-06-09 21:28:46
197445
7
原创 Linux上完美安装memcache(含自启动)
一、安装依赖库libevent1.进入/usr/lib目录,使用命令:ls -al libevent 查看是否已安装,如果已安装且版本低于2.0.21,则先通过:rpm -e libevent —nodeps 进行卸载。2.上传libevent-2.0.21-stable.tar.gz至非usr目录下(因为libevent将安装到usr目录,所以最好换个目录存放安装文件,例如/home),
2013-06-06 21:26:03
14804
转载 linux下mysql的卸载、安装全过程
卸载mysql1、查找以前是否装有mysql命令:rpm -qa|grep -i mysql可以看到mysql的两个包:mysql-4.1.12-3.RHEL4.1mysqlclient10-3.23.58-4.RHEL4.12、删除mysql删除命令:rpm -e --nodeps 包名( rpm -ev mysql-4.1.12-3.RHEL4.1 )3
2013-05-09 22:31:03
2073
原创 在同一个硬盘之中安装windows、linux、solaris三系统的方法
最近出于工作需要,在dell 台式机上成功安装了windows xp、RedHat as 5.4、solaris 10.8三个操作系统,过程非常艰辛,也付出了沉重代价(装solaris 的时候把整个硬盘都格式化了,数据全部丢失,还好重要数据都备份了,否则我真的只有去见上帝了)。为了让有同样需要的朋友不至于像我一样付出沉重代价,我把安装过程描述一下,也免得自己以后再装三系统时忘了。我的电脑配
2010-04-22 13:42:00
4324
用Excel体验神经网络的计算过程
2025-05-07
用Excel体验梯度下降法
2025-05-07
mybatis完整工具包(含分页、sql自动生成、cache改造等)完全免费
2013-11-25
mybatis自动sql生成插件源码
2013-07-13
mybatis分页源码
2013-07-07
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人