自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(32)
  • 资源 (11)
  • 收藏
  • 关注

原创 多个索引干扰导致索引失效如何解决

因此,即使没有启用查询缓存,由于上述机制的存在,第二次查询仍然可以更快。如果查询的数据已经在操作系统缓存中,那么第二次查询可以直接从内存中读取数据,而不需要访问磁盘。第二次执行相同的查询时,数据库可以直接重用已有的执行计划,减少了解析和优化的时间。当查询再次执行时,如果所需的数据已经存在于缓冲池中,则不需要从磁盘读取,这样可以显著加快查询速度。当索引被首次使用时,其部分或全部可能被加载到内存中,后续查询可以直接利用缓存的索引来定位数据,从而加速查询。现在业务的需求是,查询半年内,已支付订单状态的总数。

2024-09-09 00:36:18 1144

原创 SQL优化:执行计划详细分析

如果可能的话,尽量确保参与连接的表都有有效的索引,尤其是对于连接条件中的列。因此,“Using index”通常指的是MySQL正在使用索引,但是否是覆盖索引取决于查询是否只需要索引中的列。如果查询条件涉及到索引中的列,并且查询选择的结果集也完全包含在这个索引中,那么它就是覆盖索引的一个例子。在一个包含复合索引的表上执行查询时,如果WHERE子句中的条件涉及到该索引的前缀字段,MySQL就可以利用索引下推技术在存储引擎层直接对索引进行筛选,从而减少需要返回给服务器层的数据量。这可能会影响到执行顺序。

2024-09-09 00:34:51 2121

原创 逐行讲解Transformer的代码实现和原理讲解:nn.Linear线性层原理

经过Transformer的12个块处理完之后,4批文本数据得到了一个矩阵[4, 8, 16],也就是每批数据都训练出了一个结果,在训练阶段,这个结果的作用是跟目标标签计算损失值,然后通过反向传播更新各个权重向量;在推理阶段就是输出每个字的向量表,目的是拿着这个向量表计算一个概率值,最大概率值就是输出结果了。【训练数据】【线性变换数据】想象一下你在玩一个很长的流水线游戏。在这个游戏中,你有一个球,你需要通过一系列的障碍物来让这个球到达终点。

2024-09-07 11:34:44 1415

原创 逐行讲解Transformer的代码实现和原理讲解:计算交叉熵损失

通过计算交叉熵损失并传入重塑后的张量,我们能够得到一个能够反映整个批次和序列预测准确性的单一损失值。这个损失值会被用于模型的训练过程,通过反向传播算法更新模型参数,从而提高模型对未来数据的预测能力。

2024-09-07 11:31:03 790

原创 LLM模型:代码讲解Transformer运行原理

为什么要取最后一个时间步,而不取所有的。假设我们有一个简单的文本生成任务,目的是根据前面的文本生成下一个词。为了简化讨论,我们假设词汇表只有几个词,比如。实际数据示例假设我们的输入序列是,我们希望模型根据这个序列生成下一个词。为了说明这一点,我们可以构造一个简单的示例。构造示例数据词汇表假设词汇表为。编码映射我们需要将词汇表中的每个词映射到一个整数。例如:'how' -> 2'are' -> 3'you' -> 4输入序列输入序列为,对应的编码序列为[0, 1]。构造张量。

2024-09-07 10:50:16 1460

原创 逐行讲解Transformer的代码实现和原理讲解:多头掩码注意力机制

通过计算查询向量和键向量之间的点积,我们得到了一个标量值,该值反映了这两个向量在多大程度上指向相同的方向。比如在训练“我喜欢范冰冰”这句话的时候,在预测我字的时候,需要根据我字预测下一个字,这个时候喜字是不能让模型看见的,比如模型预测出了我喜两个字以后,欢字是不能让模型看见的。假设我们有一个未归一化的得分向量 z=[1.0,2.0,3.0]z=[1.0,2.0,3.0],代表三个类别的得分。最终的矩阵维度是【第一个矩阵的行,第二个矩阵的列】。设向量 A = [2, 3],向量 B = [4, -1]。

2024-09-04 23:56:23 1105

原创 逐行讲解Transformer的代码实现和原理讲解:前馈神经网络

经过Transformer的12个块处理完之后,4批文本数据得到了一个矩阵[4, 8, 16],也就是每批数据都训练出了一个结果,在训练阶段,这个结果的作用是跟目标标签计算损失值,然后通过反向传播更新各个权重向量;在推理阶段就是输出每个字的向量表,目的是拿着这个向量表计算一个概率值,最大概率值就是输出结果了。【训练数据】【线性变换数据】想象一下你在玩一个很长的流水线游戏。在这个游戏中,你有一个球,你需要通过一系列的障碍物来让这个球到达终点。

2024-09-04 23:55:55 1296

原创 逐行讲解Transformer的代码实现和原理讲解:层归一化原理

内部协变量偏移是指当模型训练时,前面层的参数更新会导致后续层接收的输入分布发生变化,这使得网络难以学习。为了解决这些问题,提出了多种归一化技术,比如批量归一化(Batch Normalization)、实例归一化(Instance Normalization)、层归一化(Layer Normalization)等。这里我们只关注第一个样本的第一个时间步,其余部分的计算类似。,即有两个样本,每个样本有三个时间步,每个时间步有四个特征。可以看到,每个样本的每个时间步的特征都被归一化了。接下来,我们创建一个。

2024-09-04 23:35:20 608

原创 逐行讲解Transformer的代码实现和原理讲解:Token、向量化、位置向量运算

3vocab_size = len(word_to_idx) # 词汇表大小为44embedding_dim = 3 # 假设每个词的嵌入维度为3。

2024-09-03 22:12:37 1706

原创 AI生成图片,ChatGPT生成路虎女逆行打人插图。

图片3:路虎女下来打了男司机的脸蛋。图片2:逆行路虎女跟别人发生追尾。图片1:一个女的开着路虎车逆行。

2024-09-01 15:12:14 887

原创 基于Transformer架构训练LLM大语言模型:Transformer架构工作原理

它允许模型在给定一个序列的情况下,计算出序列中每个元素(如单词)与其他元素之间的关系。这种关系通过一个权重矩阵来表示,这个权重矩阵决定了在生成某个位置的输出时,应该更多地考虑哪些输入位置。多头注意力通过将上述过程重复多次来增强模型的能力,每次使用不同的线性变换(不同的权重矩阵)。最终,所有头的输出被拼接在一起,并通过一个额外的线性变换得到最终的输出。- 最后,经过一系列编码器和解码器层后的输出会通过一个softmax层,生成一个概率分布,表示模型对于给定输入最可能的输出预测。

2024-09-01 12:54:30 1383

原创 MYSQL整体架构以及SQL执行流程

处理数据的物理存储。:虽然在MySQL 8.0中已经移除了全局查询缓存,但在一些情况下,如使用了内存表或特定的缓存插件,仍然可能存在某种形式的缓存机制。:根据优化后的执行计划,MySQL执行器开始执行查询。:在较旧版本的MySQL中存在,用于缓存查询及其结果。:MySQL服务器接收到SQL查询后,会先对其进行语法解析,确保SQL语句符合MySQL的语法规则。例如,如果一个查询涉及多个表的连接,优化器会确定最有效的连接顺序。:查询结束后,MySQL会释放分配给该查询的资源,并且在适当的时候断开客户端连接。

2024-08-31 15:01:36 1268

原创 【原理篇】通俗理解LLM大语言模型的原理,训练一个女朋友

不需要任何算法、编程技术就可以理解LLM大语言模型的原理。比如输入一个“范”字,输出“范冰冰”三个字。女朋友:我们做一些我们爱做的事情吧。我:是啊,我们要干点啥好呢。女朋友:老公,你回来了啊。

2024-08-30 02:10:01 283

原创 【实践篇】ChatGLM3-6B AI大模型的部署、微调训练智能客服

修改/mnt/workspace/apps/ChatGLM3/basic_demo/cli_demo.py,将默认的THUDM/chatglm3-6b修改为你的模型地址,比如我的是/mnt/workspace/models/chatglm3-6b。--model_name_or_path /mnt/workspace/models/chatglm3-6b: 指定预训练模型的位置。如果输入序列超过此长度,会被截断。--per_device_train_batch_size 2: 每个设备上的训练批次大小。

2024-08-29 01:44:52 1437

原创 【实践篇】AI Tools工具开发,通过Tools调用业务系统API

通过智能客服对话方式,理解客户的对话需要调用的API接口。代码:上面视频中有介绍。

2024-08-29 00:02:52 358

原创 【AI实践篇】使用JAVA、python从0到1实现AI知识库(简单文件版)

代码实现的详细讲解和代码获取方式请查看视频。AI知识库原理讲解、一步步调试JAVA实现AI知识库。(可以获取源码)_哔哩哔哩_bilibiliAI知识库原理讲解、一步步调试Python实现AI知识库。(可以获取源码)_哔哩哔哩_bilibili一 JAVA实现二 原理:使用余弦相似度查找匹配的文本三 python实现

2024-08-28 01:39:40 328

原创 实践篇 : AI编码辅助插件的安装和使用

支持 Java、Python、Go、JavaScript、TypeScript、C/C++、C# 等主流语言,同时兼容 Visual Studio Code、JetBrains IDEs 等主流编程工具。生成单测、生成注释、代码优化、代码解析、代码补全、bug排错。函数注释和行注释分开生成。JAVA、C++、Python、JAVASCRIP等。JAVA、C++、Python、JAVASCRIP等。JAVA、C++、Python、JAVASCRIP等。JAVA、C++、Python、JAVASCRIP等。

2024-08-25 23:43:48 936

原创 实践篇:AI大模型的Prompt提示词的结构和技巧

请根据以上$$之间的注意内容,将以下提供的翻译原文从中文翻译成英文,专业词汇要翻译准确,重要词汇不能删减。请根据以上$$之间的注意内容,并分析翻译结果。然后深度校正以上翻译,专业词汇要翻译准确,重要词汇不能删减。请写一篇作文——》请写一篇关于秋天的作文——》请以莫言的风格写一篇关于秋天的作文——》。我是一名三年级的小学生,请以李白的风格写一篇关于秋天的作文,要求100字以内。你是一个具有20年翻译经验的团队,精通中英双语,并拥有丰富的跨学科知识。例如我是一名小学生、中学生、大学生、医生、律师。

2024-08-25 22:06:50 366

原创 实践篇 : AI生成图片、AI精准翻译、AI情感分析

一定要注意专业术语和准确性,语句要通俗易懂、流畅、严谨,请优化以上翻译并重新输出。、根据对话内容进行情感分析,输出客服和客户的情感等级,分为七个等级:非常负面、负面、轻微负面、中性、轻微正面、正面、非常正面。之间的注意内容,将以下提供的翻译原文从中文翻译成英文,专业词汇要翻译准确,重要词汇不能删减。之间的注意内容,将以下提供的翻译原文从中文翻译成英文,专业词汇要翻译准确,重要词汇不能删减。之间的注意内容,并分析翻译结果。年经验的资深电子工程师,将以下中文翻译英文,专业词汇要翻译准确,重要词汇不能删减。

2024-08-25 15:06:22 913

原创 AI大模型底层原理 — 概念篇

DALLE、SORA、Midjourney、Stable Diffusion等。AI大模型其实就是一个或者多个模型文件,3)AI大模型是如何一步步训练的?文件内容=权重参数 + 向量数据。1.1.3 LLM大模型训练过程。【通过本章学习可以掌握】1.1.1 单模态大模型。1.1.2 多模态大模型。1)什么是AI大模型?2)有哪些AI大模型?

2024-08-25 14:59:18 784

原创 MYSQL的SQL解析器和预处理器原理

SQL解析器的主要作用是将SQL语句转换为可以被数据库引擎理解的形式。这一过程包括词法分析、语法分析、语义分析和代码生成几个阶段。1.2 SQL解析器的工作过程。1 SQL解析器原理。

2024-08-21 00:51:01 489

原创 MYSQL缓存查询原理和优缺点

MYSQL缓存查询的过程、优缺点。

2024-08-19 00:09:54 1079

原创 IntelliJ IDEA和的JDK下载、安装、配置

提取码: 9527下载JDK(官网地址。

2024-08-18 02:55:01 539 2

原创 Mysql5.7 绿色版安装

1、配置环境变量MYSQL_HOME=D:\soft\mysql-5.7.36-winx64PATH加上%MYSQL_HOME\bin2、配置my.ini到D:\soft\mysql-5.7.36-winx64下新建my.ini[mysql]default-character-set=utf8[mysqld]port = 3306basedir=D:/soft/mysql-5.7.36-winx64datadir=D:/soft/mysql-5.7.36-winx64/dat

2024-08-14 23:37:29 686

原创 JAVA动态静态代理

1、

2020-03-17 01:47:27 125

原创 SpringBoot源码解析之SpringApplication构造函数初始化过程

过程解析我们的程序执行到SpringApplication.run()时,第一步就是先调用SpringApplication的构造函数,入参就是带了@SpringBootApplication注解的启动类。我们主要是看initialize里面做了什么。SpringApplication(Object... sources)// sources就是带了@SpringBootApplicat...

2020-02-26 23:17:52 385

原创 SpringBoot源码解析之创建应用程序上下文

SpringApplication.createApplicationContext() /**判断是否是WEB环境,是的话实例化AnnotationConfigEmbeddedWebApplicationContext作为应用程序上下文 反之取AnnotationConfigApplicationContext作为应用程序上下文 */ ——》contextCla...

2020-02-26 00:14:26 406

原创 Zookeeper总结与源码解析

1、

2020-02-17 23:49:06 210 1

原创 Hbase总结

简要1、Mysql里面的高表宽表在Hbase里面可以用横向切分和纵向切分。横向切分是放在多个Region里面的,纵向切分是放在多个文件夹里面的,Region我们称之为切片。2、列名、表名等元数据信息放在HMaster里面,数据放在RegionServer里面。分区按照RowKey的规则来进行分区。逻辑上分为RowKey、Column Family、Column Qualifier、Time...

2020-02-16 23:28:03 264

原创 Spark Shuffer机制

1、概要1)、从Stage划分,最后一个Stage称为ResultStage,前面被称为ShufferMapStage,一个ShufferMapStage结束会有一个写磁盘操作。2)、Spark Shuffer分为Map和Reduce阶段,跟MapReduce不一样,有Map程序和Reduce程序3)、ResultStage结束了,Shuffer一定会有读写磁盘,一个Job的运行就结束...

2020-02-09 23:18:08 482

原创 spark Yarn部署流程解析,核心运行机制

1、提交流程图提交流程文字说明:1、执行bin/spark-submit命令后,Client会组装commnd命令到yarn集群的ResourceManager。commnd命令:bin/java org.apache.spark.deploy.yarn.ApplicationMaster,如果非集群模式就是bin/java org.apache.spark.deploy.yarn...

2020-02-08 17:20:13 879

原创 一问一答闲谈redis

1、一个KEY过期了,redis是怎么处理的?redis不会主动去轮询过期的KEY,这个KEY一直存留在redis占着内存,只有在使用到KEY的时候才会查询KEY是否过期。过期了就会清除这个KEY并释放内存;同时redis还有一种主动内存回收机制,在redis.conf配置文件的最后有一个配置项zh,默认是zh=10,意思是1秒钟轮询10次,每次抽取100个KEY检查是否过期,如果过期了就...

2017-03-11 21:56:31 340

LinuxC函数详解.pdf

LinuxC函数详解.pdf

2008-08-25

搜索引擎的研究与实现(Java)(含源码)

搜索引擎的研究与实现(Java)(含源码)

2008-08-25

c函数速查.chm

c函数速查,chm格式

2008-08-25

学生选课系统c语言版

学生选课系统c语言版

2008-08-25

Hibernate_api.chm

Hibernate_api.chm

2008-04-29

struts2-API.chm

struts2的API

2008-04-29

正则表达式系统教程

正则表达式系统教程,很有用的资料

2008-02-21

深入UTF8字符编码

深入UTF8字符编码

2008-02-21

Java记事本源代码

Java记事本源代码

2008-02-21

Ant使用指南.pdf

Ant使用指南.pdf

2008-01-11

JDOM_API.CHM

操作XML文件的第三方包的API

2008-01-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除