- 博客(89)
- 收藏
- 关注
原创 大模型剪枝、量化、蒸馏的区别和联系
大模型剪枝(Pruning)、量化(Quantization)、知识蒸馏(Knowledge Distillation)是三种主流的模型压缩与优化技术。
2025-03-13 18:44:14
319
原创 深度学习正则化技术之权重衰减法、暂退法(通俗易懂版)
影响模型泛性的因素有?什么是正则化技术?有什么用?权重衰减——限制参数“放飞自我”。暂退法——神经元随机装傻。
2025-03-13 09:58:42
1166
原创 MaxKB本地部署向量数据库出现HeaderTooLarge报错
重新下载模型文件,关闭虚拟机,扩容(本地部署最好是100G——MaxKB官网推荐,我属于没注意导致后面一直扩),再添加模型;
2025-02-17 18:22:42
334
原创 MaxKB本地部署celery_default is stopped
MAxKB本地部署,运行main.py start时候正常,登陆就会500,后端显示celery_default is stopped。说明系统中没有安装 grpcio 模块。3、再次运行后端就会正常了!
2025-02-14 10:11:30
457
1
原创 BuildAdmin使用CRUD后重新发布出错解决办法
为避免重新部署项目和改变项目结构,在自己的开发环境下进行同样的CRUD操作,点击内置终端的重新发布,然后将重新上传上面public目录下的文件就可以了。
2025-01-09 10:24:49
193
原创 我的创作纪念日
虽然是计算机专业,但由于个人的懈怠、不求甚解,所以临近毕业设计了我竟然不知道怎么着手做一个简单的毕设,甚至连服务器后端前端的概念都是模糊的,我开始看相关的书籍和视频并开始动手做,开始写博客是为了记录这个过程并鼓励自己,但是同时正是这个从一头雾水到慢慢的懂一些的过程让我更加深刻地意识到:无论多么简单的东西,总会有人不懂的,也不好意思去问,只能自己苦苦摸索,相当浪费时间,比如我自己,所以我坚持写博客的一个重要原因是总会有人需要的!希望我可以在开发上更进一步,挑战更多困难,能力再提升一些,摆脱菜鸟身份!
2025-01-08 11:21:55
376
原创 uniapp实现在card卡片组件内为图片添加长按保存、识别二维码等功能
在原card组件的cover属性添加图片的话,无法在图片上面绑定 show-menu-by-longpress="true"属性,通过将图片自定义添加可使用该属性。
2025-01-07 18:35:05
449
原创 MySQL学习4之备份策略、缓存机制、日志刷新策略、EXPLAIN命令
EXPLAIN命令是 MySQL 中一个非常有用的工具,用于分析和优化 SQL 查询。通过使用EXPLAIN获得有关查询执行计划的详细信息,从而帮助用户理解 MySQL 如何执行查询以及如何优化查询性能。通过使用EXPLAIN并根据输出进行优化,可以显著提高查询性能。使用索引如果列显示了多个可能的索引,但key列显示了没有使用索引,则考虑添加或优化索引。减少全表扫描如果type列显示为ALL,则表示 MySQL 正在扫描整个表以找到匹配的行。考虑使用索引以减少扫描范围。优化查询如果Extra列显示或。
2024-08-15 15:33:17
730
1
原创 深度学习碎碎念——碎片知识2
假设训练了一个模型来预测天气,使用过去几年的数据来训练模型,但随着时间的推移,气候变化导致某些因素(如温度、湿度等)与天气之间的关系发生了变化,这意味着即使温度和湿度的分布没有变化,它们与天气的关系可能已经改变了,这就是概念偏移。学习如何区分苹果和橙子。如果训练模型时使用的苹果和橙子的比例是 50:50,但在实际应用中,苹果和橙子的比例变成了 80:20。深度学习框架可以自动计算导数:我们首先将梯度附加到想要对其计算偏导数的变量上,然后记录目标值的计算,执行它的反向传播函数,并访问得到的梯度。
2024-08-15 11:06:20
822
原创 MySQL学习3之锁机制
锁粒度(Lock Granularity)是指在数据库中锁定数据资源的最小单位。锁粒度决定了锁定操作的范围,即锁定的是整个数据库、整个表、表中的某个分区、表中的某一页还是表中的某一行。在MySQL中常见的锁粒度有:表级锁、行级锁、页级锁。因为更细粒度的锁可以允许更多的并发事务访问不同的数据资源,所以锁粒度越小,锁的竞争越小,并发性能越高,锁管理的开销越大。合理选择锁粒度可以帮助平衡锁的竞争和并发性能,从而提高数据库的整体性能。
2024-08-14 18:55:41
1194
原创 MySQL学习2之事务ACID特性以及实现机制
MySQL数据库事务有四大特性,简称为ACID,分别是原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)、持久性(Durability),共同确保了数据库事务的正常执行,保证了事务的一致性和可靠性。原子性是指事务的语句为一个整体,要么全部执行成功,要么全部不执行(存在命令执行出错,数据全部回滚到事务开始执行前的状态),进而保证数据的一致性和可靠性。例子:银行需要办理用户A向用户B转账1万元的业务,需要A扣款1万元,B增加1万元,当A扣款成功后,B入账1万元出现问题,
2024-08-14 15:10:34
1256
原创 MySQL学习1
MySQL 中的索引是一种特殊的文件结构,使得数据库能够快速定位到数据表中的特定记录,从而提高数据检索的速度。更改了一个部门的ID,所有员工表中旧部门ID的记录自动更新为新的部门ID——这叫做级联更新(ON UPDATE CASCADE)。从部门表中删除一个部门时,所有属于该部门的员工记录也将被自动删除——这叫做级联删除(ON DELETE CASCADE)。:如果删除或更新部门,那么员工表中相关的部门ID会被设为预定义的默认值。:如果删除或更新部门,那么员工表中相关的部门ID会被设为NULL。
2024-08-13 18:33:31
753
原创 协同过滤之矩阵分解算法问题详解
因为用户隐向量和物品隐向量在同一个坐标系中,所以可以通过计算距离和点积操作确定用户偏好和物品的契合程度,距离越近说明契合程度越高,用户对物品的潜在兴趣就越高。用户-物品评分矩阵 R 是一个 m×n的矩阵,其中 m 是用户数量,n 是物品数量。这些隐向量通常位于一个低维空间中,上面生成了m个用户隐向量和n个物品隐向量,它们每个隐向量都有k维,每个维度可以看作是一种潜在的特征或兴趣维度,矩阵分解的目标是找到两个低秩矩阵U 和 I,其中 U 是用户隐向量矩阵,I 是物品隐向量矩阵,使得 R=U*(I的转置矩阵)
2024-08-09 16:53:40
454
原创 四种推荐算法——Embedding+MLP、Wide&Deep、DeepFM、NeuralCF
最经典的是输入用户和物品id,转化成One-hot编码后经过简单的Embedding后生成稠密向量,然后将用户塔和物品塔拼接一起,送进MLP层中充分交叉,获取更高阶的特征,然后输出。提出的Wide&Deep是比较经典的一个深度学习模型,它使模型既具有想象力又具有记忆力——线性模型(Wide)使模型既具有记忆力和深度神经网络(Deep)使模型既具有泛化性。可以简单地理解成对商品或者是特征之间成对出现的一种学习,由于用户的历史行为特征是非常强的特征,特征之间的直接线性关联,对于特征间的简单关系很有效。
2024-08-07 15:44:56
2118
原创 深度学习碎碎念——碎片知识1
因为神经网络的工作原理就是通过权重和偏置计算数据,所以不断训练每一层神经网络连接层上的权重和偏置直到找到最合适的可以更好拟合训练数据的参数们,该神经网络就可以将没识别过的数据计算后较为准确判断。)是一种常用的损失函数,尤其适用于分类问题,包括二分类和多分类任务,用来衡量两个概率(真实数据概率分布和预测概率分布)分布之间的差异,差距越小则交叉熵越小,用来指导梯度下降优化模型。多分类问题的输出层——输出一个概率分布——通常与交叉熵损失函数一起使用,以评估模型预测的概率分布与真实标签之间的差异。
2024-08-07 15:15:17
1169
1
原创 TensorFlow和Pytorch是什么?干什么用的?
定义输入:确定模型的输入维度,即特征的数量。定义神经网络层:使用框架提供的层(如或 PyTorch 的nn.Module)来构建模型架构。这包括选择合适的层类型(如全连接层、卷积层、循环层等),以及设置层的参数(如激活函数、输出维度等)。
2024-08-07 15:00:03
847
原创 One-hot编码和Multiple-hot编码
在推荐系统和机器学习中,我们通常会遇到两种类型的编码方式:One-hot 编码和 Multiple-hot 编码(有时也称为 Multi-hot 编码)。这两种编码方式用于将分类数据转换为数值表示,以便机器学习模型能够处理这些数据。
2024-08-07 14:54:49
1052
原创 三种向量相似度计量方法——欧式距离、余弦相似度、皮尔逊相关系数
余弦相似度是一种衡量两个非零向量方向之间夹角余弦值的方法, 衡量的是两个向量之间的角度相似度,较大的值意味着更高的相似度。余弦相似度的取值范围[ -1,1 ],其中 1 表示完全相同的方向,-1 表示完全相反的方向,0 表示两个向量正交。例如,两个用户对很多物品的评分都很接近,那么他们之间的欧氏距离就小,说明他们的兴趣相似。:在聚类问题中,将数据分成不同的组或簇。:需要对一个新的样本进行分类时,我们会计算新样本与所有训练样本之间的欧氏距离,然后选择距离最近的K个邻居,根据这些邻居的类别来决定新样本的类别。
2024-08-07 14:48:03
850
原创 协同过滤推荐算法(包括传统协同过滤、矩阵分解、NeuralCF)
协同过滤推荐算法传统的协同过滤(Collaborative Filtering, CF)是一种推荐系统技术,它基于用户的历史行为数据来预测用户对未评分项目的潜在兴趣。协同大家的反馈、评价和意见一起对海量的信息进行过滤,从中筛选出用户可能感兴趣的信息”。传统协同过滤有两种主要的方法:用户-用户协同过滤(User-based Collaborative Filtering, UCF)和项目-项目协同过滤(Item-based Collaborative Filtering, ICF)。二。
2024-08-07 14:40:48
971
原创 Embedding技术之Graph Embedding
Graph Embedding用于处理互联网中的图数据——社交网络、知识图谱、行为关系类型图数据。DeepWalk是一种用于学习图(网络)中节点的低维向量表示(即节点嵌入)的算法。DeepWalk的核心思想是利用随机游走(Random Walk)来生成节点的序列,这些序列类似于自然语言处理中的句子。然后,这些序列被用作输入到一个类似 Word2Vec 的模型中,以学习每个节点的向量表示。DeepWalk可以被看作连接序列embedding和graph embedding之间的过渡方法。
2024-08-07 13:07:39
699
原创 Embedding技术之Word Embedding
或Skip-gram模型来训练词向量,将词映射成d维稠密向量:其中CBOW是采用词的上下文来预测该词,而Skip-gram则是采用词来预测其上下文。所谓静态向量指的是一旦训练完成后,对应的向量便不再发生改变,比如一个词经过向量化之后,在后续的场景中该词对应的向量不会发生改变。通过这种方式,FastText能够学会即使是从未见过的新词的表示,因为它可以根据词内部的常见模式来推断新词的意义。一个词的最终嵌入向量是其自身的嵌入向量加上所有n-grams嵌入向量的平均值。词和n-grams的嵌入。
2024-08-07 11:50:00
506
原创 什么是Embedding?用来干什么?(通俗易懂版)
真正有意义的是这些向量(Embedding)之间的相对位置和它们之间的关系,而不是具体的向量值本身。(3)通过计算用户和物品的Embedding相似度,Embedding可以直接作为推荐系统的召回层或者召回策略之一,通过计算物品和物品的Embedding相似度,得到物品的相似推荐。是一种把一些难以处理的离散对象(比如文字、图片、声音等)转化为计算机容易理解的形式——数值向量,便于数学运算和机器学习模型的处理的技术。稀疏特征向量通常具有很高的维度,即使大多数维度上的值为零,增加了模型的学习难度。
2024-08-07 11:39:16
544
原创 为什么深度学习的结构特点不利于稀疏特征向量的处理?
稀疏特征向量的特点高维性:稀疏特征向量有很多维度,但大多数维度上的值为零。 稀疏性:向量中只有少数几个维度上有非零值。深度学习模型的特点密集连接:深度学习模型中的神经元通常与前一层的所有神经元相连。 权重共享:某些模型(如卷积神经网络)在不同位置共享权重。深度学习模型处理稀疏特征向量的挑战计算效率低下:大量的零值导致计算资源的浪费。 模型复杂度过高:高维性可能导致模型过于复杂,难以训练。 信息丢失:稀疏性可能导致模型难以学习到足够的信息。解决方案特征降维:使用 PCA 等方法减
2024-07-30 16:43:35
307
原创 机器学习中Spark数据处理和Embedding技术的区别与联系
综上所述,Spark的数据处理结果是直接从原始数据中提取出的高维稀疏向量,Embedding技术是将这种初步加工过的高维稀疏向量转化成低维稠密向量,使特征向量具有更强的表达力,并且会捕捉更多我们注意不到的潜在联系。Embedding 技术旨在将高维稀疏向量转换为低维稠密向量,以捕捉原始数据中的潜在联系,并提高特征向量的表达力。Spark 的数据处理主要用处是将原始数据转换成适合机器学习模型使用的格式。数据处理的结果通常是高维稀疏向量,这些向量可以作为机器学习模型的输入。
2024-07-30 15:58:01
438
原创 YCSB基准测试
使用语句./bin/ycsb load mongodb -s -P workloads/workloadc -threads 32结果出现。具体来说,错误发生在尝试使用ASCII编码来解码包含非ASCII字符(在这里是0xe4,对应于一个非英语字符)的输出时。加载吞吐量[OVERALL], Throughput(ops/sec)突然变成0的情况。函数,以使用UTF-8编码进行解码,而不是默认的ASCII编码。来指定使用UTF-8编码进行解码。下载成功后,加载数据,运行。
2024-06-26 16:35:32
414
原创 什么是分布式架构?
分布式架构是现代软件工程中一个非常核心的概念,特别是在互联网、大数据和云计算领域。分布式架构指的是将一个应用程序分解为多个相互协作的组件或服务,这些组件或服务运行在不同的计算机或服务器上,通常通过网络进行通信。
2024-06-19 16:53:39
768
原创 Redis之主从复制和集群是什么?它们有什么关系?
其他的Redis服务器作为从节点作为从节点(slave),负责读操作。主节点和从节点的关系是一对多,数据只能从主节点单项复制到从节点。(Master-Slave Replication)是Redis提供的一种数据冗余和读写分离的技术。总的来说,主从复制侧重于单个实例的数据冗余和读写分离,而集群则侧重于整个系统级别的数据分布和高可用性。Redis集群是一种水平扩展技术,旨在解决单个Redis实例的内存和并发限制。通过修改配置文件redis.conf实现配置从节点(默认为主节点,主节点无需配置)。
2024-06-19 16:50:09
607
原创 初识Redis数据库(通俗易懂版)
更准确地说,Redis是一种数据库服务器,Redis提供原子操作、事务、LIFO(Last In First Out)队列、发布订阅(pub/sub)模式、持久化机制、数据复制、主从架构、集群等功能,使其成为一个多功能的数据库,不仅仅存储数据。:Redis不仅能像普通笔记本那样储存简单的笔记(字符串),还可以保存联系人信息(哈希)、待办事项列表(列表)、好友圈(集合)、成绩排名(有序集合),甚至能画出你的旅行路线图(地理空间索引)。而且,它还可以组成团队工作(集群),大家分工合作,让系统更加稳定和强大。
2024-06-19 15:20:31
516
原创 如何在购买的服务器上进行开发工作?
这通常涉及到使用文本编辑器或IDE编辑源代码文件,然后使用命令行工具或IDE内置的功能运行和调试代码。如果项目代码尚未上传,需要将本地代码推送到服务器,或者直接在服务器上创建和编辑文件。以上步骤可以根据具体的开发流程和技术栈有所变化,但总体而言,这个流程涵盖了从连接服务器到部署应用的基本过程。部署后,要监控应用的运行状态,确保一切正常,并及时处理任何问题。在整个开发过程中,应记录关键步骤、决策和遇到的问题及解决方案,以便于未来的参考和团队协作。一旦代码开发和测试完成,可以将应用部署到服务器上。
2024-06-19 15:16:27
455
原创 如何在MobaXterm上创建以及删除自己的用户和目录?
用户的信息,则该用户仍然存在于系统中,此时执行删除命令是安全的。如果命令显示用户不存在,则说明用户可能已经被删除,或者根本不存在。: 如果你还想删除与用户相关的家目录、邮件队列和其他文件,可以使用。创建成功后可通过id username命令查看用户是否存在!一旦你输入了正确的密码,终端会切换到该用户的身份。(switch user)命令允许你切换到另一个用户账户。在这个命令之后,系统会提示你输入目标用户(在删除用户之前,最好先。
2024-06-19 11:40:10
1577
原创 MySQL数据库入门之视图、存储过程、触发器
如果不使用存储过程,每次需要计算时,都需要手动写SQL语句去查找该用户的所有订单,然后对每个订单的金额进行求和。规则,当特定事件发生(如对表的增、删、查、改,事务的结束),对规则的条件进行检查,如果条件成立就执行规则中的动作,通常是一段SQL存储过程。它不实际存储数据,而是根据用户定义的SQL查询动态生成的结果集,具体数据存储在基本表中,所以基本表中的数据改变),视图数据改变,但是通过视图对数据进行。,可以看到自己感兴趣的数据,视图始终是定义在基本表上的,所以对视图的所有操作最终都是向对应的基本表的操作。
2024-05-22 11:17:22
898
原创 数据库MySQL 、 Oracle 和 Redis对比
一、MySQL类型:关系型数据库管理系统,遵循SQL标准。 数据存储:数据存储在硬盘上,支持InnoDB等存储引擎,具有事务处理能力。 应用场景:适合需要复杂查询、事务处理和数据一致性的应用,如网站后端、内容管理系统、电子商务等。 优点:免费开源、易于部署和使用、社区活跃、支持多种操作系统和平台、良好的文档和第三方工具生态。 缺点:相比NoSQL数据库(Not Only SQL数据库是一种非关系型数据库的统称),在处理大规模并发读写或非结构化数据时可能效率较低。二、Oracle类型:也是一
2024-05-22 10:03:01
1492
原创 SpringBoot学习之SpringBoot是什么?有哪些优势?(通俗易懂版)
SpringBoot是一个基于Spring 框架的快速开发应用程序的开源框架,简化了Spring应用的初始搭建和开发过程。使用了特定的方式进行配置使开发人员不再需要定义样板化的配置,使用最少的配置以最快的速度启动和运行Spring项目。SpringBoot的核心原则是“约定优于配置”,"约定优于配置"是一种软件开发的设计理念,它的核心思想是减少开发人员需要进行的显式配置,通过一套预设的、合理的默认规则(即“约定”)来指导软件的结构和行为。
2024-05-18 00:50:46
545
原创 Java面试之抽象类和接口
Java的一个重要特性就是抽象,抽象是指将具体的事物抽象成更一般化、更抽象化的概念或模型。在Java中,抽象可以通过抽象类和接口来实现,它们让你能够定义一些方法但不提供具体实现,从而让子类去实现具体细节。
2024-05-13 23:25:53
409
原创 MySQL面试之什么是聚合函数、事务、索引?(通俗易懂版)
这就好比有了一本按照作者姓名排列的书籍目录,只需要翻到"李华"这一页,就能找到所有相关的书籍,而不必一页一页地查找。在MySQL中,你可以使用事务来确保这个删除操作的原子性,即要么所有操作都成功执行,要么都失败回滚,以保证数据的一致性。表中没有任何索引,那么数据库引擎需要逐行扫描整个表,查找作者是"李华"的所有行,这可能会非常耗时,尤其是当表中有大量数据时。语句提交了事务,这样就会将所有的删除操作一起提交到数据库,确保这些操作要么全部成功执行,要么全部失败回滚。为123的记录,即某个特定人员的所有信息。
2024-05-13 02:11:22
867
1
原创 MySQL数据库之UNION 和JOIN连接的区别?
用于在查询中将两个或多个表中的行基于它们之间的关联条件进行匹配。JOIN操作通常涉及使用ON子句指定连接条件,例如,连接两个表的共同列。JOIN连接可以根据连接条件的匹配性质进行分类,包括INNER JOIN(返回匹配行)、LEFT JOIN(返回左表中的所有行和右表中匹配的行)、RIGHT JOIN(返回右表中的所有行和左表中匹配的行)等。UNION操作用于合并两个查询的结果,并去除重复的行(除非使用UNION ALL)。使用UNION时,查询必须返回相同数量和类型的列,并且列必须按照相同的顺序排列。
2024-05-13 01:15:39
882
1
原创 Python基础学习之知识碎片
在 Python 中,所有非零的数字和非空的字符串、列表、元组等数据类型都被视为 True,只有 0、空字符串、空列表、空元组等被视为 False。字典是一种映射类型,字典用 { } 标识,它是一个无序的 键(key) : 值(value) 的集合。Python 中的集合(Set)是一种无序、可变的数据类型,用于存储唯一的元素。字典是一种映射类型,它的元素是键值对,字典的关键字必须为不可变类型,且不能重复。与Python字符串不一样的是,列表中的元素是可以改变的。与字符串一样,元组的元素不能修改。
2024-05-09 01:48:43
289
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人