- 博客(37)
- 收藏
- 关注
原创 【LeetCode算法题】数组经典题目分析
本文对LeetCode中的数组类的经典题目进行分析,题目序号分别为704.二分查找27.移除元素977.有序数组的平方209.长度最小的子数组59.螺旋矩阵ll。
2024-01-17 19:38:58
1230
原创 【LeetCode算法题】各类排序算法的Python实现
对于直接插入排序、折半插入排序、选择排序、冒泡排序、归并排序,快速排序、堆排序算法的Python实现进行记录。
2024-01-17 18:24:46
704
原创 【数据库基础10】并发控制
事务可以一个一个地串行执行,即每个时刻只有一个事务运行。在单处理机系统中,事务的并行执行实际上是这些并行事务的并行操作轮流交叉运行。这种并行执行方式称为交叉并发方式。在多处理机系统中,每个处理机可以运行一个事务,多个处理机可以同时运行多个事务,实现多个事务真正的并行运行。这种并行执行方式称为同时并发方式。
2023-02-14 13:09:59
598
原创 【数据库基础09】数据库恢复技术
事务是一系列的数据库操作,是数据库应用程序的基本逻辑单元。事务处理技术主要包括数据库恢复技术和并发控制技术。数据库恢复机制和并发控制机制是数据库管理系统的重要组成部分。
2023-02-14 11:20:15
1535
原创 [数据库基础07]数据库设计
数据库设计是指对于一个给定的应用环境,构造优化的数据库逻辑模式和物理结构,并据此建立数据库及其应用系统,使之能够有效地存储和管理数据,满足各种用户的应用需求,包括信息管理和数据操作要求。
2023-02-13 14:28:08
307
原创 【数据库基础05】数据库完整性
关系模型的实体完整性在create table中用primary key定义。触发器是用户定义在关系表上的一类由时间驱动的特殊过程。
2023-02-11 14:17:18
456
原创 【数据库基础03】关系数据库标准语言SQL
本章将具体介绍SQL概述、学生—课程数据库、数据定义数据查询数据更新以及视图。结构化查询语言(SQL)是关系数据库的标准语言,也是一个通用的、功能极强的关系数据库语言。
2023-02-10 11:09:37
1258
原创 数据标准化与归一化 及其区别
介绍了标准化与归一化的基本方法及区别。需要特别注意,除了去除量钢化需要归一化或标准化,还需考虑基于参数的模型或者基于距离的模型,需要对参数或者距离进行计算,都需要进行归一化。
2023-02-03 15:59:23
4147
原创 【大数据竞赛】2022MathorCup大数据挑战赛 B题 北京移动用户体验影响因素研究 探索性数据分析
该系列文章分为问题分析,探索性数据分析,特征工程,模型建立四个部分,以此来记录完成本次竞赛的具体思路,及对部分问题的补充研究。若需要附件数据,评论区留邮箱,看到会回复。
2023-02-03 15:08:41
1209
3
原创 【数据编码】构造虚拟特征变量(OneHotEncode)
使用one-hot编码,将离散特征的取值扩展到了欧式空间,离散特征的某个取值就对应欧式空间的某个点。将离散型特征使用one-hot编码,会让特征之间的距离计算更加合理。
2023-02-02 23:05:07
740
原创 【EDA与特征工程】数据探索与特征工程综合指南
本综合指南主要参考《A Comprehensive Guide to Data Exploration》进行编写,用作日常学习。原文中将缺失值插补与异常值处理两大块作为数据探索部分,通过查阅资料及结合数据分析经验,本文将变量识别、单变量分析、双变量分析划为探索性数据分析(EDA) 部分,将缺失值插补、异常值处理、变量转化、特征/变量构造、特征筛选及降维划为特征工程部分。
2023-02-02 21:56:58
1061
原创 【特征工程】重要特征识别理论(特征筛选)
从众多影响因素中识别出重要因素的过程可以视为一个特征选择过程。在建立机器学习模型进行预测时,输入的特征集会直接影响模型效果,特征太少容易不能全面刻画数据潜在关联,造成模型欠拟合;特征太多时会存在不相关的特征或者特征冗余的情况,甚至出现“维度灾难”,会造成模型精确度无法提升、运行速度慢、过拟合等情况。特征选择是为了从全部特征中找到最优的特征子集,剔除其中不相关或冗余的特征,从而提高模型拟合程度,加快运行速度,同时选取出真正相关的特征简化模型,协助理解数据决策的过程。
2023-02-01 16:46:11
1224
原创 【大数据竞赛】2022MathorCup大数据挑战赛 B题 北京移动用户体验影响因素研究 题目分析
该系列文章分为问题分析、数据探索性分析、特征工程、模型建立四个部分,以此来记录完成本次竞赛的具体思路,及对部分问题的补充研究。
2023-02-01 13:54:56
1274
原创 【机器学习】贝叶斯分类器(算法原理实现及sklearn实现)
贝叶斯分类器作为“生成式模型”可处理多分类问题,在数据较少的情况下依然有效,本文介绍了算法原理推导及基于算法原理的代码实现与基于sklearn包的代码实现。
2022-12-18 12:50:22
3107
原创 机器学习中的判别式模型和生成式模型
在机器学习中,对于有监督学习可以将其分为两类模型:判别式模型和生成式模型。简单地说,判别式模型是针对条件分布建模,而生成式模型则针对联合分布进行建模。
2022-12-17 13:22:01
254
原创 [Numpy] Numpy中的矩阵运算(矩阵乘法、矩阵分解、行列式等)
线性代数(如矩阵乘法、矩阵分解、行列式以及其他方阵数学等)是任何数组库的重要组成部分,NumPy提供了一个用于矩阵乘法的dot函数(既是一个数组方法也是numpy命名空间中的一个函数)
2022-12-06 21:15:23
1237
原创 【概率论理论】协方差,协方差矩阵理论(机器学习)
在许多机器学习算法中需要求出两个分量间相互关系的信息。协方差就是描述这种相互关联程度的一个特征数。相关系数矩阵是标准后的协方差矩阵。
2022-12-06 18:47:40
1916
原创 StandarScaler(sklearn.preprocessing)标准化中的fit、transform理解。
sklearn里的封装好的各种算法使用前都要fit,fit对于算法而言,相当于拟合出具体的模型参数,后续可基于模型进行一些一系列操作(如预测等)。fit对于整个代码而言,为后续API服务。fit之后调用各种API方法,transform只是其中一个API方法;
2022-12-06 11:13:30
2065
原创 贝叶斯公式证明及Bayesain在机器学习重要地位的理解
经典的Bayesian在机器学习中如此重要,就是因为人们希望机器人能像人那样思考,而很多问题是需要计算机在已知条件下做出最佳决策的决策,而贝叶斯公式就是对人脑在已知条件下做出直觉判断的一种数学表示。
2022-11-25 22:04:52
426
转载 先验概率和后验概率的通俗解释(贝叶斯分类)
通俗的理解先验概率和后验概率;贝叶斯方法在机器学习中如此重要,就是因为人们希望机器人能像人那样思考,而很多问题是需要计算机在已知条件下做出最佳决策的决策,而贝叶斯公式就是对人脑在已知条件下做出直觉判断的一种数学表示。
2022-11-25 19:14:02
717
转载 Kingbase详细安装教程
kingbase客户端工具是人大金仓提供的连接KES数据库的图形化客户端工具。它是基于JAVA语言开发的能运行在不同操作系统平台上的图形工具,用于访问、配置、控制和管理 KingbaseES 数据库服务器。管理和配置KingbaseES数据库服务器。管理各种KingbaseES数据库对象。进行KingbaseES数据库的安全管理。调用查询分析器执行和测试SQL语句。
2022-11-20 22:01:37
10372
原创 Seaborn数据可视化——一篇详细的学习记录
本文详细简介的记录了利用Seaborn进行可视化操作,数据可视化是数据分析中重要的一步,在前期数据的探索性分析,以及后期结果的呈现中都有着重要地位。更加全面的教学可进入KaggleSeaborn教学进行学习。
2022-11-03 19:43:10
2130
2
原创 pd.plotting.register_matplotlib_converters() 的作用
机器学习可视化中,pd.plotting.register_matplotlib_converters() 的作用。
2022-11-01 14:34:14
1538
原创 【博客搭建3】利用Typora软件编写个人博客
Typora编写Markdown,记录如何完成一篇博客的步骤。可同步上传知乎,csdn,非常好用
2022-10-30 18:01:59
1105
Microsoft Visual C++ 2013 Redistributable Package
2022-11-20
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人