
机器学习基础算法
文章平均质量分 59
以基础为准, 主要记录基础机器学习的原理
永久_小玖
每天进步一点点,体会学习的乐趣。
展开
-
随笔--解决ubuntu虚拟环境的依赖问题
在 Linux 或 Unix 系统中,LD_LIBRARY_PATH 是一个环境变量,用于指定共享库文件(也称为动态链接库)的搜索路径。如果 LD_LIBRARY_PATH 没有被设置,系统会使用默认的共享库搜索路径。使用 unset LD_LIBRARY_PATH 命令可以清空 LD_LIBRARY_PATH 环境变量,这意味着系统将只使用默认的共享库搜索路径。unset LD_LIBRARY_PATH 是一个用于清空 Linux 或 Unix 操作系统环境变量 LD_LIBRARY_PATH 的命令。原创 2023-11-06 09:00:16 · 1228 阅读 · 0 评论 -
随笔--ubuntu解压zip乱码问题
【代码】随笔--ubuntu解压zip乱码问题。原创 2023-10-18 15:03:43 · 235 阅读 · 0 评论 -
随笔--向量数据库的检索算法
利用哈希碰撞,让尽可能相似的数据碰撞到同一个桶中。如何找到哈希函数,让尽可能相似的向量分到一个桶中。原创 2023-08-03 11:39:21 · 663 阅读 · 0 评论 -
3、K-均值聚类算法
文章目录一、聚类的概念二、常用的聚类方法2.1 K-means聚类2.2 层次聚类2.3 DBSCAN三、 K均值聚类一、聚类的概念聚类分析是无监督类机器学习算法中最常用的一类,其目的是将数据划分成有意义或有用的组(也被称为簇)。组内的对象相互之间是相似的(相关的),而不同组中的对象是不同的(不相关的)。组内的相似性 (同质性)越大,组间差别越大,聚类就越好。二、常用的聚类方法2.1 K-means聚类也称为K均值聚类,它试图发现k(用户指定个数)个不同的簇 ,并且每个簇的中心采用簇中所含原创 2021-09-01 16:46:52 · 1573 阅读 · 0 评论 -
2、KNN(k-近邻算法)
文章目录一、KNN简介1.1 原理举例1.2 算法引出1.3 算法原理-----欧氏距离 选出K个排序的概率二、 归一化处理一、KNN简介KNN是无监督的分类算法1.1 原理举例1.2 算法引出举个简单的例子,可以用k-近邻算法分类一个电影是爱情片还是动作片。(打斗镜头和接吻镜头数量为虚构)1.3 算法原理-----欧氏距离 选出K个排序的概率一般会有多个特征, 距离就用欧氏距离来计算二、 归一化处理相关连接(笔记来自于视频课程的归类整理):[1]: http原创 2021-09-01 10:13:53 · 240 阅读 · 1 评论 -
1、决策树
文章目录一、概念准备1.1 、信息熵1.2、信息增益一、ID3一、概念准备1.1 、信息熵系统有序程度的度量, 系统越有序信息熵越低。信息量的加权平均1.2、信息增益通常用来衡量某一个属性对于系统混乱程度的调整的幅度如何计算基于某一个属性计算他的条件熵, 他对于原来信息的该变量叫信息增益一、ID3有监督学习的分类算法系统的混乱程度, H(u) 越大, 越无序, H(u) 越下, 越有序...原创 2021-08-31 16:28:59 · 101 阅读 · 0 评论