- 博客(4)
- 收藏
- 关注
原创 机器学习实战-AdaBoost代码&注释
print("分割的列:" + str(i) + "阈值为:" + str(threshVal) + "符号:" + str(inequal) + "错误率:" + str(weightedError))#此弱分类器的权重 (权重与错误率有关,错误率越大权重越小) 1e-16用于确保在没有错误时不会发生除零溢出。#权重向量D的意义,权重低的样本对错误率计算影响小,即权重低的样本分类错了也没关系。# 大于小于的划分效果都尝试,从而找到最好的划分条件。#m个样本,初始时每个样本的权重都是 1/m。
2025-09-03 16:13:52
811
原创 机器学习实战-决策树代码&注释
计算信息增益,熵,确定最优的划分特征 H = -Σp(xi)log2p(xi)#以第i个特征进行划分,对应不同的值都会得到一个划分的结果。#递归构建决策树 终止条件:属性被用完,划分后所有数据属于同一类别。#信息熵代表着混乱程度,熵越高信息越混乱,需要快速降低熵值。#每种特征对应的值,每一列对应的值。#投票,最后节点的类别为最多数据的类别。#没有用于划分的特征了。#选择最优的特征进行数据集划分。#按照给定的特征划分数据集。
2025-08-21 16:28:18
330
原创 机器学习实战-KNN代码&注释
根据距离从小到大生成排序后的索引数组,如要从大到小,可以取反再argsort,通过 sortedDistances 可快速定位距离最近的点(索引 0)#新建一个dict, dict提供的get方法,如果key不存在,可以返回None,或者自己指定的value。#按照第二个元素的次序对元组进行排序,reverse = True是逆序,即按照从大到小的顺序排列。# ..... dataSetSize行, 等长的数组直接-#返回第0个tuple的第0个参数,也就是我最终的结果。#选取距离最近的k个。
2025-08-11 10:08:09
296
原创 mysql存储过程,从一个表中取数据插入到另一个表中
随笔记录需求为:需要初始化表user_authority,从user表中读取user_name字段,并根据role_type对user_authority表中的authority字段进行赋值drop procedure if exists init_user_authority_proc;create procedure init_user_authority_proc()begin declare var1 varchar(128); declare flag int defa...
2021-10-09 16:34:53
934
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅