- 博客(5)
- 收藏
- 关注
原创 PCA主成分分析
img_shape = img_array.shape # 保存图像尺寸(112x92)这次实验要求实现用PCA降维技术对原数据集中的人脸信息进行降维处理,并将得到的结果与原图像对比。# ---------- 可视化部分(仅展示前10张对比) ----------# ---------- 读取所有图像 ----------# ---------- PCA降维 ----------# ---------- 路径配置 ----------# 构建数据矩阵,每行为一张图。# 可调:前k个主成分。
2025-06-17 00:24:15
240
原创 决策树的算法
num_features = len(data[0]) - 1 # 特征的个数,假设数据的最后一列是类别标签。计算每个属性的信息增益,选择信息增益最大的属性作为当前节点的划分属性,生成子节点,对每个子节点递归,,直到满足条件。信息熵:H(D)=−i=1∑kpilog2(pi) 条件熵:H(D∣A)=∑P(v)⋅H(Dv)计算各属性信息增益,计算分裂信息度量得到信息增益率,选择增益率最大的属性作为划分属性,生成子节点。公式:信息增益(IG)=H(D)−H(D∣A)# 计算加权平均的条件熵。
2025-04-22 03:27:56
2332
原创 绘制PR曲线和ROC曲线
通过precision_recall_curve函数求查准率和查全率,predict_proba获取概率预测,然后绘制图像。plt.subplot(1, 2, 1) # 将图形分成1行2列,选择第1个位置。plt.figure(figsize=(10, 5)) # 调整图形大小。plt.subplot(1, 2, 2) # 选择第2个位置。查重率=TP/(TP+FN)查准率=TP/(TP+FP)通过测试集预测,找出最合适的k值,然后计算模型准确率。横轴是假正例率(FPR),纵轴是真正例率(TPR)
2025-04-08 02:03:59
693
原创 通过knn算法实现分类
1. **数据准备:**这包括收集、清洗和预处理数据。**预处理可能包括归一化或标准化特征**,以确保所有特征在计算距离时具有相等的权重。3. **确定K值:选择一个K值**,即在分类或回归时应考虑的邻居数量。这是一个超参数,可以通过交叉验证等方法来选择最优的K值。2. **选择距离度量方法**:确定用于比较样本之间相似性的度量方法,常见的如欧几里得距离、曼哈顿距离等。(处理数据-最小数据)/(最大数据-最小数据),使处理过的数据在0~1之间。4. **找到K个最近邻居**6. **预测**(K=3)
2025-03-24 23:10:02
205
原创 Anaconda环境配置
1,先从anaconda官网下载最新版本,把以下三条指令添加到系统变量中的path路径中。输入命令创造环境conda create -n name python==3.13。2,通过Win+R打开运行窗口输入cmd进入命令行界面。输入这个代码conda activate name。name是创建环境自己的命名。name里是自己的命名。
2025-03-10 21:17:33
935
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅