
特征工程
文章平均质量分 85
troysps
这个作者很懒,什么都没留下…
展开
-
PCA 降维
PCA 简化数据通俗理解: 找出一个最主要的特征 进行分析 例子: 考察一个人的智力情况 直接看数学成绩就行 例子: 观看电视 将显示器的百万像素转化为一个三维图像 重点: 降维技术 主成分分析(PCA) 对半导体数据进行降维处理降维技术1.数据集更容易使用2.降低算法的计算开销3.去除噪声4.使得结果易懂 ---(有利于可视化)几种不...原创 2018-06-20 20:04:51 · 545 阅读 · 0 评论 -
特征工程-处理样本不均衡现象
处理样本不均衡现象样本非均衡现象: 正例子数目与反例数目不相等 (相差很大)1. 能否收集到更多的数据2. 尝试使用其他的评价指标 error Rate: 不能用于非均衡的数据集 因此可以使用其他的评价指标 Procision:精准度计算 TPTP+FPTPTP+FP\frac{TP}{TP+FP} 实际被检索到的(TP+FP) Recall: 召回率 TPTP+...原创 2018-06-06 16:20:15 · 1429 阅读 · 0 评论 -
Singular Value Decomposition:奇异值分解(降维)
SVD 降维相似度计算: 1.欧式距离 向量的范数2 2.皮尔逊相关系数 cov(X,Y)varxvarycov(X,Y)varxvary\frac{cov_{(X,Y)}}{var{x} var{y}} 均值意义:样本集合的中间点 方差意义: 样本点的离散程度 协方差意义: 度量两个随机变量关系的统计量 度量各个维度偏离其均值的程度...原创 2018-06-22 14:55:36 · 818 阅读 · 0 评论