
机器学习
oJueQiang123456
这个作者很懒,什么都没留下…
展开
-
逻辑回归优化
1、设置截距为true。 2、升高维度(一般相乘或平方,不会相加减:想加减还是线性的变化)。 3、调整分类阈值(某些场景,比如判断是否生病默认阈值为0.5:0.51为没病,0.49为有病,相差太小。调整阈值到0.7才为没病。会增大错误率,但会减小风险)。 4、鲁棒性调优(指算法的抗干扰能力:权重越小,模型越准确,但权重太小,比如0.00001,那随便输入什么值都等于截距了。所以需要降低正确率...原创 2019-05-06 10:16:23 · 1329 阅读 · 0 评论 -
线性回归
package com.cfl.sparkmllib.lr; import java.util.List; import org.apache.spark.SparkConf; import org.apache.spark.api.java.JavaPairRDD; import org.apache.spark.api.java.JavaRDD; import org.apache.spar...原创 2019-05-06 10:19:14 · 217 阅读 · 0 评论 -
朴素贝叶斯(MultinomialNB)-垃圾邮件分类
一、概述 版本:python:2.7.15 第三方库:scikit-learn 数据样本:https://gitee.com/chenfenli/document/blob/master/learning/sms_spam.txt 二、代码 # coding=UTF-8 import codecs from sklearn.naive_bayes import Multinomial...原创 2019-05-07 10:25:50 · 3376 阅读 · 0 评论