机器学习
算法笔记
shitoucoming
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
svm使用出现FutureWarning The default value of gamma will change from auto to scale in version 0.22
G:/workspace/Firmware-url-Detection/url_classfication/trainer_zgd.pyC:\Users\zgd\AppData\Roaming\Python\Python27\site-packages\sklearn\svm\base....转载 2020-06-29 17:14:23 · 513 阅读 · 0 评论 -
ValueError Unknown label type unknown
应该是标签数据集的类型出错了,那么使用dtype打印一下数据类型看看(不要使用type函数,这样会发现都是int类型的),发现这时候的标签数据类型是object,这样sklearn是无法识别的,所以使用astype(‘int’)进行强制转化即可:y = y.astype('int')...转载 2020-06-29 16:00:37 · 3326 阅读 · 1 评论 -
模型过拟合和模型退化理解
模型过拟合和模型退化模型过拟合:指在训练集上效果还可以,在测试集上效果不好;模型退化:在训练集上效果就不好了。原创 2020-03-20 17:45:51 · 1862 阅读 · 0 评论 -
决策树的剪枝处理
决策树的剪枝处理剪枝是决策树学习算法解决过拟合的主要手段。在决策树的学习过程中,为了尽可能地正确分类训练样本,节点划分得不断重复,有时候会造成决策树的分支过多,这时候就是算法在训练样本上学得太好,导致把训练集本身的一些特点作为所有数据所有数据都有的一般性质(实际上新数据中可能没有这些特点),从而导致过拟合。因此可以主动去掉一些分支来降低过拟合的风险。 决策树的剪枝分为 预剪枝 和 ...原创 2020-03-17 10:48:49 · 1547 阅读 · 0 评论 -
GBDT+LR CTR
GBDT+LR算法解析及Python实现1. GBDT + LR 是什么本质上GBDT+LR是一种具有stacking思想的二分类器模型,所以可以用来解决二分类问题。这个方法出自于Facebook 2014年的论文 Practical Lessons from Predicting Clicks on Ads at Facebook。2. GBDT + LR 用在哪GBDT+LR 使用最广...转载 2020-03-09 19:51:57 · 375 阅读 · 0 评论 -
jieba用法和jieba模式
mydict.txt文件内容如下:‘’’第一行,井号开头表示注释。每行一个单词,包含三个部分,每个部分以空格隔开,第一部分是单词,第二部分是词频,第三部分是词性杨氏聪惠 66666未成弃去‘’’import jieba# 基础分词word_a = '上海自来水来自海上'# word_a = '把汉字串与词典中的词条进行匹配'# word_a = '梁国杨氏子九岁,甚聪惠。...原创 2020-03-09 18:57:32 · 662 阅读 · 0 评论 -
Anaconda安装jieba包出错,新解决办法
1.下载jieba包:链接:https://pan.baidu.com/s/1BUqQeLOvbccR-Ye-xuv3DA提取码:m4k42.放到Anaconda的pkgs目录下3.打开cmd,进入Anaconda\pkgs的jieba-0.39目录下4.执行命令python.exe setup.py install(注意要写清python.exe在哪个目录,我的是在Anaconda\p...原创 2020-03-09 18:29:52 · 1880 阅读 · 3 评论
分享