- 博客(4)
- 资源 (10)
- 收藏
- 关注
原创 机器学习过程中数据不平衡问题的处理方法
这是我今天遇到的一个问题,也是机器学习中一个比较典型的问题,问题是这样的,我拿到了一堆数据,数据一共有3020条,包含了10个类别,要求训练一个分类器能够准确识别各个分类。对于小数据规模的机器学习而言,与我们入门时,练手的鸢尾花数据集相比,至少在数据量上还是比较充足的。其实不然,如下表,是整个数据中,各个类别所占的条数:表1 各类别数据条数 class 1 class...
2019-03-22 23:47:02
802
原创 Anaconda依赖包的安装
在我们学习机器学习过程成中,必然离不开一个利器——Anaconda。Anaconda是一个开源的包和环境管理器,它可以用于在同一个机器上安装不同版本的软件包及其依赖,并能够在不同的环境之间切换。但是,如果不知道相应的安装指令,如何去快速的安装软件包呢?下面介绍一种安装方法。Step 1:首先,打开Anaconda Navigator,并登陆自己的账号(如果没有账号的话,可以注册...
2019-03-14 17:46:03
5099
原创 sklearn中SVM与AdaBoost对手写体数字进行识别
这篇博文主要基于sklearn中的svm和AdaBoost对MINIST数据集中的手写体数字进行识别。
2017-09-15 23:44:55
4479
原创 利用sklearn包中的k-近邻算法进行分类
刚开始学习机器学习不久,这也是我第一次写博客。就先写个简单的,利用sklearn包中的kNN分类器进行分类,分类的数据集为皮马印第安人糖尿病数据集(pima-indians-diabetes.data.csv)。废话不多说,直接上代码,写的不完善的地方,望大家指正。#coding:utf-8''''' Create by Ma ChaoAugust 4thkNN'''''from
2017-08-05 21:44:15
1739
H264码流分析工具集.zip
2019-05-23
Python机器学习实践指南
2018-02-07
HandWritten_Recognition
2017-09-16
GifCam绿色版
2017-09-15
模式识别与机器学习中文版
2017-09-05
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人