- 博客(7)
- 收藏
- 关注
原创 KNN算法总结
K近邻法(KNN)既能用来做多分类也能用来做回归,但是一般用来做分类。K近邻算法采用测量不同特征值之间的距离进行分类。1. KNN分类原理 给定一个训练数据集,对新输入的实例,在训练数据集中找到与该实例最邻近的K个实例,这K个实例中大多数属于某一个类别,则该输入实例也属于这个类别。 如上图所示,训练数据集中有两类数据,...
2019-03-10 17:34:17
1019
原创 数据的归一化与标准化
一、归一化与标准化的概念1.数据归一化和标准化的目的 归一化/标准化可以去除数据单位对计算带来的影响,也就是所谓的去量纲行为,归一化/标准化实质是一种线性变换,线性变换有很多良好的性质,这些性质决定了对数据改变后不会造成“失效”,反而能提高数据的表现,这些性质是归一化/标准化的前提。以三个时间字段为例来说明单位对计算带来的影响,假设一组数据有三个字段均表示3小时,如下表所示:小时...
2019-02-27 15:14:06
2631
原创 基于sklearn岭回归的波士顿房价预测
0.写在前面 波士顿房价预测案例提供5份文件,分别是:训练数据集 train.csv, 测试数据集 test.csv, 测试结果集 sample_submission.csv, 字段说明文档 data_description.txt, 本案例代码的预测结果 submission_df.xlsx。文件下载:链接:https://pan.baidu.com/s/1-KZB5IQATI2h_EnQ...
2019-02-26 19:34:00
9055
3
原创 吴恩达机器学习课程逻辑回归正则化python实现【对应ex2-ex2data2.txt数据集】
写在前面 1.本篇笔记是对ex2data2.txt数据集逻辑回归的正则化处理,文中代码是基于上篇笔记的代码的基础上修改。 2.文中没有叙述完整的流程,只叙述了实现正则化需要对上篇笔记中的代码修改的地方。1. 过拟合 在线性模型和线性分类器中,特征个数过多时容易出现过拟合问题,此时代价函数非常趋近于0或直接等于0。解决过拟合有两种方式,一是通过减少特征的方式,另外一种是保留所有的特征,...
2018-12-03 22:27:03
2024
1
原创 吴恩达机器学习逻辑回归python实现(未正则化)[对应ex2-ex2data2.txt数据集]
写在前面: 1.笔记重点是python代码实现,不叙述如何推导。参考本篇笔记前,要有逻辑回归的基础(熟悉代价函数、梯度下降、矩阵运算和python等知识),没有基础的同学可通过网易云课堂上吴恩达老师的机器学习课程学习。网上也有一些对吴恩达老师课后作业的python实现,大多数都是用Jupyter Notebook写的,一些重点的细节处没有做详细的说明而且基本上没有绘制图像的代码(我自以为我的笔...
2018-12-02 15:58:29
2202
原创 吴恩达机器学习逻辑回归python实现[对应ex2-ex2data1.txt数据集]
研一学生,初学机器学习,重心放在应用,弱化公式推导,能力有限,文中难免会有错误,恳请指正!QQ:245770710此文是对网易云课堂上吴恩达老师的机器学习课程逻辑回归一章对应的课后作业的python实现。1. 先对数据集进行观察,使用matplotlib将数据集绘制出散点图。 拿到一份数据想从中分析出一些内容,首先要了解拿到的数据,因此我们先把数据以散点图的形式绘制出来,观察其中的规律以确...
2018-11-30 17:05:41
4457
11
原创 记录一次XordDos(BillGates)木马导致Centos kworker线程占满CPU资源的解决过程
1.问题现象 通过top命令查看资源占用发现有大量kworker线程占用CPU资源,如下图。怀疑是系统问题或平台程序导致的问题。2.是否是程序导致的论证过程 因平台有两部分组成socket+web端,考虑可能是两者中的一个导致的,因此采用以下三种方式验证: [1] 只关掉socekt端,问题依旧出现 [2] 只关掉web端,问题依旧出现 [3] 全部关掉,问题依旧出现 ...
2018-10-20 21:48:09
5541
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人