
python机器学习算法原理笔记与实现
一个人的旅行qiu
我原因用我10年的生命换一个闪耀的人生
展开
-
机器学习之自己实现决策树
import pandasimport numpy as np# Set index_col to False to avoid pandas thinking that the first column is row indexes (it's age).columns = ["age", "workclass", "fnlwgt", "education", "education_num",原创 2017-03-17 15:38:09 · 728 阅读 · 0 评论 -
机器学习之多类别问题
#多分类的思想是:将多个类别拆成多个二分类的问题#本实验为三分类问题import pandas as pdimport matplotlib.pyplot as pltcolumns = ["mpg","cylinders","displacement","horsepower","weight","acceleration","model year","origin","car name"]原创 2017-03-16 23:36:59 · 1788 阅读 · 0 评论 -
机器学习之交叉验证
import numpy as npimport pandas as pdadmission = pd.read_csv("D:\\test\machineLearning\\admissions.csv")print admission.head(2) admission["actul_label"] = admission["admit"]adm原创 2017-03-16 22:26:07 · 739 阅读 · 0 评论 -
机器学习之ROC测试指标和测试集价值
import pandas as pdimport numpy as npfrom sklearn.linear_model import LogisticRegressionnp.random.seed(8)admissions = pd.read_csv("D:\\test\machineLearning\\admissions.csv")admissions["actual_label原创 2017-03-16 21:24:11 · 2413 阅读 · 0 评论 -
机器学习之模型效果衡量标准
true代表你判断的是正确的,positive代表是正力(即是你的目标) false代表你的判断是错误的,negative代表是负力(即不是你的目标) 本例子当中,女生是目标即positive,TP,T代表判断正确,P代表你认为它是一个女生,加起来就是它真的是一个女生。 FP,f代表判断错误,你认为它是一个女生,加起来就是你认为它是一个女生,实际它是一个男生 用于检验positive的有效性原创 2017-03-15 23:53:15 · 1142 阅读 · 0 评论 -
机器学习之逻辑回归改善模型
逻辑回归用于分类,可以将任何数据变成0到1之间的数据 import pandas as pdimport numpy as npimport matplotlib.pyplot as pltadmissions = pd.read_csv("D:\\test\machineLearning\\admissions.csv")plt.scatter(admissions["gpa"],admi原创 2017-03-15 22:48:01 · 1100 阅读 · 0 评论 -
机器学习之线程回归
线性回归公式: import pandas as pdimport matplotlib.pyplot as pltcolumns = ["mpg","cylinders","displacement","horsepower","weight","acceleration","model year","origin","car name"]#由于原使数据只有数据,因此columns是为他们增原创 2017-03-15 21:21:33 · 858 阅读 · 2 评论 -
机器学习之支持向量机原理
找一条“胖”的决策边界的前提时点不能分错,这条胖的边界我们称为margin 此处distance是图中的h,即点到决策边界的计算公式 优化后的最终公式是下图原创 2017-03-19 00:22:04 · 571 阅读 · 0 评论 -
机器学习之神经网络基础概念
1.第一步:前向传播,X经过计算得到L值 第二步:反向传播,根据得到的L值,分析各个W所起到的左右 第三步:调整各个W,使得L值不断下降B和L后面存在一个激活函数,使得神经网络具备非线性功能 正则化项用于解决棍和现象原创 2017-03-18 18:31:24 · 512 阅读 · 0 评论 -
机器学习之SVD奇异值原理分析及举例
中间的矩阵S即是我们所关心,它的对角线上的每一个值,越大,说明这一类元素越重要,同时我们也可以取一个r乘以r的近似值,来得到我们所关心的,对最终结果有重要影响的类别。例如,我想直到最重要的2项指标,那么我可以使s成为2行2列的矩阵,u使m*2的矩阵,V是n行2列的矩阵 举例如下: 通过S将U,V控制成2列,这样方便我们在二维的坐标系中展示原创 2017-03-18 14:19:15 · 933 阅读 · 0 评论 -
机器学习之无监督聚类问题
#无监督:数据没有明确说明属于哪一类,无需去训练模型import pandas as pdvotes = pd.read_csv("D:\\test\machineLearning\\114_congress.csv")print(votes["party"].value_counts())print votes.mean()R 54D 44I 2Name: par原创 2017-03-18 11:29:54 · 1065 阅读 · 0 评论 -
机器学习之无监督聚类问题
通过判断彼此间的距离来实现聚类#无监督:数据没有明确说明属于哪一类,无需去训练模型import pandas as pdvotes = pd.read_csv("D:\\test\machineLearning\\114_congress.csv")print(votes["party"].value_counts())print votes.mean()R 54D 44I原创 2017-03-17 23:23:21 · 1247 阅读 · 0 评论 -
机器学习之随机森林
#随机森林存在2重随机性:1样本的随机性 2特征的随机性import pandascolumns = ["age", "workclass", "fnlwgt", "education", "education_num", "marital_status", "occupation", "relationship", "race", "sex", "capital_gain原创 2017-03-17 22:02:22 · 627 阅读 · 0 评论 -
机器学习之使用sklearn实现决策树及原理分析
import pandascolumns = ["age", "workclass", "fnlwgt", "education", "education_num", "marital_status", "occupation", "relationship", "race", "sex", "capital_gain", "capital_loss", "hours_per原创 2017-03-17 16:45:49 · 5010 阅读 · 2 评论 -
机器学习之K-近邻算法代码实现
以下是代码实现#coding:utf-8'''Created on 2017-03-17@author: qiujiahao'''import numpy as npimport operatorfrom audioop import reversedef createDataSet(): #以矩阵的格式创造四个数据 group = np.array([[1.0,1.1原创 2017-03-17 10:48:26 · 411 阅读 · 0 评论