
机器学习
.
I_AM_KK
只看代码不说话
展开
-
机器学习---监督学习之朴素贝叶斯
通过概率对某数据进行预测。重要的是:我们必须分清楚,已知和推断。已知:小明和小红穿红色毛衣的概率推断:穿红色毛衣的概率是小明还是小红专业术语就是:已知:小明和小红(事件A)穿红色毛衣(事件R)的概率(P(R|A))推断:穿红色毛衣的概率是小明还是小红(P(A|R))我们按照正常步骤求出所有事件发生的概率。我们知道其中某个特性,找出包含这个特性的概率。在他们之间进行预测剩下的事件概率。就是朴素贝叶斯。贝叶斯定理...原创 2020-06-11 02:19:51 · 335 阅读 · 0 评论 -
机器学习练习项目(决策树):泰坦尼克号乘客生还率预测
相应的数据集和可执行文件均可以在本文中获取。以下各段代码也均可在jupyter中运行,可以随时查看结果。题目描述:1912年,泰坦尼克号在第一次航行中就与冰山相撞沉没,导致了大部分乘客和船员身亡。在这个项目中,我们将探索部分泰坦尼克号旅客名单,来确定哪些特征可以最好地预测一个人是否会生还。分析数据import numpy as np #导入包import pandas as pd# 加载数据集full_data = pd.read_csv('titanic_data.csv')print(原创 2020-05-26 21:13:39 · 2708 阅读 · 0 评论 -
机器学习---监督学习之决策树算法
决策树概念根据我们前面学到的知识顾名思义:一棵用来决策的树。机器学习已有的数据,分析什么情况会导致什么结果,把它画成一颗分叉的树,然后如果有新数据来了,带入这棵树来决策应该怎么做。比如带入性别,得到结果:性别女则决策买买买,性别男则决策吃吃吃。举例如果使用决策树划分这些数据?先竖着画一条线由已经分割好的两部分继续划分继续划分这就是决策树了熵物体越无序,熵越大,越不稳定。物品越有序,熵越小,越稳定。如何用数学定义描述这种状态?我们随机N次抽取物品,求出..原创 2020-05-25 21:49:55 · 465 阅读 · 0 评论 -
机器学习---监督学习之感知器算法
感知器算法(以神经网络为基础)是用来分类的,也就是用来回答是否问题的。神经网络神经网络是机器学习中的一个模型,可以用于两类问题的解答:分类:把数据划分成不同的类别回归:建立数据间的连续关系如何分类?红蓝色都是我们的数据集,如何找出中间的那条直线?这条直线满足如下的数学式子:...原创 2020-05-25 15:41:36 · 524 阅读 · 0 评论 -
机器学习---监督学习之线性回归
分类和回归的区别:分类,我们预测一个状态,回归,我们预测一个值。线性回归是:通过已有的数据,拟合出一条符合它的直线,用来预测其他可能出现的值。如何拟合一条好的直线呢?绝对值技巧:先随机生成一条直线y=w1x+w2y=w1x+w2y=w1x+w2,w1是斜率,w2是截距,我们通过调整这两个参数来使这条直线逐渐靠近一个原始的点(p,q)。如何慢慢调整这两个参数呢?我们把w1+p,w...原创 2020-05-24 20:42:31 · 440 阅读 · 0 评论 -
机器学习练习项目:波士顿房价预测
本项目使用jupyter完成,annacode包含所有需要的库,相应数据资源第一步. 导入数据在这个项目中,你将利用马萨诸塞州波士顿郊区的房屋信息数据训练和测试一个模型,并对模型的性能和预测能力进行测试。通过该数据训练后的好的模型可以被用来对房屋做特定预测—尤其是对房屋的价值。对于房地产经纪等人的日常工作来说,这样的预测模型被证明非常有价值。波士顿房屋这些数据于1978年开始统计,共506...原创 2020-04-19 22:36:31 · 4951 阅读 · 8 评论 -
机器学习---模型选择
我们运用手里有的数据,选择机器学习方法,建造好了模型,除了评估指标外,我们还可以判断模型的是否错误:有两种常见的错误类型:欠拟合和过拟合欠拟合,模型过于简单,拟合的不够好,经常发生错误(高偏差)。相当于一个学生没有认真学习,很多题都没做对。过拟合,模型过于复杂。倾向于记住了训练集数据(高方差),而不是学习数据的特点。相当于一个学生把所有书本背下来了,会学过的知识,新题就不会了。...原创 2020-04-17 16:51:40 · 847 阅读 · 0 评论 -
机器学习---评估指标(最常用的回归指标:平均绝对误差和均方误差)
评估指标是判断一个模型好坏的概念。哦,模型又是什么?可以这么认为,我们想预测未知,就要做很多工作,这些工作包括取得数据,分析数据,处理数据等等,形成一整套完整的流程下来。也叫建模。建模的结果就是模型。混淆矩阵正确的一边我们称为:阳性正确的另一边我们称为:阴性注意:这里的正确是指对于模型而言,如果一个模型是检测垃圾邮件的,那么检测出垃圾邮件是阳性,检测出来的正常邮件是阴性。问题又来了,...原创 2020-04-05 01:00:15 · 3860 阅读 · 0 评论 -
机器学习---训练集与测试集
你去水果摊上买水果,怎么看水果好坏?评价标准是:新鲜程度你建立了机器学习的模型,又怎么判断这个模型好坏?接下来我们要讲的概念机器学习模型(机器学习方法)的评价标准,会涉及到一些概念。...原创 2020-04-04 23:18:34 · 1179 阅读 · 0 评论 -
使用pandas,numpy,scikit learn分析数据
要打开此数据集(csv 文件),我们将在 Pandas 中使用命令read_csvimport pandasdata = pandas.read_csv("file_name.csv")我们已经在 Pandas 中加载数据,现在需要将输入和输出拆分为 numpy 数组,以便在 scikit-learn 中应用分类器。假设有个 pandas 数据框 df,如下所示,有四个列,分别标为...原创 2020-04-04 17:40:15 · 727 阅读 · 0 评论 -
机器学习各方法简介
决策树顾名思义:一棵用来决策的树。用某些数据来决策应该怎么做的树。比如性别,性别女则决策买买买,性别男则决策吃吃吃。朴素贝叶斯贝叶斯是个概率公式。你观察发现,渣男都得锡纸烫,但是有一小部分好人也是锡纸烫。假设锡纸烫的渣男有80个人,好人有20个人。概率就是:检测一个锡纸烫的人有80%的概率是渣男。梯度下降顾名思义:一个按照梯度方向,下降最快方向,下降到底的方法。梯...原创 2020-04-03 22:34:40 · 826 阅读 · 0 评论 -
机器学习1
机器学习基础在这一部分中,你将熟悉机器学习的主要算法。通过几节充满乐趣的简短课程,你能了解这些算法的工作方法,以及如何将它们应用到现实生活的问题中。接着,你将通过一个迷你项目检验学习成果,在这个项目里,你会学习如何根据电子邮件中的文本检测垃圾邮件。模型评估与验证在这一部分中,你将了解构建机器学习模型的基础知识。简单来说,我们将会回答以下问题:我应该如何训练模型?我如何判断这个模型是否优秀...翻译 2019-10-15 00:11:33 · 165 阅读 · 0 评论