
机器学习
文章平均质量分 84
一燊芊芊
这个作者很懒,什么都没留下…
展开
-
西瓜书-第3章-线性模型笔记
文章目录第3章-线性模型1-基本形式1.1-线性模型1.2-优势1.2.1-可解释性1.2.2-非线性模型2-线性回归2.1-定义与数学形式2.1.1- 若 xix_ixi 是离散属性:2.2-回归任务最常用的性能度量:均方误差2.3-求解均方误差最小化=>最小二乘法2.4-多元线性回归2.5-对数线性回归2.6-广义线性模型3-对数几率回归4-线性判别分析5-多分类学习6-类别不平衡问题7-阅读材料8-习题9-借鉴笔记:第3章-线性模型1-基本形式1.1-线性模型给定由d个属性描述的示例原创 2021-01-27 00:11:45 · 739 阅读 · 0 评论 -
西瓜书-第1章-绪论笔记
一、绪论引言机器学习所研究的主要内容:从数据中产生“模型”的算法,即学习算法。本书用“模型”泛指从数据中学得的结果。有的文献用“模型”指全局性结果(例如一颗决策树),用“模式‘指局部性结果(例如一条规则)基本术语数据集、训练集、测试集;监督学习·····等等机器学习的目标是使学得的模型能很好的适用于新样本,即泛化能力:假设空间归纳与演绎是科学推理的两大基本手段;机器学习是 “从样例/数据中学习”, 是归纳的过程,因此是归纳学习;归纳学习的广义:从样例中学习;归纳学原创 2021-01-25 15:36:16 · 221 阅读 · 0 评论 -
机器学习:7个步骤-2-数据预处理-异常值处理
异常值的判断1、使用均值和标准差进行判断mean 为数据的均值std 为数据的标准差数据的正常范围为 【mean-2 × std,mean+2 × std】import pandas as pdimport numpy as nptips = pd.read_csv('tips.csv')tipmean=tips['tip'].mean()tipstd = tips['tip'].std()topnum1 =tipmean+2*tipstdbottomnum1 = tipmean-2原创 2020-11-20 19:17:28 · 1343 阅读 · 0 评论 -
机器学习的三种方式
监督学习、无监督学习、强化学习• 强化学习的思路和人比较类似,是在实践中学习• 比如学习走路,如果摔倒了,那么我们大脑后面会给一个负面的奖励值 =>这个走路姿势不好;如果后面正常走了一步,那么大脑会给一个正面的奖励值 =>这是一个好的走路姿势与监督学习的区别,没有监督学习已经准备好的训练数据输出值,强化学习只有奖励值,但 是这个奖励值和监督学习的输出值不一样,它不是事先给出的,而...原创 2020-02-24 21:59:07 · 1465 阅读 · 0 评论 -
机器学习-深度学习的经典网络模型
1、卷积神经网络(CNN)• LeNet-5、AlexNet、VGG、GoogleNet、ResNet、DenseNet2、 循环神经网络(RNN)• 应用领域:机器翻译、情感分析等NLP领域3、深度信念网络(DBN,Deep Belief Network)• 2006年由Geoffreg Hinton(机器学习泰斗)提出,是一种生成模型,由多个受限玻尔兹曼机组成。4、生成对抗网络(G...原创 2020-02-24 21:42:14 · 802 阅读 · 0 评论 -
机器学习-算法与工具箱
决策树from sklearn.tree import DecisionTreeClassifier 朴素贝叶斯from sklearn.naive_bayes import MultinomialNB SVMfrom sklearn.svm import SVC KNNfrom sklearn.neighbors import KNeighborsClassifier ...原创 2020-02-24 21:35:21 · 184 阅读 · 0 评论 -
【Kaggle-Avazu CTR广告点击率预测】竞赛基本流程
前言一直在往机器学习的路上走,几年过去了,发现还是没真正踏上去,emmmm,行动吧。首先是有熟悉一门编程语言,一析合【今天刚刚给自己改的昵称????】主要熟悉python,所以可能会用到的环境为:python3.7可能用到的库,用pip install 安装,tensorflow的安装可能会踩坑,有空出一篇流程文。numpy、pandas、matplotlibsklearnxgboost...原创 2020-02-18 01:35:48 · 1701 阅读 · 0 评论