
自学 机器学习 之路
Shashank497
我要找到你,不管南北东西
展开
-
python使用numpy实现卷积操作
python使用numpy实现卷积操作talk is cheap,show you the codeimport numpy as npdef Conv2(img, kernel, n, stride): #img:输入图片;kernel:卷积核值;n:卷积核大小为n*n;stride:步长。 #return:feature map h, w = img.shape img = np.pad(img,((1,1),(1,1)),'constant',constant_values原创 2021-12-29 16:14:48 · 3719 阅读 · 0 评论 -
LSMT
明天更新原创 2020-08-23 23:29:00 · 337 阅读 · 0 评论 -
机器学习——Boosting、提升树、随机森林(Random Forest)学习笔记
大数据工作室学习打卡 第 N 次一、Boosting(提升)1.什么是集成学习?首先,我们得先了解什么是集成学习,集成学习是一种通过组合弱学习器来产生强学习器的通用且有效的方法,简单来说,就是通过训练多个分类器,然后将其组合起来,从而达到更好的预测性能,提高分类器的泛化能力。如下图:2.什么是boosting(提升)?boosting和集成学习什么关系?前面我们了解了集成学习,那么集成学习的关键就在于如何组合多个弱学习器,所以依次发展出了三大主要框架:baggingboostings原创 2020-08-15 17:31:47 · 2589 阅读 · 0 评论 -
贝叶斯分类器 完整学习笔记(详细)
大数据实验室学习记录 第N次 打卡一、引言根据自己的经验,由于是小白,一开始看不太懂西瓜书中的第七章贝叶斯相关知识,所以我把需要提前了解的小知识点给先放出来,如下:先验概率(prior probability)简单来说,就是指根据以往经验和分析得到的概率,即在事情发生之前,推测未来此事件发生概率。可看作“由因求果”。举个通俗易懂的栗子:李华在成都春熙路观察了5周,发现每周末的时候好看的小姐姐最多,所以他打算以后每周末去春熙路,因为他根据以往的经验推测周末漂亮小姐姐多的概率比工作日大得多。原创 2020-07-26 21:20:03 · 3340 阅读 · 0 评论 -
MySQL python详细自学笔记
大数据实验室第10次学习打卡一、mysql 环境准备在计算机中安装mysql,可以在https://www.mysql.com/downloads/官网下载免费的 MySQL 数据库:没有oracle账号的需要花一分钟时间用邮箱注册之后才能下载。不过win10 64位系统的朋友可以直接在我csdn上传的资源里面下载。安装mysql比较复杂,大家可以在csdn搜其他博主的安装教程或者在b站搜视频教程看。安装 MySQL 驱动程序Python 需要 MySQL 驱动程序来访问 MySQL 数据库。在原创 2020-07-12 16:50:47 · 372 阅读 · 0 评论 -
机器学习(下)多元回归、缩放、训练测试、决策树
大数据实验室学习记录第9次打卡上一期机器学习(上)链接如下:机器学习(上)线性回归、多项式回归、标准差、百分位数、数据分布、散点图十、多元回归多元回归(Multiple Regression)多元回归就像线性回归一样,但是具有多个独立值,这意味着我们试图基于两个或多个变量来预测一个值。比如:我们可以根据发动机排量的大小预测汽车的二氧化碳排放量,但是通过多元回归,我们可以引入更多变量,例如汽车的重量,以使预测更加准确。请看下面的数据集,其中包含了一些有关汽车的信息。工作原理在 Python原创 2020-06-21 16:44:48 · 1031 阅读 · 0 评论 -
机器学习(上)线性回归、多项式回归、标准差、百分位数、数据分布、散点图
大数据实验室第8次打卡机器学习入门数据集在计算机中,数据集指的是任何数据集合。它可以是从数组到完整数据库的任何内容。数据类型1.数值:离散数据和连续数据。离散数据限制为整数的数字。连续数据是具有无限制的数字。2.分类:是无法互相度量的值,例如颜色或也任何yes/no值。3.序数:类似于分类数据,但可以相互度量。如A优于B的学校成绩。平均中位数模式在机器学习中,通常存在三种感兴趣的值:1.均值(Mean)–平均值2.中值(Median)–中值点,又称中位数3.众数(Mode)–最常见的原创 2020-06-14 22:51:40 · 4317 阅读 · 0 评论