
机器学习
文章平均质量分 88
机器学习相关文章
川朴老师
for better 闲鱼小店:札幌奇妙的川朴,可以咨询Python安装答疑、机器学习环境搭建、报错等各种问题解决,以及一对一上课需求,已服务各高校硕博生千余次
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
网络流量预测的学习——持续更新ing
另有一个使用R语言来处理网络流量的项目:https://github.com/rankinjl/internet-traffic-stats-project/blob/master/DataSetProject.R。flowdata.csv下载地址:https://github.com/ftconan/python3/blob/master/pandas_demo/flowdata.csv。:这是用户实际传输和接收的数据,如网页内容、电子邮件、文件传输、视频流、音频流等。原创 2024-10-11 20:33:25 · 1597 阅读 · 0 评论 -
神经网络的初步学习
左侧的公式:展示了激活函数如何将输入数据变为非线性,从而增强网络的学习能力。右侧的结构图:显示了 MLP 的典型结构,数据从输入层流入隐藏层,每层经过一个激活函数后,再输出到下一层,最终给出预测结果。局部性让卷积层能够关注图像的局部区域,而不是整个图像。平移不变性使卷积层能够识别图像中相同的特征,不论它们在何处。参数数量小,因为卷积层只需要学习卷积核的权重,而不是所有输入数据的连接权重。卷积核学习模式:通过训练,卷积核可以自动学会识别图像中的不同特征。原创 2024-09-25 19:58:31 · 1095 阅读 · 2 评论 -
随机梯度下降的学习
在机器学习的旅途中,不可避免需要与它打交道,那么该如何初步理解它的用途呢?好的,想象你在一个山谷中,想要找到最低点(山谷的底部)。你现在在某个地方,但不确定如何到达最低点。这个过程就像是梯度下降。寻找方向:你看看四周,发现周围的地势向下倾斜的方向是你应该走的方向。这个“倾斜”就对应于梯度。一步一步前进:你每次只走一小步,朝着那个倾斜的方向前进。每走一步,你再次查看周围的地形,找到新的倾斜方向,并继续向前走。原创 2024-09-24 20:29:43 · 830 阅读 · 0 评论 -
从决策树到GBDT、随机森林
决策树(Decision Tree),它是一种以树形数据结构来展示决策规则和分类结果的模型,作为一种归纳学习算法,其重点是将看似无序、杂乱的已知数据,通过某种技术手段将它们转化成可以预测未知数据的树状模型,每一条从根结点(对最终分类结果贡献最大的属性)到叶子结点(最终分类结果)的路径都代表一条决策的规则。随机森林的核心思想是通过构建多个独立的决策树,并结合树的预测结果,来提高模型的准确性、稳健性,并减少过拟合。通过在 OOB 数据上评估模型的性能,可以近似得到模型的误差,不需要专门的验证集。原创 2024-09-23 19:33:36 · 1270 阅读 · 0 评论 -
数据集的选取、标注
数据标注有助于将原始数据转化为ML算法可以理解和学习的结构化格式。通过为数据提供背景和意义,标注过的数据可以作为训练ML模型的基础,以识别模式,进行预测,并执行各种任务。数据标注是一个对原始数据进行标记和分类的过程,使其可用于训练ML模型。人工智能方向研究生的必备网站。原创 2024-09-21 11:29:36 · 318 阅读 · 0 评论 -
机器学习案例:加州房产价格(五)
要解决这个问题,一个常见的方法是给每个分类创建一个二元属性:当分类是<1H OCEAN,该属性为 1(否则为 0),当分类是INLAND,另一个属性等于 1(否则为 0),以此类推。现在,你就可以使用这个“训练过的”imputer来对训练集进行转换,将缺失值替换为中位数,结果是一个包含转换后特征的普通的 Numpy 数组。通过前面的工作,你应该注意到了属性total_bedrooms有一些缺失值,缺失值的处理是需要着重解决的。大多机器学习算法不能处理缺失的特征,因此先创建一些函数来处理特征缺失的问题。原创 2024-05-18 16:35:20 · 819 阅读 · 1 评论 -
机器学习案例:加州房产价格(四)
这张图也呈现了一些不是那么明显的直线:一条位于 450000 美元的直线,一条位于 350000 美元的直线,一条在 280000 美元的线,和一些更靠下的线。你可以看到,纬度和房价中位数有轻微的负相关性(即,越往北,房价越可能降低)。尽管北加州海岸区域的房价不是非常高,但离大海距离属性也可能很有用,所以这不是用一个简单的规则就可以定义的问题。通过之前的工作,你只是快速查看了数据,对要处理的数据有了整体了解,现在的目标是更深的探索数据。另外,如果训练集非常大,你可能需要再采样一个探索集,保证操作方便快速。原创 2024-05-14 09:42:21 · 937 阅读 · 0 评论 -
机器学习案例:加州房产价格(三)
参考链接:https://hands1ml.apachecn.org/2/#_11。原创 2024-05-13 13:56:51 · 758 阅读 · 1 评论 -
机器学习案例:加州房产价格(二)
参考链接:https://hands1ml.apachecn.org/2/设计好系统后,要开始在工作区编写代码来解决问题了。原创 2024-05-12 14:58:58 · 934 阅读 · 0 评论 -
机器学习案例:加州房产价格(一)
参考链接:https://hands1ml.apachecn.org/2/假设你是被一家地产公司雇佣的数据科学家,现在需要做一些工作。公司所给的数据集是StatLib 的加州房产价格数据集。这个数据集是基于 1990 年加州普查的数据。数据已经有点老,但它有许多优点,利于学习,所以假设这个数据为最近的数据。为了便于学习理解,稍后学习过程中添加了一个类别属性,并除去了一些。你的第一个任务是利用加州普查数据,建立一个加州房价模型。这个数据包含每个街区组的人口、收入中位数、房价中位数等指标。原创 2024-05-12 14:24:11 · 1072 阅读 · 0 评论 -
2.监督/非监督学习
参考链接为:https://hands1ml.apachecn.org/1/机器学习可以根据训练时监督的量和类型进行分类。主要有四类:监督学习、非监督学习、半监督学习和强化学习。本文将简单介绍监督学习和非监督学习。原创 2024-05-11 14:36:17 · 912 阅读 · 0 评论 -
1.理解机器学习
虽然并不是一个有自我意识的天网系统(Skynet),垃圾邮件过滤器从技术上是符合机器学习的(它可以很好地进行学习,用户几乎不用再标记某个邮件为垃圾邮件)。后来出现了更多的数以百计的机器学习产品,支撑了更多你经常使用的产品和功能,从推荐系统到语音识别。相反的,基于机器学习技术的垃圾邮件过滤器会自动学习哪个词和短语是垃圾邮件的预测值,通过与普通邮件比较,检测垃圾邮件中反常频次的词语格式。大多数人听到“机器学习”,往往会在脑海中勾勒出一个机器人:一个可靠的管家,或是一个可怕的终结者,这取决于你问的是谁。原创 2024-05-10 16:31:36 · 434 阅读 · 0 评论