自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 吃瓜学习⑦

以上是来自我的word笔记里的截图,笔记内容基本整理自周志华老师所著的《机器学习》一书。说真的,这一章的难度直接上了一个档次,全是公式推导,看天书一样(抱头痛哭)。本次笔记发布也是在Datawhale吃瓜学习活动中发布的最后一篇哩。希望以后再发文章时能自己创作出高质量一些的作品(小白挥手)。

2024-10-06 21:21:28 238

原创 吃瓜学习⑥

我又又又来发笔记了,这次也是截图Word里写的。假期也有好多事,所以在这个点写了个大概,着实仓促,改日一定好好完善一番,今天先到此为止。注:文章内容整理于周志华所著《机器学习》。

2024-10-04 01:38:41 299

原创 吃瓜教程⑤

以上是本次学习笔记。依然是写在Word后截图上传,复制上来搞排版太花时间了。还是对本章决策树的知识点做了较为详细的总结,有问题的可以找我讨论嘞。注:以上笔记内容内容源于周志华所著《机器学习》。

2024-09-30 21:29:52 182

原创 吃瓜学习④

注:直接将写在Word里的笔记截图过来了,之前复制总会出现很多排版问题。写的不多,感觉大部分是公式推导,倒不是因为懒。本文内容基于周志华所著的《机器学习》一书而写。

2024-09-27 11:57:36 283

原创 吃瓜学习③

注:优快云小白,还不会打公式,公式都是网搜截图的或者看电子书截图的。交叉熵代价函数部分的图片来自于优快云作者“生活不止*眼前的苟且”,笔记部分内容源于周志华所著的《机器学习》一书。是一种“Sigmoid”函数,也称S型生长曲线,是任意阶可导的凸函数。Sigmoid函数常被用作神经网络的激活函数,将变量映射到[ 0 , 1 ]之间。为了让每个样本最大可能地属于其真实标记,我们可通过“极大似然法”(maximum likelihood method)来估计参数w和b。上式代价函数可称作:交叉熵代价函数。

2024-09-24 20:33:53 326

原创 吃瓜学习②

①序关系:指集合A有自反性、反对称性和传递性的二元关系R,A称为偏序集。简单来说,序关系就是集合中元素之间的一种“排列顺序”或“比较大小”的关系,但这种关系可能并不总是完整的或严格的。对于离散属性,若属性值间存在“序(order)关系”,可通过连续化将其转化为连续值;在线性回归中,最小二乘法就是试图找到一条直线,使所有样本到直线上的欧氏距离(Euclidean distance)最小。闭式解(closed-form):一种包含基本函数的解的形式,可以给出任意自变量的因变量。

2024-09-21 20:54:42 1021

原创 吃瓜学习①

可通过看一个学习器的ROC曲线是否将另一个包住,或比较两个ROC曲线下的面积(AUC)来判断两者的优劣。查准率(precision):P=TP/(TP+FP),选出来的瓜有多少是好的(感觉跟准确率差不多)。P—R曲线:比较曲线下的面积大小,或比较平衡点处(即查准率=查全率)的值,可以用于衡量学习器的优劣。谈论算法的优劣,必须要针对具体的实际问题。回归(regression)算法:预测的是连续值,如处于0~1之间的0.12,0.76等。TP(真正例),FN(假反例),FP(假正例),TN(真反例)。

2024-09-18 08:17:47 406

原创 Datawhale 夏令营 AI for science(AI+药物科学)

两种数据类型中都有nunique()和unique()方法。unique()方法返回的是去重之后的不同值,而nunique()方法则直接放回不同值的个数。若数据有n种类别则产生n列,生成一个类似分类表格的东西,表格中依据元素对各行各列对应值赋予1或0.用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列,同时列出数据和数据下标。在这篇文章中,我主要对解读代码过程中所学习认识的一些知识点进行归纳总结。用于统计tokens中各元素出现频率,并返回一个字典,tokens为一个可迭代对象。

2024-08-04 00:02:45 153

原创 Datawhale夏令营——机器学习小白笔记

根据我的理解,train文件中的大部分数据用于训练模型,小部分用于验证模型的效果,验证集的数据经过预测模型得到的预测值与实际值通过损失函数后得到loss值,并将其进行反向传播从而优化模型本身(有点像高中生物中的反馈调节)。历史平移特征主要用于获取前阶段的信息,而窗口统计特征则主要用于构建不同窗口大小,并获取相应窗口的均值、最值、方差等信息来反映最近阶段数据的变化情况。先前我了解到深度学习模型中数据往往要分为train、val、test三个部分,在这次学习中我对这个分段有了新的认识。

2024-07-20 23:45:28 257

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除