自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 【Datawhale AI夏令营】用AI预测新用户上分技巧

最近参加了Datawhale的AI夏令营的机器学习方向,其主要任务是根据科大讯飞举办的用户新增预测挑战赛来进行项目实践。借此机会来学习一些机器学习相关的内容,下面是我在学习过程中写的一些浅显笔记,还请大家批评指正。对于赛题及Datawhale提供的baseline解析的详细内容见我的另一篇文章。在这篇文章中主要讲如何改进baseline来提高预测的准确性。

2025-07-14 20:42:33 429

原创 【Datawhale AI夏令营】用AI预测新用户

根据科大讯飞提供海量应用数据作为训练样本,并基于提供的样本构建模型,预测用户新增情况。数据中共有15个字段,其中is_new_did字段为预测目标,即是否为新增用户,若为0则为老用户,若为1则为新用户。本次比赛采用f1_score作为评价标准,分数越高,效果越好。

2025-07-13 22:00:59 1023

原创 【机器学习笔记小白版】(7)支持向量机

对于给定的数据集XXX和超平面wTxb0w^Tx+b=0wTxb0,定义数据集XXX中的任意一个样本点xiyiyi∈−11i12mxi​yi​yi​∈−11i12...mγiyiwTxib∣∣w∣∣γi​∣∣w∣∣yi​wTxi​b​正确分类时,γi0\gamma_i>0γi​0,几何间隔此时也等价于点到平面的距离。没有正确分类时,γ。

2025-07-07 00:12:07 746

原创 【机器学习笔记小白版】(6)神经网络

神经网络,即neural networks。在机器学习算法中是指神经网络学习模型。在一个神经网络中,最基本的成分就是神经元。在与生物学上的神经元概念相类似,即一个神经元接收到来自其他神经元的信号(即输入),然后根据信号强度其给出相应的反应(即输出)。对于神经网络模型有很多,由于笔者知识有限,此处以感知机模型为例。

2025-07-04 02:26:36 839

原创 【机器学习笔记小白版】(5)决策树

决策树,即decision tree,常用于分类任务。其采用二叉树或n叉数的形式来对样本进行分类,需要标记的样本数据来进行决策树的构造。

2025-07-01 02:21:00 821

原创 【机器学习笔记小白版】(4)线性判别分析

线性判别分析,即Linear Discriminant Analysis,简称LDA。该方法是一种监督分类方法,需要用到样本类别标记信息。它是对给定的训练数据集进行坐标变换,或者说进行投影,投影到另一个坐标系中,使其每种类别内的差异最小,类间的差异最大。可以将其应用在二分类问题中。

2025-06-28 02:34:51 550

原创 【机器学习笔记小白版】(3)对数几率回归

对数几率回归即Logistic Regression回归,其主要是做分类任务。其主要原理为在线性模型的基础上套一个映射函数来实现分类功能。例如通过将线性模型的输出映射到0和1之间,从而实现二分类。

2025-06-25 00:34:40 624

原创 【机器学习笔记小白版】(2)线性回归

线性回归模型根据自变量的多少可以分为一元线性回归和多元线性回归。对于一元线性回归模型,其原理与中学的所学的一元线性模型一致,对于多元线性回归模型其为一元线性回归模型的多元扩展,即由单个变量x变为了多个变量x\textbf{x}x,从矩阵角度来看待模型。对于线性回归模型,其既可以处理回归问题,也可以处理分类问题。在进行线性回归模型建模之前需要标记数据集Dx1y1x2y2xmymDx1​y1​x2​y2​...xm​ym​,其中xix。

2025-06-22 00:04:30 858

原创 【机器学习笔记小白版】(1)机器学习简述及基本术语

机器学习是指通过计算机,基于现有的数据产生模型,在面对未知情况时,可以通过模型对其进行相应的判断。这与人的学习过程相似,人在学习过程中是基于过往积累的经验,形成一定的思维体系,在面对情况时来对其进行有效的决策。机器学习主要擅长三类任务,分别为回归(regression)分类(classification)和聚类(clustering)。回归是指在处理连续数据如时间序列数据时对数据未来状态进行预测的一种技术。分类是指对离散数据进行学习,确定未知数据类型的技术。

2025-06-19 01:31:50 475

原创 【Markdown入门】Markdown简介及语法介绍

Markdown是一种轻量级的标记语言,可用于在纯文本文档中添加格式化元素。Markdown由 John Gruber 于 2004 年创建,如今已成为世界上最受欢迎的标记语言之一。它可以使普通文本内容具有一定的格式,可以导出PPTLaTexHTMLWordPDFEpubJPG等多种格式的文档,文档后缀为.md。Markdown在编辑文本方面较为流行,其语法也较为简单,较容易上手。

2023-03-22 22:51:42 453

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除