机器学习的一些感悟(一)

本文作者分享了学习机器学习的心得,从问题抽象到模型选择、调优的完整流程,并探讨了二分类器转多分类器的方法。此外,对比了逻辑回归与SVM,解释了两者间的差异,以及最大似然估计与最小二乘的关系,同时概述了GBDT、随机森林和XGBoost的区别及其背后思想。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

          自己研究方向的社交网络,会用到一些机器学习的方法,本身自己也很感兴趣,从去年开始就开始了学习,学习经历和相关资料,代码见GitHub主页:

https://github.com/lovesoft5/ml

         学习机器学习大半年了,下面是自己整理的一些心得笔记

         机器学习广泛应用于计算机视觉,自然语言处理,信息检索,推荐等领域,因为涉及面太广,现在并没有一个完整的定义什么是机器学习。个人偏向的理解是:机器学习过程本质都是在一个样本空间中,找出一个模型、搜索一组参数,按照需要使其描述这个样本空间(损失函数最小),从而可以对新样本做出某种判断。

       一个完整的机器学习项目大体有如下步骤(kaggle比赛流程也大体如下):

       首先、将所要解决的问题抽象成机器学习的问题(类似数学建模),目标问题到底是一个什么问题,分类,回归还是聚类问题,要达到的目标是什么,对准确率的要求等。

       其次、明确该项目可以获取哪些数据,大概有多少样本,多少个特征,训练的时候内存占用量,需不需要用分布式,

       接着、考虑对特征数据做处理和选择,包括特征筛选,数据清晰ÿ

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值