fastai机器学习课程-甲骨文 ORADC-AIG学习公开课(Lesson1)

该博客介绍了fastai机器学习课程的第一课,内容涵盖Kaggle实战、特征工程、数据预处理,特别强调了随机森林的重要性。通过Kaggle Kernel实践,演示了安装fastai库、数据探索、类别转换等步骤,并讨论了数据建模的两种方法,包括随机森林在结构化数据中的应用。同时,解释了评估指标如RMSLE在价格预测项目中的作用,并批驳了维数灾难和没有免费午餐定理的误解。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Hi,这是我们第一次公开课。之所以有这个分享课程是因为大家太忙(懒),没有时间看fastai在线视频和笔记。而且视频和笔记都是英文的,大家也不想费脑子(懒)。所以本课程的目的就是把Jeremy老师的视频用中文再给大家讲一遍,另外把Hiromi小姐的笔记翻译加工一下分享给大家。

首先,下载并安装一些在本地可能用到的工具Anaconda(python3.7),git。
接下来可以clone fastai的repo到本地,比较大,慢慢烤……
https://github.com/fastai/fastai
直接git clone就可以,因为根据StackOverflow有人问的:
from StackOverflow

课程教授方式采用Jeremy老师的自上而下教学法——先有宏观概念(应用),然后再深入需要的细节。刚开始时把精力放在”能做什么“上,而不是抽象概念上。

  学习方法:
  1.参加Kaggle竞赛
  2.创建Kaggle kernels


(假标题)随机森林:Blue Book for Bulldozer

Note| Kaggle

1. 薅Kaggle kernel羊毛

1.1 初始设定

创建Kernel;
在这里插入图片描述
添加数据;
在这里插入图片描述
启用GPU;
在这里插入图片描述

启用internet连接;
在这里插入图片描述
现在可以使用6个小时了(单次训练累计时间);

接下来可以上传导入ipynb文件,不过最好是自己敲一遍代码啦。
在这里插入图片描述

1.2 安装fastai库

!pip install fastai==0.7.0
!pip install torchtext==0.2.3

(对于fastai2018年的ML课程,要使用fastai 0.7版本。)接下来看看安装到哪里去了:

!pip show fastai

1.3 自动重新加载&导入(autoreload%魔法命令

%load_ext autoreload
%autoreload 2
%matplotlib inline
from fastai.imports import *
from fastai.structured import *
from pandas_summary import DataFrameSummary
from sklearn.ensemble import RandomForestRegressor, RandomForestClassifier
from IPython.display import display
from sklearn import metrics

数据科学 ̸ = \not=

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值