【Kaggle】 Digit Recognizer 详解

该博客详细介绍了如何在Kaggle的Digit Recognizer比赛中使用随机森林(RF)分类器达到0.966的准确率。通过链接可以访问比赛平台,内容包括代码实现及解析。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Kaggle : https://www.kaggle.com/c/digit-recognizer/



准确率:0.966

分类器:随机森林


代码详解:


import pandas as pd


# Random Forest Classifier
def random_forest_classifier(train_x, train_y):
	from sklearn.ensemble import RandomForestClassifier
	#使用RF分类器模型,定义三个参数值n_estimators=400, n_jobs=4, verbose=1
	model = RandomForestClassifier(n_estimators=400, n_jobs=4, verbose=1)
	model.fit(train_x, train_y)
	return model

#数据读取
def read_data(data_file):
	data = pd.read_csv(data_file)
	train = data[:int(len(data) * 1)]
	test = pd.read_csv("/Users/Cheney/Downloads/kaggle(方老师)/test.csv")
	#将标签和features分开
	train_y = train.label
	train_x = train.drop('label', axis=1)
	return train_x, train_y, test


if __name__ == '__main__':
	data_file = "/Users/Cheney/Downloads/kaggle(方老师)/train.csv"
	#用模型进行训练
	train_x, train_y, test = read_data(data_file)
	model = random_forest_classifier(train_x, train_y)
	#预测数据
	predict = model.predict(test)
	#数据写出
	dataframe = pd.DataFrame(predict)
	dataframe.to_csv('/Users/Cheney/Downloads/kaggle(方老师)/res.csv')




评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值