机器学习分类算法实战:从基础到集成方法
1. 数据集拆分与分类目标
在进行模型训练之前,对数据集进行合理拆分是确保模型有效性和泛化能力的重要步骤。Dr. Judy计划从训练数据集中训练模型,然后使用该模型预测测试数据集中的值,以此来确定模型的优劣。以下是她用于训练/测试拆分的代码:
features_of_choice = [u'Age', u'Gender', 'DayOfTheWeek', 'Diabetes',
'Alcoolism', 'HiperTension',
'Smokes', 'Scholarship', 'Tuberculosis', 'Sms_Reminder',
'AwaitingTime', 'AppointmentRegistration_year',
'AppointmentRegistration_month',
'AppointmentRegistration_day', 'ApointmentData_year',
'ApointmentData_month',
'ApointmentData_day', 'AppointmentRegistration_hour',
'AppointmentRegistration_min',
机器学习分类算法实战指南
超级会员免费看
订阅专栏 解锁全文

7249

被折叠的 条评论
为什么被折叠?



