2023美赛春季赛Y题全网最全数据包+可执行性代码+模型建立+43页PDF完整版思路整合。选择线性SVM、优化超参数的SVM、优化的决策树、集成学习-提升树、优化的集成学习模型;

本博客详细解析2023年美赛Y题,涉及二手帆船定价模型构建,包括数据预处理、模型建立(线性SVM、优化SVM、决策树、提升树、集成学习)、地理区域影响分析,特别是香港(SAR)市场。讨论了如何处理分类与连续数据关系,并提出了在缺乏数据时的解决方案。同时强调在解答过程中寻找有趣结论的重要性,为帆船经纪人提供报告建议。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

2023美赛Y题思路如下:

1. 题目分析:首先由于二手帆船领域的专业性,相关数据信息的获取比较难,可以参考二手领域其他产品(二手车、二手房)的定价原理等信息来构建建模思路。其次,数据预处理方面,对缺失值的处理常用方法包括:最近邻算法、拉格朗日插值处理、三次卷积等。

 

2. 思路分析:定价模型在往常国赛出现过,可以用作思路参考。本题难度系数较大,核心是构建二手帆船定价模型,第一步我们可以搜集更多二手帆船领域的网站,第二步使用八爪鱼等爬虫技术进行数据爬取,第三步建立模型,将价格与其他数据信息建立关系。

3. 另外需要思考:分类数据与连续数据如何建立关系模型?两个分类变量关系可以使用卡方检验,而分类数据与连续数据之间关系可以用方差分析或者T检验,进而找到连续数据与分类数据之间的关系。前两题都是要求建立分类数据与连续数据的关系,注意尽量不要使用同一种方法分析。

 

问题三、讨论你对给定地理区域的建模如何在香港(SAR)市场上发挥作用。从提供的电子表格中选 择一个信息丰富的帆船子集,分为单船体和双体船。从香港(SAR)市场找到该子集的可 比上市价格数据。建模香港(特区)对子集中帆船的每艘帆船价格的区域影响(如果有的话)。 双体帆船和单体帆船的影响是一样的吗?

问题三,问题三的设问不同于问题一二,问题三要求我们单独的对香港这一地理区域

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值