华数杯国际赛作为一个周六早六点开赛、周三早九点结束的英文论文竞赛,其时间、题目类型与美赛高度相仿。可以作为美赛之前唯一的练手赛进行队伍磨合、时间熟悉,个人是比较推荐进行学习的。
同时,该比赛可以在美赛开始前出成绩,这也进一步可以帮助大家了解自身实力。
该届竞赛题目类型与美赛MCM\ICM高度一致,整体难度约为美赛的60-70%左右。下面为大家带来B题超详细解题思路+数据集分享。(该思路为初步思路,实际思路可能会随着解题深入有所偏差)
题目要求针对中国未来产业结构调整,建立数学模型分析和优化政府投资,以实现GDP最大化和促进就业。具体包括产业间关系分析、投资与GDP关系建模、投资分配优化等多个方面。
数据类题目第一步就是进行数据收集以及清洗工作。我们从1400个国家宏观指标、500个各行业指标数据提取出176个与华数杯B题相关数据。具体如下所示
通过网盘分享的文件:华数杯国际赛B题数据集
链接:https://pan.baidu.com/s/1g5eW57JzJPxo34I9r2w-oQ提取码:9ftb
--来自百度网盘超级会员v6的分享
对于收集到的数据,我们进行合并后需要进行必要的数据清洗,例如数据记录过程中存在不可抗拒的异常值、数据丢失、并非逐年数据的情况。具体而言前几年数据没有近几年数据没有中间部分存在缺失值,数据并非逐年数据等情况,对于异常数据、缺失数据我们需要进行必要的处理。下图为,我们使用线性插值进行填充的部分结果图
问题一:分析中国主要产业之间的相互关系
题干:分析中国主要产业(农业、工业、服务业等)之间的相互促进与制约关系。讨论这些相互关系如何影响经济发展。
需要收集的具体数据:
问题 | 涉及领域 | 相关指标 |
问题一 | 产业链关系、贸易结构、基础设施对产业支持 | 制造业 服务业 税收政策 进口与贸易 农业产出 产业产出 出口与贸易 房地产业 建筑业 金融服务 采矿业 工业产出 化学工业 能源供应 能源加工 食品制造 信息技术 运输与物流 基础设施 贸易与GDP 其他制造业 综合产出 综合投入 |
具体而言,我们需要分析各行业之间的关系,以及各行业之间与经济发展的关系。通过分析关系找到行业之间的微妙联系。例如,A行业的增加可以促进B行业的发展
具体而言,我们使用的指标存在关系如下所示
行业名称 | 所属产业 | 备注 |
农林牧渔 | 第一产业 | 包括农业、林业、畜牧业和渔业,是典型的第一产业。 |
采矿业 | 第一产业 / 第二产业 | 主要属于第一产业,但在某些分类中也被视为第二产业。 |
其他制造业 | 第二产业 | 包括各种制造活动,如机械制造、电子制造等。 |
化学工业 | 第二产业 | 涉及化工产品的生产和加工。 |
建筑业 | 第二产业 | 涉及建筑物和基础设施的建设。 |
金属制造 | 第二产业 | 生产和加工金属制品。 |
机械制造 | 第二产业 | 生产各类机械设备。 |
纺织服装 | 第二产业 | 生产纺织品和服装。 |
电力供应 | 第二产业 / 第三产业 | 通常归类为第二产业的基础设施,但有时也视为第三产业的一部分。 |
IT服务 | 第三产业 | 提供信息技术相关的服务,如软件开发、IT支持等。 |
金融业 | 第三产业 | 包括银行、保险、投资等金融服务。 |
食品饮料 | 第二产业 / 第三产业 | 加工环节属于第二产业,销售和服务环节属于第三产业。 |
这里,我们可以首先绘制总产值与第一二三产业的在分别绘制第一二三产业内部的相关性最后在绘制总产值与所有行业的相关性,增增递进的分析。最后根据相关性分析结果,进行部分变量的线性回归模型构建,通过线性回归模型构建二者之间的关系。
问题二:建立投资与产业 GDP 关系的理论模型
目标:请建立一个或多个投资理论模型,研究投资与个体行业的国内生产总值(GDP)之间
的关系,并对模型进行评价
基于收集的数据,对每一个行业内部构建简单的线性回归模型即可,具体结果如下所示
GDP_Agriculture = 1680960.7503 + 0.6058 * Invest_Agriculture
GDP_OtherManufacturing = 31053044.0481 + 0.2021 * Invest_OtherManufacturing
GDP_ChemicalIndustry = 22810524.6995 + 0.1564 * Invest_ChemicalIndustry
GDP_Construction = 3121773.6566 + 0.2489 * Invest_Construction
GDP_ITServices = 11060215.8759 + 0.4095 * Invest_ITServices
GDP_Finance = -14137462.5177 + 0.7009 * Invest_Finance
GDP_FoodBeverage = 2722082.7368 + 0.2367 * Invest_FoodBeverage
GDP_WholesaleRetailHospitality = 2974932.6738 + 0.5530 * Invest_WholesaleRetailHospitality
GDP_MetalManufacturing = -3207357.9320 + 0.2111 * Invest_MetalManufacturing
GDP_Mining = -1021716.3651 + 0.4879 * Invest_Mining
GDP_MechanicalManufacturing = 22158003.5613 + 0.1865 * Invest_MechanicalManufacturing
GDP_RentBusiness = 13417553.3691 + 0.4860 * Invest_RentBusiness
GDP_ElectricitySupply = 1397989.5591 + 0.2938 * Invest_ElectricitySupply
GDP_TextileApparel = 18226488.2160 + 0.1722 * Invest_TextileApparel
问题三:在1万亿资金下实现GDP最大化的投资分配
目标:在总投资1万亿元的限制下,确定各产业的投资分配,以实现GDP的最大化。提供无行业限制和限制投资于三个行业的两种方案。
具体而言
决策变量
各产业的投资对GDP的边际贡献率(来自问题二的模型结果)。
各产业的投资上限和下限(如政策限制)。
下图为有无行业限制下 输出结果。(约束不理想、正在尝试修正)
问题四:促进就业率与改善工作质量的投资分析
目标:分析哪些产业的投资能有效促进就业率和提升工作质量。调整问题三的投资计划以优先考虑就业目标。
解题思路:引入就业相关数据,作为新的约束条件进行约束求解。
问题五:综合GDP增长与就业改善的投资方案
目标:综合考虑GDP增长和就业改善,提出可持续的投资方案。考虑长期发展和可持续发展的原则,优化投资分配。
解题思路:权衡分析: 确定GDP增长与就业改善的权重或使用多目标优化方法。收集环境影响、资源利用效率、资源利用率等指标,作为可持续发展的体现,在问题四的基础上进一步进行约束求解。
可持续发展相关数据(如碳排放、资源消耗)。
社会经济指标(如贫困率、区域发展差异)。
各产业的创新能力和技术发展数据。