2016 美赛C题欧奖论文学习笔记①

离开题还有4天,发现自己基本上什么都不会,哭了,从今天开始每天看五篇论文,每天写笔记,更新在这里。

16年题目:

为慈善机构设计援助方案,使投资回报率最大。特点:大数据,数据需要自己处理。数据挖掘。

需要提交:

总结(一页);写给CFO的信(需要包括最优投资策略,建模方法,主要结果。简要谈谈你对ROI的定义,不超过两页);论文(竟然没有提到论文的长度?大概是不要求?)

# 50193

这一组用的方法,K均值算法,层次分析法,都是很低级的方法,整篇文章的遣词造句也中式英语明显,但依旧是欧奖,我认为原因在1,考虑得非常全面,他们考虑到了时间和地理因素的影响,以及经济学方面的影响。建模应该贴近现实且尽可能丰富详实。2,讲得很清楚,例如对K均值算法的公式理论讲解,实在是很清楚。用k均值填补缺失不算新颖?一个一个模型看起来不难,但是组合起来就是欧奖。

这一组里应该至少有一个是经济学专业的

这一组考虑到边际效应,不会将大量钱投给哦同一所学校,但是就慈善机构的性质和名声来说,这样做可能无法体现出慈善的效益,所以我认为应该重点扶持一两所学校,然后分散对其他学校的投资,在有重点的情况下不把鸡蛋放在一个篮子里。

1. 数据处理:

这里可以有一个数据处理流程图
筛选 —— 删去小于初始值的
合并参数 —— linear fitting 和PCA(主要成分筛选)
填补缺失数据 —— k均值聚类,用每一类的均值去填补缺失项的值,是很好的数据填补方法,比直接取平均值好。

使各个数据能比较 —— normalize data 数据归一化

什么是填补缺失数据维基百科:https://en.wikipedia.org/wiki/Imputation_(statistics)

机器学习里缺失数据填补的拓展阅读: https://www.zhihu.com/question/26639110

数据归一

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值