离开题还有4天,发现自己基本上什么都不会,哭了,从今天开始每天看五篇论文,每天写笔记,更新在这里。
16年题目:
为慈善机构设计援助方案,使投资回报率最大。特点:大数据,数据需要自己处理。数据挖掘。
需要提交:
总结(一页);写给CFO的信(需要包括最优投资策略,建模方法,主要结果。简要谈谈你对ROI的定义,不超过两页);论文(竟然没有提到论文的长度?大概是不要求?)
# 50193
这一组用的方法,K均值算法,层次分析法,都是很低级的方法,整篇文章的遣词造句也中式英语明显,但依旧是欧奖,我认为原因在1,考虑得非常全面,他们考虑到了时间和地理因素的影响,以及经济学方面的影响。建模应该贴近现实且尽可能丰富详实。2,讲得很清楚,例如对K均值算法的公式理论讲解,实在是很清楚。用k均值填补缺失不算新颖?一个一个模型看起来不难,但是组合起来就是欧奖。
这一组里应该至少有一个是经济学专业的
这一组考虑到边际效应,不会将大量钱投给哦同一所学校,但是就慈善机构的性质和名声来说,这样做可能无法体现出慈善的效益,所以我认为应该重点扶持一两所学校,然后分散对其他学校的投资,在有重点的情况下不把鸡蛋放在一个篮子里。
1. 数据处理:
这里可以有一个数据处理流程图
筛选 —— 删去小于初始值的
合并参数 —— linear fitting 和PCA(主要成分筛选)
填补缺失数据 —— k均值聚类,用每一类的均值去填补缺失项的值,是很好的数据填补方法,比直接取平均值好。
使各个数据能比较 —— normalize data 数据归一化
什么是填补缺失数据维基百科:https://en.wikipedia.org/wiki/Imputation_(statistics)
机器学习里缺失数据填补的拓展阅读: https://www.zhihu.com/question/26639110
数据归一