一.问题一
方法概述:
1.数据预处理---->数据相关性分析-->粗大误差分析-->针对果蔬品种的营养素成分和含量,建立分级打分制度,定义‘营养价值’,‘常见度’,‘研究价值’等指标
-->筛选出8种水果和6种蔬菜
2.回归模型,预测各种果蔬的年产量
3.Logistic模型对预测结果进行修正,改进回归模型的产量预测结果
实际:
http://202.127.42.157/moazzys/shuiguo_cx.aspx 农业部种植管理司数据 发现12中水果占据中水果的90%
1. 定义一种指标常见度com(i,j): 表示第i种水果在j年的产量与j年的水果总产量的比值
比如2002-2010年:可以计算各年各种水果的常见度平均值
2.各种水果打分机制
算出水果在每个营养指标中的最小,最大值以及它们的中位数,C=0,score=0;0<C<Cmid,score=1;C>Cmind,score=2,计算各种水果的总分
3.研究价值指标计算
RVal(i)=Com(i,j)*Score(i)
根据研究价值确定前8中水果进行研究
4.基于相关分析的变量分析
相关系数