16年暑期的时候有幸在老师的带动下和200多位同学一起在微信群里发红包,用大量的实际数据研究了微信红包背后的故事。
此片文章主要分析微信群中红包发放的数据,找到红包金额分布规律、时序分布规律以及每个人多次抢到的红包金额的分布规律。最后给出一个抢红包的最佳策略建议。
1.1分析
根据提供的20个红包数据进行数据分析。数据可自行下载:20个红包数据
(1)根据这20个红包,每个红包进行100次分配抢红包,共2000个样本数据。以红包金额为横轴,以领取该金额的人数、百分比为纵轴作图,分析红包金额分布规律,拟合相应的函数并验证。
(2)通过计算每个红包中第i次抢红包的平均数、中位数,以及红包收益曲线的叠加图来分析时序分布规律。给出一个最佳的抢红包策略。
(3)由于数据缺乏统计某一人的红包金额,所以在这里不对每个人多次抢到的红包金额分布规律进行讨论。最后,设计红包金额分布规律的算法,与实验数据进行对比。
1.2红包金额分布规律
>> data=xlsread('sample.xlsx');
>> tabulate(data(:))
>> x=data(:);
>> x=sort(x);
>> d=diff([x;max(x)+1]);
>> count=diff(find([1;d]));
>> y=[x(find(d)) count];
>> x=y(:,1);
>> z=y(:,2);
>> bar(x,z);
得出红包金额分布规律图:
>> plot(x,z);
得到红包金额的分布散点图:
再对这2000个样本数据进行拟合,以正态分布函数为基础:
>> cftool