[新的程序见:http://blog.youkuaiyun.com/barrypp/article/details/7976132]
[旧的程序见:http://blog.youkuaiyun.com/barrypp/article/details/7969633]
基于一次回归和二次回归进行时间预估。具体来讲,基于你之前看连续剧、漫画的时间位置信息,来预测之后第几集什么时候看完。
时间预估
基于一次、二次回归运算
说明:其中一次回归运算中,从使用全部数据到仅使用后几个(较新的)数据的计算都有。二次回归运算则使用全部数据。本程序适合于在观看速率不会发生大幅改变的情况下进行预测。
To Do : 现阶段的预测方式不是最佳的,一种更好的策略是,根据历史数据,统计出所有可能的速率,再用模糊分类的方法将这些速率分成几类(近似的分为一类),然后分别利用这几类速率的平均值和方差在最新观测点上进行预测。不过这项工作量太大,估计我是不会做了。--barrypp--20120912221101
Created By Barrypp At 20120909235258
Modified By Barrypp At 20120910184110
Modified By Barrypp At 20120910205741
Modified By Barrypp At 20120911224955
Modified By Barrypp At 20120912181002
Modified By Barrypp At 20120912212342
Finished By Barrypp At 20120912223924
TMfoF=23+25/60;LSN=26;Data={{6,2,18,0},{6,12,18,10},{7,2,18,20},{8,16,18,53},{9,15,20,11},{10,2,20,18},{11,2,20,31},{12,2,20,44},{14,2,21,23},{15,2,21,31},{16,2,21,42},{16,11,22,15},{17,2,22,18},{18,2,22,20},{19,2,22,31}};
(*
Data的格式为,四个数字一组,示例{当前集数,已播放时间的分钟数,时间的小时数(24h),时间的分钟数};
TMfOF是Total Minutes for one File in a collection,每一集的分钟数;
LSN是Last Serial Number in a collection最后一集的集数。
*)
BeginTime=SessionTime[];
InData={#1[[1]]+#1[[2]]/TMfoF,#1[[3]]+#1[[4]]/60}&/@Data;
StandardLine[VarX_]=TMfoF VarX/60+InData[[1,2]]-TMfoF InData[[1,1]]/60;
(*一次回归*)
Expected=LinearModelFit[#1,{x},x]&/@NestList[Rest,InData,Length[InData]-2];
Print["一次回归曲线组:"]
Show[ListPlot[InData,Mesh->Full,Joined->True,PlotStyle->Directive[Red,PointSize[Large]]],Plot[StandardLine[x],{x,InData[[1,1]],LSN+1},PlotStyle->LightRed],Plot[Evaluate[Through[Expected[x]]],{x,InData[[1,1]],LSN+1},PlotStyle->Table[GrayLevel[1-i/Length[Expected]],{i,1,Length[Expected]}]],PlotRange->All,AxesLabel->{"集数","时间"}]
(*二次回归*)
Expected2=LinearModelFit[InData,{x,x^2},x];
Print["二次回归信息及曲线:"]
Expected2["ANOVATable"]
StringForm["R^2==``",Expected2["RSquared"]]
Normal[Expected2]
Show[ListPlot[InData,Mesh->Full,Joined->True,PlotStyle->Red],Plot[Expected2[x],{x,InData[[1,1]],LSN+1}],PlotRange->All,AxesLabel->{"集数","时间"}]
(*时间预计表*)
OutputTable=Table[Prepend[Item[StringForm["``:``",(TempY=IntegerPart[#1]),If[(TempX=IntegerPart[60FractionalPart[#1]])>=10,TempX,StringForm["0``",TempX]]],Background->Which[TempY>=24,LightRed,TempY>=23,LightYellow,True,None]]&/@Through[Join[{StandardLine},Expected,{Expected2}][n]],StringForm["第``集",n]],{n,IntegerPart[InData[[-1,1]]]+1,LSN+1}];
PrependTo[OutputTable,Join[{"集/小时",NumberForm[N[60/TMfoF] ,{10,2}]},NumberForm[1/#1[[2]],{10,2}]&/@Through[Expected["BestFitParameters"]],{Null}]];
PrependTo[OutputTable,Join[{"预计开始时间","标准","一次回归"},Table[StringForm["后``个",i],{i,Length[InData]-1,2,-1}],{"二次回归"}]];
Grid[OutputTable]
EndTime=SessionTime[];
Row[{"耗时:",IntegerPart[1000*(EndTime-BeginTime)],"ms"}]
环境是 Wolfram Research Mathematica v8.0.4.0
输出结果示例: