预测内容传播力与股市走势:机器学习的应用
预测内容传播力
在内容传播力预测方面,我们可以将预测值、实际值以及两者差异的百分比放在一起对比查看。通过以下代码可以查看相关描述性统计信息:
deltas['delta'].describe()
运行上述代码后得到的结果看似很不错,中位数误差为 0。然而,由于误差存在正负两方面,且往往会相互抵消,所以这一信息的实际作用有限。我们需要采用更具信息量的指标来评估模型,这里选择用均方根误差占实际均值的百分比来评估。
为了说明该指标的有效性,我们对两个样本序列进行如下操作:
import pandas as pd
import numpy as np
a = pd.Series([10,10,10,10])
b = pd.Series([12,8,8,12])
np.sqrt(np.mean((b-a)**2))/np.mean(a)
将其与均值对比:
(b-a).mean()
显然,前者是更有意义的统计量。接下来对我们的模型进行同样的操作:
np.sqrt(np.mean((y_pred-y_actual)**2))/np.mean(y_actual)
运行后会发现,原本看似出色的模型效果大
超级会员免费看
订阅专栏 解锁全文
15

被折叠的 条评论
为什么被折叠?



