由于是在不会打公式,所以只能白话说下自己的认识.
深度学习和统计领域一些知识的结合,比如条件随机场crf,再比如这个deepar,都是在损失函数上做文章.
deepar预测的不是数据本身,而是数据分布的参数.比如模型预测出价格时间序列的均值和方差,假设分布是正态分布,那么损失函数怎么构造了? deepar预测的不是一个时间点,比如预测7天,那么每天都会预测出一个均值和方差, 这一共就是7组模型参数,我们需要:在每组参数条件下,给定实际价格出现概率最大,也就是给定7组参数,7个正态分布连乘概率最大(似然函数). 那么损失函数就是对这个似然函数取负log,损失函数最小就好.
把这个损失函数放到seq2seq的模型中,就是deepar的主干框架思想脉络.,确实结合的很巧妙. 并没有太多新东西,但是可以让seq2seq的预测可以和置信区间这些统计概念结合,从而实用度更高,而不是简单算命.
文章探讨了深度学习与统计方法如条件随机场和Deepar的融合,Deepar通过预测数据分布参数而非点值,构建基于似然函数的损失函数,将其融入seq2seq模型,提高预测的实用性和置信区间考虑。
2285

被折叠的 条评论
为什么被折叠?



