有一条公式,跟理论差很多,paper上是一个形式,实现的时候是另外一个形式。
我翻了很多参考代码和论文,没有找到原因。
所以甚至怀疑给出这条公式的人是有阴谋的,公式故意给得不全。或者只给了部分。
这样的情况持续了大概1年。
后来偶然看一个讲座视频,里面的人提到了这个公式的来由:实验发现效果更好,所以跟理论的不一样。
这大概就是有人带和自己摸索的区别吧~!
有一条公式,跟理论差很多,paper上是一个形式,实现的时候是另外一个形式。
我翻了很多参考代码和论文,没有找到原因。
所以甚至怀疑给出这条公式的人是有阴谋的,公式故意给得不全。或者只给了部分。
这样的情况持续了大概1年。
后来偶然看一个讲座视频,里面的人提到了这个公式的来由:实验发现效果更好,所以跟理论的不一样。
这大概就是有人带和自己摸索的区别吧~!