softmax函数定义:
假设我们有一个数组,V,Vi表示V中的第i个元素,那么这个元素的Softmax值就是
即某元素的指数和所有元素的指数和的比值。
解释:
softmax函数为一个概率函数,Max函数表示,如果a>b,则取a,b就不可能被取到,而softmax计算每个元素被取到的概率,a取到的概率大于b,则a经常被取到,但也有被取到的可能。相当于把所有的元素都拉出来做一个评分,再进行归一化,然后排序。
《一天搞懂深度学习》中是这样表达的:
通过softmax函数一作用,就映射成为(0,1)的值,而这些值的累和为1(满足概率的性质),那么我们就可以将它理解成概率,在最后选取输出结点的时候,我们就可以选取概率最大(也就是值对应最大的)结点,作为我们的预测目标。
https://zhuanlan.zhihu.com/p/25723112
这是一个博士大神在知乎上的解释,我觉得解释的特别透彻。拿走不谢。