交叉熵损失函数
深度学习–交叉熵损失函数
二分类
如果要预测事件的结果只有两种情况–是或不是,用计算机语言来说要么为 1 ,要么为 0 ,那么在设计损失函数时就可以使用二分类的交叉熵损失函数。
例如,在判断图片是否为猫时,一张图片的预测结果只可能有两个:
- 这张图片的内容是猫

- 这张图片的内容不是猫

我们对二元交叉熵损失函数定义如下:
令单个样本的二元交叉熵损失 为
取所有样本损失的平均值:
我们称这个 函数为代价函数(成本函数)
上式中的符号解释:
- :真实标签,值为1或0,表示是猫/不是猫。
- :预测值,默认认为它是猫的概率,介于 。
可以发现,
当 时,表示该图片是猫,二元交叉熵函数的 项为 ,此时计算项的概率对数。损失 , 越接近 ,表示模型认为该图片是猫的概率越高,预测的就越准,损失函数的LOSS值越接近 ; 越接近 , 表示模型预测的越不准,损失函数的LOSS值就会趋于无穷大。
当 时,表示该图片是不是猫,二元交叉熵函数的 项为 ,相应的 项就为 , 此时计算项的概率对数。损失 , 越接近 ,表示模型认为该图片是猫的概率越低,预测的就越准,损失函数的LOSS值越接近 ; 越接近 , 表示模型预测的越不准,损失函数的LOSS值就会趋于无穷大。
函数图像

注意到这是凸函数,可以通过求导 收敛到局部最优
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 HLAIA-光子!
评论






