机器学习笔记 - 基于CNN+OpenCV的图像着色

本文简要介绍了Richard Zhang等人在ECCV 2016发表的论文,该论文提出了一种利用卷积神经网络(CNN)对灰度图像进行着色的方法。通过在ImageNet数据集上训练,网络能够生成视觉上令人信服的颜色恢复结果。论文中提到,目标是创建能够欺骗人类观察者的合理着色,而非精确地恢复原始颜色。网络采用Caffe和Pytorch实现,并提供了相应的代码和模型链接。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、论文简读

1、概述

        在 ECCV 2016 中,Richard Zhang、Phillip Isola 和 Alexei A. Efros 发表了一篇题为“彩色图像着色”的论文,其中他们提出了一种用于对灰色图像进行着色的卷积神经网络。他们使用 ImageNet 训练集中的 130 万张图像训练网络。作者还公开了一个经过训练的基于 Caffe 的模型。

        目标不是恢复实际的地面真实颜色,而是产生可能欺骗人类观察者的合理着色,对灰度图像的语义和纹理及其颜色版本之间的统计依赖关系进行足够多的建模,以产生视觉上引人注目的结果。

        给定亮度通道 L,在CIE Lab颜色空间中预测图像对应的 a 和 b 颜色通道。用作训练示例,将图像的 L 通道作为输入,将其 ab 通道作为监督信号。预测每个像素的可能颜色分布。此外在训练时重新加权损失以强调稀有颜色。这鼓励我们的模型充分利用大规模数据的多样性。 最后通过退火-分布的均值。 最终结果是色彩更加鲜艳并且比以前的方法在感知上更真实。

   &nbs

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

坐望云起

如果觉得有用,请不吝打赏

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值