100字范文 > CNN实现图像风格迁移 ---Image Style Transfer Using Convolutional Neural Networks

CNN实现图像风格迁移 ---Image Style Transfer Using Convolutional Neural Networks

时间：2021-07-31 13:18:09

1. INTRODUCTION

2. Deep image representations

2.1 内容表示

2.2. Style representation

2.3 风格迁移

3. Results

年，一位俄罗斯工程师读到了由三个德国人写的这篇论文而研发了一个将照片转换为艺术作品的Prisma app。这款应用刚在iOS上发布，15 天内下载量750 万，火遍全球，被称为Googleplay的best app。这个app就用到了图像处理领域的content加style的的图像风格变换。这篇论文是CVPR的paper.

论文链接: Image Style Transfer Using Convolutional Neural Networks】

1. INTRODUCTION

图像纹理转移问题[texture transfer]的目标是从一幅源图像中合成纹理，但要对纹理合成进行约束,以保留目标图像的语义内容.大多数用于纹理合成的算法都是采用非参数方法,比如使用对应地图, 图像高度, 图像模拟, 边缘方法信息等. 但有一个基本问题始终没有解决,他们都只是将目标图像的底层图像特征用到了纹理迁移中.而一个理想的迁移算法应该能从目标图像中提取语义图像内容,并且通知纹理迁移流程根据原图像风格来渲染目标图像的语义内容.

2. Deep image representations

本文展示了由高性能CNN学习到的广义特征表示如何用于独立地处理和操作自然图像的内容和风格,提出的风格迁移算法结合了基于CNN的带参数纹理模型和图像表征的翻转方法.通过执行图像搜索以匹配样本图像的特征表示可以生成新图像.

VGG网络被用于物体识别与定位,本文使用了由16个Conv层和5个pooling层的19层VGGnet,不使用任何全连接层.按比例改变权重规范化网络，这样每层卷积滤波器在图像和位置上平均激活值就等于1。这种针对VGG网络的按比例缩放[re-scaling]不会改变它的输出，因为它只包含修正线性激活函数，在特征地图上没有归一化层和池化层还有一个小的改动是:用平均池化来代替最大池化.

2.1 内容表示

给定一张输入图片, 卷积神经网络每层使用滤波[filter]对其进行编码,为每个特征图的size [=height * width]; 在第个卷积层中,由个不同的filter产生个大小为的特征图,所以第层中的响应可以存储在一个矩阵中,其中表示第层的第i个滤波的位置j处的激活值.

核心:在一个带有白噪声的图像上执行梯度下降算法,寻找可以匹配原始图像特征响应的另外一个图像,更新原始图像上的噪声图像点, 是输入,而不是权重w.

令和分别表示原始图像和生成的图像,和分别为它们对应的第层的特征表示;将这俩个特征表示之间的平方差损失定义为

损失函数的偏导数对应的l层的激活函数为

在提取content 特征时,不同卷积层的表征内容不一样,卷积神经网络在物体识别上训练，它们可以生成一个对图像的表示，在网络层级的处理过程中使得物体信息越来越明显。因此，沿着网络层级处理过程，输入图像会发生转变，对图像的真正内容越来越敏感，但会对精细的外观变得相对不变。网络的高层表示一般是关于输入图像的物体和布局信息,但不会限制重构过程中的确切像素值,底层特征一般表达图像的像素信息.将网络中高层的特征响应结果作为内容表示。