游戏攻略网
当前位置: 首页 游戏攻略

tps神经网络(神经风格迁移NST的基本机制及实现)

时间:2023-08-15 作者: 小编 阅读量: 1 栏目名: 游戏攻略

可以看出,仅通过重叠图像不能获得上述结果。这种捕获不同的简单特征和复杂特征称为特征表示。卷积神经网络如何用于捕获图像的内容和风格VGG19网络用于神经风格迁移。VGG-19是一个卷积神经网络,可以对ImageNet数据集中的一百多万个图像进行训练。有了上述直觉,让我们将内容损失和风格损失定义为随机生成的噪声图像。层l中的不同通道或特征映射这张图片显示了特定选定层的不同通道或特征映射或filters。由此获得的矩阵称为Gram矩阵。

深度学习可以捕获一个图像的内容并将其与另一个图像的风格相结合,这种技术称为神经风格迁移。但是,神经风格迁移是如何运作的呢?在这篇文章中,我们将研究神经风格迁移(NST)的基本机制。

神经风格迁移概述

我们可以看到,生成的图像具有内容图像的内容和风格图像的风格。可以看出,仅通过重叠图像不能获得上述结果。我们是如何确保生成的图像具有内容图像的内容和风格图像的风格呢?

为了回答上述问题,让我们来看看卷积神经网络(CNN)究竟在学习什么。

卷积神经网络捕获到了什么

卷积神经网络的不同层

现在,在第1层使用32个filters ,网络可以捕捉简单的模式,比如直线或水平线,这对我们可能没有意义,但对网络非常重要,慢慢地,当我们到第2层,它有64个filters ,网络开始捕捉越来越复杂的特征,它可能是一张狗的脸或一辆车的轮子。这种捕获不同的简单特征和复杂特征称为特征表示。

这里需要注意的是,卷积神经网络(CNN)并不知道图像是什么,但他们学会了编码特定图像所代表的内容。卷积神经网络的这种编码特性可以帮助我们实现神经风格迁移。

卷积神经网络如何用于捕获图像的内容和风格

VGG19网络用于神经风格迁移。VGG-19是一个卷积神经网络,可以对ImageNet数据集中的一百多万个图像进行训练。该网络深度为19层,并在数百万张图像上进行了训练。因此,它能够检测图像中的高级特征。

现在,CNN的这种“编码性质”是神经风格迁移的关键。首先,我们初始化一个噪声图像,它将成为我们的输出图像(G)。然后,我们计算该图像与网络中特定层(VGG网络)的内容和风格图像的相似程度。由于我们希望输出图像(G)应该具有内容图像(C)的内容和风格图像(S)的风格,因此我们计算生成的图像(G)的损失,即到相应的内容(C)和风格( S)图像的损失。

有了上述直觉,让我们将内容损失和风格损失定义为随机生成的噪声图像。

NST模型

内容损失

计算内容损失意味着随机生成的噪声图像(G)与内容图像(C)的相似性。为了计算内容损失:

假设我们在一个预训练网络(VGG网络)中选择一个隐藏层(L)来计算损失。因此,设P和F为原始图像和生成的图像。其中,F[l]和P[l]分别为第l层图像的特征表示。现在,内容损失定义如下:

内容成本函数

风格损失

在计算风格损失之前,让我们看看“ 图像风格 ”的含义或我们如何捕获图像风格。

层l中的不同通道或特征映射

这张图片显示了特定选定层的不同通道或特征映射或filters。现在,为了捕捉图像的风格,我们将计算这些filters之间的“相关性”,也就是这些特征映射的相似性。但是相关性是什么意思呢?

让我们借助一个例子来理解它:

上图中的前两个通道是红色和黄色。假设红色通道捕获了一些简单的特征(比如垂直线),如果这两个通道是相关的,那么当图像中有一条垂直线被红色通道检测到时,第二个通道就会产生黄色的效果。

现在,让我们看看数学上是如何计算这些相关性的。

为了计算不同filters或信道之间的相关性,我们计算两个filters激活向量之间的点积。由此获得的矩阵称为Gram矩阵。

但是我们如何知道它们是否相关呢?

如果两个filters激活之间的点积大,则说两个通道是相关的,如果它很小则是不相关的。以数学方式:

风格图像的Gram矩阵(S):

这里k '和k '表示层l的不同filters或通道。我们将其称为Gkk ' [l][S]。

用于风格图像的Gram矩阵

生成图像的Gram矩阵(G):

这里k和k'代表层L的不同filters或通道。让我们称之为Gkk'[l] [G]。

生成图像的Gram矩阵

现在,我们可以定义风格损失:

风格与生成图像的成本函数是风格图像的Gram矩阵与生成图像的Gram矩阵之差的平方。

风格成本函数

现在,让我们定义神经风格迁移的总损失。

总损失函数:

总是内容和风格图像的成本之和。在数学上,它可以表示为:

神经风格迁移的总损失函数

您可能已经注意到上述等式中的Alpha和beta。它们分别用于衡量内容成本和风格成本。通常,它们在生成的输出图像中定义每个成本的权重。

一旦计算出损失,就可以使用反向传播使这种损失最小化,反向传播又将我们随机生成的图像优化为有意义的艺术品。

使用tensorflow实现神经风格迁移Python示例代码:

#Importing Required librariesimport osimport sysimport scipy.miscimport scipy.ioimport matplotlib.pyplot as pltimport numpy as npfrom matplotlib.pyplot import imshowfrom PIL import Imagefrom nst_utils import *#Before running this cell Please download the VGG-19 weights from this site: https://www.mathworks.com/help/deeplearning/ref/vgg19.html#bvo3tw1-5#and paste it in the pretrained_model foldermodel = load_vgg_model("pretrained_model/imagenet-vgg-verydeep-19.mat")content_image=scipy.misc.imread("images\YOUR CONTENT IMAGE NAME")#imshow(content_image)#Since the style and the content image should be of same size#Use this to resize either style or content imagefrom PIL import Imagefrom matplotlib.pyplot import imshowimage = Image.open('images\IMAGE TO BE RESIZED')image = image.resize((300,500), Image.ANTIALIAS)imshow(image)image.save("images\NAME OF RESIZED IMAGE")

style_image=scipy.misc.imread("images\style1.jpg")imshow(style_image)

辅助函数

def compute_content_cost(a_C,a_G): m,n_H,n_W,n_C=a_G.get_shape().as_list()a_C_unrolled=tf.transpose(a_C) a_G_unrolled=tf.transpose(a_G)#Content_cost: J_content=(1/(4 * n_H * n_W * n_C)) * tf.reduce_sum(tf.pow((a_C_unrolled - a_G_unrolled),2)) return J_contentdef gram_matrix(A): GA=tf.matmul(A,tf.transpose(A)) return GAdef compute_layer_style_cost(a_S,a_G): m,n_H,n_W,n_C=a_G.get_shape().as_list()#Reshape: a_S=tf.transpose(tf.reshape(a_S,[n_H * n_W, n_C])) a_G=tf.transpose(tf.reshape(a_G,[n_H * n_W, n_C]))#Gram matrix: GS=gram_matrix(a_S) GG=gram_matrix(a_G)#Cost: J_style=(1/(4 * (n_C)**2 * (n_H * n_W)**2)) * tf.reduce_sum(tf.pow((GS - GG),2))return J_styleSTYLE_LAYERS = [ ('conv1_1', 0.2), ('conv2_1', 0.2), ('conv3_1', 0.2), ('conv4_1', 0.2), ('conv5_1', 0.2)]def compute_style_cost(model,STYLE_LAYERS): J_style = 0 for layer_name, coeff in STYLE_LAYERS: # Select the output tensor of the currently selected layer out = model[layer_name] # Set a_S to be the hidden layer activation from the layer we have selected, by running the session on out a_S = sess.run(out) # Set a_G to be the hidden layer activation from same layer. Here, a_G references model[layer_name]# and isn't evaluated yet. Later in the code, we'll assign the image G as the model input, so that # when we run the session, this will be the activations drawn from the appropriate layer, with G as input. a_G = out# Compute style_cost for the current layer J_style_layer = compute_layer_style_cost(a_S, a_G) # Add coeff * J_style_layer of this layer to overall style cost J_style= coeff * J_style_layer return J_styledef total_cost(J_content, J_style, alpha = 10, beta = 40): J = alpha * J_contentbeta * J_style return J

优化及神经网络模型

tf.reset_default_graph()sess=tf.InteractiveSession()content_image=scipy.misc.imread("images\YOUR CONTENT IMAGE")content_image = reshape_and_normalize_image(content_image)style_image = scipy.misc.imread("images/YOUR STYLE IMAGE")style_image = reshape_and_normalize_image(style_image)#Generating a noisy imagegenerated_image = generate_noise_image(content_image)imshow(generated_image[0])model = load_vgg_model("pretrained_model/imagenet-vgg-verydeep-19.mat")sess.run(model['input'].assign(content_image))out=model['conv4_2']a_C = sess.run(out)a_G=outJ_content = compute_content_cost(a_C, a_G)sess.run(model['input'].assign(style_image))# Compute the style costJ_style = compute_style_cost(model, STYLE_LAYERS)J = total_cost(J_content, J_style, alpha = 10, beta = 40)# define optimizer (1 line)optimizer = tf.train.AdamOptimizer(2.0)# define train_step (1 line)train_step = optimizer.minimize(J)def model_nn(sess, input_image, num_iterations = 1000):# Initialize global variables (you need to run the session on the initializer) sess.run(tf.global_variables_initializer())# Run the noisy input image (initial generated image) through the model. Use assign(). sess.run(model['input'].assign(input_image))for i in range(num_iterations):# Run the session on the train_step to minimize the total cost sess.run(train_step)# Compute the generated image by running the session on the current model['input'] generated_image = sess.run(model['input']) # Print every 20 iteration. if i== 0: Jt, Jc, Js = sess.run([J, J_content, J_style]) print("Iteration "str(i)" :") print("total cost = "str(Jt)) print("content cost = "str(Jc)) print("style cost = "str(Js))# save current generated image in the "/output" directory save_image("output/"str(i)".png", generated_image)# save last generated image save_image('output/generated_image.jpg', generated_image)return generated_imagemodel_nn(sess, generated_image)

最后

在这篇文章中,我们深入研究了神经风格迁移的工作原理。我们还讨论了NST背后的数学。

    推荐阅读
  • steam棋牌游戏推荐(幸运之夜新版本亮相TGC)

    steam棋牌游戏推荐12月1日,2017腾讯游戏嘉年华正式在成都开幕,腾讯的VR社交游戏《幸运之夜》在现场发布了最新版本。VR《幸运之夜》在TGC2017上惊艳亮相《幸运之夜》新版本发布邀请好友一起游戏今年7月底,《幸运之夜》正式在Steam发布,并推出了首款游戏作品“德州扑克”。今年的TGC2017现场,《幸运之夜》全新版本便带来了对互动性方面的提升。

  • 儿童睡前故事卖火柴的小女孩大全(卖火柴的小女孩)

    在长发公主的故事里,兔子小姐变成了手持宝剑的骑士,穿过了山川和河流,战胜了地狱恶犬,最终救出了长着一头金黄色长发的熊猫先生。随着一阵空间的波动,熊猫先生和兔子小姐来到了冰天雪地的圣诞节。小女孩被这突如其来的变化惊呆了。熊猫先生没有回答,轻轻摸了摸小女孩的头。小女孩点燃了第二根火柴。熊猫先生和兔子小姐则来到壁炉前,商量起小女孩最后一个愿望。熊猫先生蹲下来,握起小女孩的手。

  • 怎样做ppr管快一点(PPR管安装方法及技巧)

    怎样做ppr管快一点PPR管安装方法及技巧首先准备好需要的材料:热熔机,小剪刀,ppr管,管件,手巾。一定要根据自己热熔ppr管的口径,准备相应的热熔头。清洁:清洁管材与管件的焊接段部位,建议用95%浓度酒精擦净。在熔接时间内迅速的将管材无旋转的垂直插入管件中,并维持5秒以上,然后按相应冷却时间冷却。热熔后做到横平竖直,美观大方。

  • 大托特包搭配技巧(大托特包搭配技巧简述)

    西装外套+托特包复古时尚的格子,由黑白交错的条纹形成,文艺而又端庄搭配撞色托特包,优雅而不失俏皮,让气场变得灵动起来内搭白色连帽卫衣,减龄又可爱,接下来我们就来聊聊关于大托特包搭配技巧?大托特包搭配技巧西装外套+托特包复古时尚的格子,由黑白交错的条纹形成,文艺而又端庄。衬衫+托特包白色的衬衫休闲慵懒,给人一种空灵的感觉以及干净纯粹的气质。

  • 刘涛电视剧口碑(电视剧景气指数第一)

    还记得3月份刘涛在和周渝民主演的《大宋宫词》中扮嫩出演少妇被很多观众吐槽。万万没想到时隔数月,刘涛带着她的新剧《星辰大海》杀回来了。目前主要的剧情线在刘涛饰演的女主简爱身上。因为小时候意外发现母亲出轨的事,得知真相的父亲激愤之下杀死母亲并自杀,简爱因此成为了一个孤女。逃出傻子家的简爱在与姑姑的争执中误伤姑姑,从此开启逃命生涯。简爱从面馆辞职走投无路,误打误撞进入大公司之后面临着同事的故意刁难。

  • 外墙装修材料有哪些 外墙装修材料有哪些类型

    外墙涂料具有装饰性良好、耐污染耐老化以及施工维修容易和价格合理的特点。一般来说釉面外墙砖有亚光面与无光面两大类。它的装饰的效果也不错,有柚木色、深灰色等等可供选择。由于它的表面的肌理很清晰,所以色泽漂亮且装饰性极强。本站,中国知名大型装修平台,装修领导品牌。

  • 世界上有哪些花(世界上有哪些花 名字)

    瓜叶菊、香豌豆、夏兰、石竹、石蒜、荷花、翠菊、睡莲、福禄考、晚香玉、万寿菊、千日红、建兰、铃兰、报岁兰、香堇、大岩桐、水仙、小草兰、瓜叶菊、蒲包花、免子花、入腊红、三色堇、百日草、鸡冠花、一串红。孔雀草、大波斯菊、金盏菊、非洲凤仙花、菊花、非洲菊、观赏凤梨类、射干、非洲紫罗兰、天堂鸟、炮竹红、菊花、康乃馨、红掌、满天星、星辰花、三角梅、虞美人。

  • 长歌行李长歌母亲是谁杀的(长歌行李长歌的简介)

    下面更多详细答案一起来看看吧!长歌行李长歌母亲是谁杀的《长歌行》李长歌母亲是自杀的。李长歌,太子李建成之女,生母则是回纥王族。父母手足均死于玄武门之变,满怀愤恨的长歌凭高超武艺逃出皇宫,并在追捕过程中制造“坠崖假死”而逃生,其后女扮男装隐瞒身份流落民间,一心只想为父母复仇,在家和国的利害冲突中,最后放弃复仇,和阿诗勒隼一起成为了民族和解的使者。

  • 什么时候喝蛋白粉增肌效果最好(什么时候喝蛋白粉增肌效果最好)

    从长远来看,这种方法被证明可以促使肌肉明显增长。如果摄入量超过一定的阈值,蛋白质的合成就会受限。如果是以乳清饮料的形式摄入乳清蛋白,运动者可以在运动结束后立即饮用。按每公斤体重1克的标准,在健身前后立即摄入以及在运动后1小时内摄入可快速吸收的碳水化合物,可以明显抑制肌肉分解,并大大促进肌肉快速和明显的增长。在这种情况下,大量分泌的胰岛素促进了氨基酸向工作中的肌肉运输,为蛋白质合成奠定基础。

  • 窦骁周冬雨山楂树之恋结局(周冬雨18岁第一次出演)

    周冬雨18岁第一次出演要说最近最火的电影,非《少年的你》莫属,上映14天,已经收获了12.45亿的票房成绩,成为现阶段最强的票房黑马而作为该片主演的周冬雨和易烊千玺,也凭借在该片中的精彩演出,演技得到大众的进一步认可作为“。