试玩最新的AI绘画模型stable diffusion 2.0

avatar
(Edited)

还是接着玩 AI 绘画,先来一张AI绘画界的知名主题《宇航员骑马》。前几天开源的 AI 绘画模型 Stable Diffusion升级到 2.0 版,而且仍然是开源的。现在的 AI 绘画模型很多,效果最好的是Mjourney 但是是收费的。 国内的一些互联网大厂如百度也都有自己的 AI 绘画模型,只能免费使用有限的额度。但是完全开源可以随便使用的只有 Stable Diffusion这一家。

前天发帖说了在自己的电脑上玩 AI 绘画的话需要一个用户界面。我使用的是 Automatic 1111 的用户界面。在 2.0 版刚发布的时候,作者还没有更新。所以我把5个G的模型文件直接丢进文件夹里,结果程序报错了。就在昨天作者发布了更新,现在用户界面也可以兼容最新的 2.0 版的 Stable Diffusion 模型了,赶紧来试试。案装的时候还是碰到点问题,照网站上的说明我将模型文件和配置文件扔到了 \Models\ Stable Diffusion 文件夹下面,然后用 git pull 这个命令升级到了最新的 Automatic 1111 网页用户界面。然后启动的时候却又报错了。原来在启动过程中新的用户界面会去自动下载一些依赖软件包,由于是在国内的网络下载国外服务器上软件包,速度很慢经常断线,所以有一个包没有下载完全,所以报错。研究了半天报错信息,找到了是哪个软件包没有安装完整,把它重新卸载后手动安装终于排除了这个问题,可以使用最新版的 Stable Diffusion 2.0 模型了。

在新版本的官方介绍中也提到了这个新模型虽然在功能和技术方面提升很大,但是它的训练集经过过滤了,也就是它学习的画作种类并没有1.5版那么多。然后在网上看了一些up主的抢先评测,很多也都表示最新版模型生成的图片效果还不如老版。带着将信将疑的态度试着用文字生成那几幅图,就是如下几幅:

确实让人有点大失所望的感觉。不过今天看到了一个up主的视频,他提示在使用最新版的 Stable Diffusion 2.0 模型生成 AI 作品的时候一定要使用负面提示词也就是 Negative Promot。之前用AI画作我们只是告诉AI我们想要画什么,这就叫正面提示词,Positive Promot。而负面提示词呢,就是我们不想出现在画面中的元素。之前这一方面都不太受重视。但是在2.0的模型中使用了新的语意解析算法,负面提示词的作用也非常重要。然后我去网上找到了如下一些常用的负面提示词:
Negative prompt: Deformed, blurry, bad anatomy, disfigured, poorly drawn face,mutation,mutated, extra limb, ugly, poorly drawn hands, missing limb, blurry, floating limbs, disconnected limbs, malformed hands, blur, out of focus, long neck, long body, ((((mutated hands and fingers)))), (((out of frame)))
然后把昨天生成的那些图片找来,用相同的正面提示词和参数,再加上这些常用的负面提示词重新生成一遍。画面的艺术效果果然得到了很大的提升。以下是对比图:

可以看出Stable Diffusion 2.0版的效果还是非常不错的。而且从我的使用体会来说,这一版似乎更能理解我们文字想要表达的意义了。还是确实有很大的进步。

最后介绍一个刚刚从油管上学来的小技巧:如何用Stable Diffusion 2.0系统生成逼真的人物肖像照片。就是按如下格式填写正面提示词:
studio portrait of ________, highly detailed, sharp focus, studio lighting,film,photorealistic

横线处填你想生成的人物姓名,大人物应该都有。也可以填一些描述性的词语,如金发美女,亚洲女性,黑人男性等等。

然后在负面提示词中填入上面提到的那些内容。就可以生成堪比专业摄影师的人物肖像照片了。这是生成的两个西方明星的肖像照:

换东方面孔试一试:

最后再来一张天才爱因斯坦的AI生成肖像照:

本帖中的所有图片都是本人在试玩stable diffusion2.0时生成并精选的。



0
0
0.000
2 comments