如何创建具有稳定扩散的超逼真AI图像

时间:2024-09-21 编辑: 浏览:(144)

你准备好模糊现实和人工智能生成的艺术之间的界限了吗?

如果你关注生成人工智能空间,尤其是图像生成,你可能熟悉稳定扩散。这个开源的人工智能平台引发了一场创造性革命,使艺术家和爱好者都能在自己的电脑上免费探索人类创造力的领域。

只要简单的提示,你就可以获得风景如画的风景、幻想插图、3D生物或卡通。但真正令人瞠目的能力在于这些工具能够创造出令人惊叹的逼真图像。

然而,要做到这一点,需要一些技巧和对细节的关注,而一般模型有时缺乏这些技巧和关注。一些狂热的用户只需看一眼就能很快判断出什么时候用MidJourney或Dall-e生成了图像。但当涉及到创建欺骗人脑的图像时,Stable Diffusion的多功能性是无与伦比的。

从对颜色和构图的细致处理到传达人类情感和表达的神奇能力,一些定制模型正在重新定义生成人工智能世界中的可能。以下是一些我们认为是具有稳定扩散的超现实图像生成的专业模型。

为了更公平地进行比较,我们对所有模型都使用了相同的提示,并避免使用LoRas(低阶自适应附加修饰符)。我们的结果基于提示和文本嵌入。我们还使用增量变化来测试我们这一代人的微小变化。

提示

我们的正面提示是:专业照片,高加索男子的特写肖像照片,穿着黑色毛衣,严肃的脸,戏剧性的灯光,自然,阴郁,多云的天气,bokeh

我们的负面提示(指示稳定扩散不要生成什么)是:嵌入:BadDream,嵌入:虚幻的梦想,嵌入:FastNegativeV2,嵌入:JuggernautNegative neg,(虹膜变形,瞳孔变形,半逼真,cgi,3d,渲染,素描,卡通,绘图,动画:1.4),文本,裁剪,帧外,最差质量,低质量,jpeg伪影,丑陋,重复,病态,残缺,多余的手指,变异的手,画得不好的手,脸,变异,变形,模糊,脱水,解剖结构不好,比例不好,多余的肢体,克隆的脸,毁容,粗比例,畸形的肢体,缺失的手臂,缺失的腿,多余的手臂,多余的腿,融合的手指,太多的手指,长脖子,嵌入:否定的手。

所有使用的资源将在本文末尾列出。

稳定扩散1.5:优雅衰老的人工智能老兵

Stable Diffusion 1.5就像一辆优秀的老式美国肌肉车,在拉力赛中击败了更花哨的最新车型。开发商在SD1.5上折腾了这么长时间,以至于它实际上把Stable Diffusion 2.1埋在了地下。事实上,今天很多用户仍然更喜欢这个版本,而不是更新了两代的SDXL。

当涉及到创建与现实生活中的照片几乎无法区分的图像时,这些模特是你最好的新朋友。

1.Juggernaut Rborn

Juggernaut Rborn是粉丝们最喜欢的模特,以其逼真的色彩构成和令人印象深刻的区分主题和背景的能力而闻名。该模型特别擅长在人像中生成高质量的皮肤细节、头发和散焦效果。

最新版本经过了微调,以提供更引人注目的结果。Juggernaut一直提供的颜色组合往往比许多其他稳定扩散模型的饱和、不自然的颜色更逼真。它的世代往往更温暖,更褪色,类似于未经编辑的原始照片。

要获得最佳结果仍然需要一些调整:使用DPM++2M Karras采样器,设置为大约35个步骤,CFG的平均等级为7。

2.逼真视觉v5.1

作为真实感图像生成领域的真正开拓者,Realistic Vision v5.1为Stable Diffusion的发展带来了关键时刻,使其能够在真实感方面与MidJourney和任何其他模型竞争。v5.1迭代擅长捕捉面部表情和瑕疵,是人像爱好者的首选。它也能很好地处理情绪,更多地关注主题而不是背景,确保最终结果总是现实的。这款车型因其令人印象深刻的性能和多功能性而广受欢迎。

有一个更新的版本(v6.0),但我们更喜欢V5.1,因为我们觉得它在逼真图像中重要的小细节方面仍然更好。皮肤、头发或指甲等东西在5.1中往往更具说服力,但除此之外,结果相似,而且改善似乎是渐进的。

3.我不敢相信这不是摄影

凭借其多功能性和令人印象深刻的照明效果,这款名为“I Can't Believe It’s Not Photography”的厚脸皮模型是超现实图像生成的全方位选择。它非常有创意,很好地处理了不同的角度,可以用于各种主题,而不仅仅是人。

该型号在640x960分辨率下表现特别好,比原来的SD1.5-分辨率更高,但在768x1152分辨率下也能取得很好的效果,这是SDXL固有的分辨率水平。

为了获得最佳结果,请使用DPM++3M SDE Karras或DPM++2M Karras采样器,20-30个步骤和2.5-5 CFG刻度(比平时低)。

荣誉奖:

Photon V1:这个多功能模型擅长为包括人在内的广泛对象生成逼真的结果。

真实的库存照片:如果你想让人拥有库存照片的精致和完美外观,这个模型是一个很好的选择。它创造了令人信服和准确的图像,没有任何皮肤缺陷。

aZovya Photoreal:虽然不那么知名,但该模型产生了令人印象深刻的结果,并可以在与其他模型的训练配方相结合时提高其性能。

Stable Diffusion XL:多功能视觉

虽然Stable Diffusion 1.5是我们对照片级真实感图像的首选,但Stable Differsion XL提供了更多的多功能性和高质量的结果,而无需使用放大等技巧。它需要一点电源,但可以使用具有6GB vRAM的GPU运行,比SD1.5所需的容量少2GB。

以下是引领潮流的车型。

1.Juggernaut XL(版本x)

在前代产品成功的基础上,Juggernaut XL为Stable Diffusion XL带来了电影般的外观和令人印象深刻的主题焦点。该模型提供了相同的特征颜色组成,远离饱和度,同时具有良好的身体比例和理解长提示的能力。它更多地关注这个主题,它很好地定义了派系——就像现在任何SDXL模型一样。

为了获得最佳结果,请使用832x1216的分辨率(用于肖像)、DPM++2M Karras采样器、30-40个步长和3-7的低CFG刻度。

2.RealVisXL

RealVisXL以现实主义为理念进行定制,是捕捉人类细微缺陷的最佳选择。它擅长生成皮肤线条、痣、色调变化和下巴,确保最终结果始终令人信服。它可能是生成逼真人类的最佳模型。

为了获得最佳结果,请使用15-30+采样步骤和DPM++2M Karras采样方法。

3.HelloWorld XL v6.0

由于使用了GPT4v标记,通用模型HelloWorld XL v6.0提供了一种独特的图像生成方法。虽然这可能需要一些时间来适应,但结果非常值得努力。

该模型特别擅长提供人工智能生成的图像中经常缺失的模拟美学。它还可以很好地处理身体比例、瑕疵和光线。然而,它与其他SDXL型号的核心不同,这意味着您可能需要调整提示和标签以获得最佳效果。

为了进行比较,这里有一个使用GPT4v标签的类似代,带有积极的提示:电影美学,专业照片,高加索男子的特写肖像照片,穿着黑色毛衣,严肃的脸,在大自然中,阴郁多云的天气,穿着羊毛黑色毛衣,深度大气,电影质感,暗示模拟摄影的影响。

SDXL的荣誉包括:PhotoPedia XL,现实主义引擎SDXL和不推荐的Fully Real XL。

超逼真图像的专业提示

无论您选择哪种型号,以下是一些专家提示,可以帮助您获得令人印象深刻、逼真的效果:

尝试嵌入:为了增强图像的美观性,请尝试使用模型创建者推荐的嵌入,或使用广受欢迎的嵌入,如BadDream、UnrealisticDream、FastNegativeV2和JuggernautNegative。还有可用于特定功能的嵌入,如手、眼睛和特定功能。拥抱LoRA的力量:虽然我们在这里省略了它们,但这些方便的工具可以帮助您在图像中添加细节、调整照明和增强皮肤纹理。有很多LoRA可用,所以不要害怕尝试,找到最适合你的。使用面部细节扩展工具:这些功能可以帮助您在面部和手部获得出色的效果,使您的图像更有说服力。Adetailer扩展插件可用于A1111,而Face Detailer Pipe节点可用于ComfyUI。使用ControlNets发挥创意:如果你是一个完美主义者,ControlNets可以帮助你实现完美的结果。还有ControlNets可用于其他功能,如人脸和身体,所以不要害怕尝试,找到最适合你的功能。

要获得入门帮助,您可以阅读我们的稳定扩散指南。

以下是我们在本指南中引用的资源:

SD1.5型号:

Juggernaut Aftermath真实视觉v5.1(VAE)我不敢相信它不是摄影(新年)Photon V1真实库存照片(v3.0)aZovya Photoreal

SDXL型号:

Juggernaut XL(Juggernaut_X_RunDiffusion)RealVisXL v4.0(Baked VAE)HelloWorld XL v6.0 PhotoPedia XL现实主义引擎SDXL FullyREALXL_v10Perfect10n

嵌入:

BadDream不切实际的梦想快速否定V2 Juggernaut否定否定否定_例如

我们希望您在探索人工智能生成的图像和艺术时,能发现这次稳定扩散工具之旅有所帮助。创作愉快!

由Ryan Ozawa编辑。

最新 更多 >
  • 1 囤币是什么意思?为什么炒币不如囤币?

    我们发现币圈投资者口中会出现一个词,那就是囤币,对于囤币一词,很多币圈以外的人都不太了解,那么,囤币到底是什么意思呢?下面小编就给大家通俗讲解一下囤币是什么意思?为什么炒币不如囤币?希望通过本文介绍大家对于囤币和炒币有个更深层次的理解。 囤币其实就是长期持有币,囤币是圈内不少人的信仰,看到自己的比特币数量增加是囤币党最开心的事。可是,囤币这种行为要想成立,其实是建立在一个默认的前提基础上的