如何创建具有稳定扩散的超逼真AI图像

时间:2024-10-02 编辑: 浏览:(352)

你准备好模糊现实和人工智能生成的艺术之间的界限了吗?

如果你关注生成人工智能空间,尤其是图像生成,你可能熟悉稳定扩散。这个开源的人工智能平台引发了一场创造性革命,使艺术家和爱好者都能在自己的电脑上免费探索人类创造力的领域。

只要简单的提示,你就可以获得风景如画的风景、幻想插图、3D生物或卡通。但真正令人瞠目的能力在于这些工具能够创造出令人惊叹的逼真图像。

然而,要做到这一点,需要一些技巧和对细节的关注,而一般模型有时缺乏这些技巧和关注。一些狂热的用户只需看一眼就能很快判断出什么时候用MidJourney或Dall-e生成了图像。但当涉及到创建欺骗人脑的图像时,Stable Diffusion的多功能性是无与伦比的。

从对颜色和构图的细致处理到传达人类情感和表达的神奇能力,一些定制模型正在重新定义生成人工智能世界中的可能。以下是一些我们认为是具有稳定扩散的超现实图像生成的专业模型。

为了更公平地进行比较,我们对所有模型都使用了相同的提示,并避免使用LoRas(低阶自适应附加修饰符)。我们的结果基于提示和文本嵌入。我们还使用增量变化来测试我们这一代人的微小变化。

提示

我们的正面提示是:专业照片,高加索男子的特写肖像照片,穿着黑色毛衣,严肃的脸,戏剧性的灯光,自然,阴郁,多云的天气,bokeh

我们的负面提示(指示稳定扩散不要生成什么)是:嵌入:BadDream,嵌入:虚幻的梦想,嵌入:FastNegativeV2,嵌入:JuggernautNegative neg,(虹膜变形,瞳孔变形,半逼真,cgi,3d,渲染,素描,卡通,绘图,动画:1.4),文本,裁剪,帧外,最差质量,低质量,jpeg伪影,丑陋,重复,病态,残缺,多余的手指,变异的手,画得不好的手,脸,变异,变形,模糊,脱水,解剖结构不好,比例不好,多余的肢体,克隆的脸,毁容,粗比例,畸形的肢体,缺失的手臂,缺失的腿,多余的手臂,多余的腿,融合的手指,太多的手指,长脖子,嵌入:否定的手。

所有使用的资源将在本文末尾列出。

稳定扩散1.5:优雅衰老的人工智能老兵

Stable Diffusion 1.5就像一辆优秀的老式美国肌肉车,在拉力赛中击败了更花哨的最新车型。开发商在SD1.5上折腾了这么长时间,以至于它实际上把Stable Diffusion 2.1埋在了地下。事实上,今天很多用户仍然更喜欢这个版本,而不是更新了两代的SDXL。

当涉及到创建与现实生活中的照片几乎无法区分的图像时,这些模特是你最好的新朋友。

1.Juggernaut Rborn

Juggernaut Rborn是粉丝们最喜欢的模特,以其逼真的色彩构成和令人印象深刻的区分主题和背景的能力而闻名。该模型特别擅长在人像中生成高质量的皮肤细节、头发和散焦效果。

最新版本经过了微调,以提供更引人注目的结果。Juggernaut一直提供的颜色组合往往比许多其他稳定扩散模型的饱和、不自然的颜色更逼真。它的世代往往更温暖,更褪色,类似于未经编辑的原始照片。

要获得最佳结果仍然需要一些调整:使用DPM++2M Karras采样器,设置为大约35个步骤,CFG的平均等级为7。

2.逼真视觉v5.1

作为真实感图像生成领域的真正开拓者,Realistic Vision v5.1为Stable Diffusion的发展带来了关键时刻,使其能够在真实感方面与MidJourney和任何其他模型竞争。v5.1迭代擅长捕捉面部表情和瑕疵,是人像爱好者的首选。它也能很好地处理情绪,更多地关注主题而不是背景,确保最终结果总是现实的。这款车型因其令人印象深刻的性能和多功能性而广受欢迎。

有一个更新的版本(v6.0),但我们更喜欢V5.1,因为我们觉得它在逼真图像中重要的小细节方面仍然更好。皮肤、头发或指甲等东西在5.1中往往更具说服力,但除此之外,结果相似,而且改善似乎是渐进的。

3.我不敢相信这不是摄影

凭借其多功能性和令人印象深刻的照明效果,这款名为“I Can't Believe It’s Not Photography”的厚脸皮模型是超现实图像生成的全方位选择。它非常有创意,很好地处理了不同的角度,可以用于各种主题,而不仅仅是人。

该型号在640x960分辨率下表现特别好,比原来的SD1.5-分辨率更高,但在768x1152分辨率下也能取得很好的效果,这是SDXL固有的分辨率水平。

为了获得最佳结果,请使用DPM++3M SDE Karras或DPM++2M Karras采样器,20-30个步骤和2.5-5 CFG刻度(比平时低)。

荣誉奖:

Photon V1:这个多功能模型擅长为包括人在内的广泛对象生成逼真的结果。

真实的库存照片:如果你想让人拥有库存照片的精致和完美外观,这个模型是一个很好的选择。它创造了令人信服和准确的图像,没有任何皮肤缺陷。

aZovya Photoreal:虽然不那么知名,但该模型产生了令人印象深刻的结果,并可以在与其他模型的训练配方相结合时提高其性能。

Stable Diffusion XL:多功能视觉

虽然Stable Diffusion 1.5是我们对照片级真实感图像的首选,但Stable Differsion XL提供了更多的多功能性和高质量的结果,而无需使用放大等技巧。它需要一点电源,但可以使用具有6GB vRAM的GPU运行,比SD1.5所需的容量少2GB。

以下是引领潮流的车型。

1.Juggernaut XL(版本x)

在前代产品成功的基础上,Juggernaut XL为Stable Diffusion XL带来了电影般的外观和令人印象深刻的主题焦点。该模型提供了相同的特征颜色组成,远离饱和度,同时具有良好的身体比例和理解长提示的能力。它更多地关注这个主题,它很好地定义了派系——就像现在任何SDXL模型一样。

为了获得最佳结果,请使用832x1216的分辨率(用于肖像)、DPM++2M Karras采样器、30-40个步长和3-7的低CFG刻度。

2.RealVisXL

RealVisXL以现实主义为理念进行定制,是捕捉人类细微缺陷的最佳选择。它擅长生成皮肤线条、痣、色调变化和下巴,确保最终结果始终令人信服。它可能是生成逼真人类的最佳模型。

为了获得最佳结果,请使用15-30+采样步骤和DPM++2M Karras采样方法。

3.HelloWorld XL v6.0

由于使用了GPT4v标记,通用模型HelloWorld XL v6.0提供了一种独特的图像生成方法。虽然这可能需要一些时间来适应,但结果非常值得努力。

该模型特别擅长提供人工智能生成的图像中经常缺失的模拟美学。它还可以很好地处理身体比例、瑕疵和光线。然而,它与其他SDXL型号的核心不同,这意味着您可能需要调整提示和标签以获得最佳效果。

为了进行比较,这里有一个使用GPT4v标签的类似代,带有积极的提示:电影美学,专业照片,高加索男子的特写肖像照片,穿着黑色毛衣,严肃的脸,在大自然中,阴郁多云的天气,穿着羊毛黑色毛衣,深度大气,电影质感,暗示模拟摄影的影响。

SDXL的荣誉包括:PhotoPedia XL,现实主义引擎SDXL和不推荐的Fully Real XL。

超逼真图像的专业提示

无论您选择哪种型号,以下是一些专家提示,可以帮助您获得令人印象深刻、逼真的效果:

尝试嵌入:为了增强图像的美观性,请尝试使用模型创建者推荐的嵌入,或使用广受欢迎的嵌入,如BadDream、UnrealisticDream、FastNegativeV2和JuggernautNegative。还有可用于特定功能的嵌入,如手、眼睛和特定功能。拥抱LoRA的力量:虽然我们在这里省略了它们,但这些方便的工具可以帮助您在图像中添加细节、调整照明和增强皮肤纹理。有很多LoRA可用,所以不要害怕尝试,找到最适合你的。使用面部细节扩展工具:这些功能可以帮助您在面部和手部获得出色的效果,使您的图像更有说服力。Adetailer扩展插件可用于A1111,而Face Detailer Pipe节点可用于ComfyUI。使用ControlNets发挥创意:如果你是一个完美主义者,ControlNets可以帮助你实现完美的结果。还有ControlNets可用于其他功能,如人脸和身体,所以不要害怕尝试,找到最适合你的功能。

要获得入门帮助,您可以阅读我们的稳定扩散指南。

以下是我们在本指南中引用的资源:

SD1.5型号:

Juggernaut Aftermath真实视觉v5.1(VAE)我不敢相信它不是摄影(新年)Photon V1真实库存照片(v3.0)aZovya Photoreal

SDXL型号:

Juggernaut XL(Juggernaut_X_RunDiffusion)RealVisXL v4.0(Baked VAE)HelloWorld XL v6.0 PhotoPedia XL现实主义引擎SDXL FullyREALXL_v10Perfect10n

嵌入:

BadDream不切实际的梦想快速否定V2 Juggernaut否定否定否定_例如

我们希望您在探索人工智能生成的图像和艺术时,能发现这次稳定扩散工具之旅有所帮助。创作愉快!

由Ryan Ozawa编辑。

最新 更多 >
  • 1 乐享集团(06988)股东延长9个月股份锁定期 传递长期发展信心

    乐享集团宣布延长股东9个月的股份锁定期,以传递长期发展的信心。这一举措显示了公司管理层对未来发展的信心,同时也体现了他们对公司的长期规划和稳健增长的承诺。延长股份锁定期将有助于减少股东的股份流动性,增强公司的稳定性和持续增值能力。

  • 2 上市首日暴跌22%,快狗打车(02246)C轮投资者已“含泪”亏掉4495.6万港元

    上市首日,快狗打车(02246)股价暴跌22%,导致C轮投资者亏损4495.6万港元。这一消息让投资者感到心痛和失望,暴跌引起了市场的广泛关注和讨论。投资者纷纷表示忧虑该公司未来的发展前景,并对投资决策进行重新评估。

  • 3 2015比特币一个多少人民币:文章太长慎点!我是怎么上了区块链这条贼船、恋上区块链的?

    2015年比特币在人民币价值上的参考价格是多少?答:2015年比特币人民币价值参考价格是6000-8000元。

  • 4 持续上行创新药价值重估

    创新药价值重估的原因包括研发成本上升、投资回报率下降、市场竞争加剧、医疗技术不断更新等因素。这些因素导致持续上行创新药的价值需要不断评估和重新定位,以保持竞争力和市场地位。

  • 5 金价回升逻辑又迎催化,山东黄金(01787)休整后酝酿新行情?

    山东黄金持续下跌。受全球金融市场波动影响,山东黄金股价大幅下跌。投资者对于公司未来业绩表现持怀疑态度,造成股价持续走低。公司需加强经营管理,提升产品竞争力,以重振投资者信心。

  • 6 全球公认十大usdt交易所 正规的usdt软件TOP10

    以下是全球公认的十大正规的USDT交易所及其对应的USDT软件: 1. Binance:Binance是全球最大的加密货币交易所之一,提供多种数字货币交易对和流动性。 2. Coinbase Pro:Coinbase Pro是美国知名的数字货币交易所,提供多种加密货币的交易对和安全存储。 3. Bitfinex:Bitfinex是全球最大的数字货币交易平台之一,提供USDT等稳定币的交易服务。 4

  • 7 okb今日最新价格消息 okb币未来价格预测

    OKB今日最新价格为XX美元。对于OKB币的未来价格预测,目前市场行情波动较大,预测难度较大。但根据市场分析和行业趋势,OKB可能会受到市场需求、项目发展情况等因素的影响,价格可能会有一定的波动。投资者可以关注市场动态,做好风险控制。

  • 8 Do Kwon遭爆:Luna崩盘前每月挪出8千万美元 SEC调查Terra部分人员

    最近有消息称,Do Kwon先生被指控在Luna加密货币崩盘前每月挪出8千万美元。SEC正在调查Terra部分人员涉嫌的行为。涉及内容为Do Kwon可能涉嫌挪用资金并影响Luna加密货币的稳定性。SEC正在对此展开调查。

  • 9 涨薪幅度跟不上通胀!英国迎来30多年来最大规模铁路罢工

    英国铁路是英国境内运营的铁路系统,拥有悠久的历史和繁忙的运营网络。英国铁路由多家铁路公司共同经营,提供了广泛的服务覆盖城市、乡村和各个地区。作为英国交通系统的重要组成部分,英国铁路为乘客提供了快速、方便和可靠的出行选择。同时,英国铁路也面临着改进和现代化的挑战,不断寻求提升服务水平和提高运输效率。

  • 10 凯伦股份(300715.SZ)耗资8210.14万元累计回购550.13万股

    凯伦股份被低估了,主要是因为投资者对该公司的潜在价值和未来发展前景存在误解。目前市场对凯伦股份的认知偏差较大,导致其股价低于实际价值。投资者应对公司进行深入的研究和分析,了解其业务模式、财务状况和竞争优势,以更准确地评估公司的价值,并抓住低估的投资机会。