SD3与SDXL、MidJourney和Ideogram针锋相对——哪款AI图像生成器最好?

时间:2024-09-21 编辑: 浏览:(570)

稳定性人工智能最新的大型发布SD3在人工智能社区引起了相当大的轰动。SD3承诺提高即时遵守性、效率、准确性和整体质量,昨天上线,希望在图像生成方面树立一个新的基准。我们很快就开始观察SD3与其前身SDXL以及其他领先机型MidJourney和Ideogram相比有多好。

我们的面对面比较对每个模型都使用了相同的提示,以确保公平竞争,尽管由于模型之间的内在差异,这似乎是非常规的。评估包括各种场景,测试模型处理详细艺术提示和日常场景的能力。SD3和SDXL使用相同的种子,稳定扩散世代使用标准化的负面提示,比赛场地变得平坦。

以下是我们对各种图像类型的结果。所有图像按相同顺序显示:SD3(左上)、SDXL(右上)、MidJourney(左下)和Ideogram(右下)。我们将分享我们对每一个的看法,但你也可以自己判断。

插图

提示:一只巨型蜘蛛在丛林中追逐一名女子的手绘插图,极度恐怖、痛苦、黑暗和令人毛骨悚然的景色、恐怖、模拟摄影影响的暗示、素描。

SD3和SDXL都采用了让人想起旧漫画的黑白风格。然而,SD3的输出要详细得多,捕捉到了蜘蛛的腿和女人痛苦的表情等复杂的元素。MidJourney采用了一种更巧妙的方法,制作了一幅充满活力的插图,虽然在视觉上很有吸引力,但偏离了提示的“手绘”和“草图”指示。Ideogram的解释反映了SD3的风格方法,但添加了提示中没有指定的蓝色色调,也不是草图。

就准确性而言,SD3和Ideogram正确地描绘了逃离蜘蛛的女人,与提示的叙述紧密一致。相反,SDXL和MidJourney错误地显示了该女子接近蜘蛛的画面,这与提示相矛盾。考虑到提示的草图规格,SD3的黑白、高度详细的插图比Ideogram的彩色构图更准确,后者缺乏面部细节。

获胜者:SD3。

非标准代

提示:一只穿着西装的蜥蜴。

SD3对一只穿着西装的蜥蜴进行了精确的描绘,并严格遵循提示。这只蜥蜴保留了其自然的外表,有鳞片和爬行动物的特征,无缝地融入了一套剪裁得体的西装中。相比之下,SDXL、MidJourney和Ideogram将蜥蜴拟人化,转而创造了人形蜥蜴。

SDXL和MidJourney的版本非常详细和逼真,类似于照片。MidJourney的输出具有逼真的纹理和深度,几乎类似于模拟摄影,但并没有生成套装。Ideogram的肖像经过了大量编辑,类似于政客们拍摄的官方照片,看起来精致而正式。尽管这些输出质量很高,但SD3在真实性、即时性和准确性方面表现出色,使其结果最可信。

获胜者:SD3。

房间里的大象:“L”字

提示:一个美丽的女人躺在草地上。

SD3显然出了问题。

这一提示之所以被删除,是因为人工智能艺术界首先注意到的一件事是SD3无法生成躺在草地上的人的照片。事实上,这很快就变成了一个迷因。

SDXL展示了这名女子的腰部以上照片,重点是她的上半身和脸部。MidJourney和Ideogram选择了特写图像。MidJourney的结果是最逼真的,展示了女性特征和周围草地的精细细节。然而,它过分强调了散焦效果,不仅模糊了背景,还模糊了女性身体的某些部分。Ideogram避免了过度的bokeh问题,保持了女性身体和草地的清晰。

至于SD3,这是一个莫名其妙的失败。事实上,SD3似乎很难生成人类“躺”在草地上,甚至任何东西上的图像。我们尝试了照片、插图和渲染。我们试着培养男人、女人、老人、孩子,以及任何与人相似的人。这种“撒谎”的姿势把它们都变成了巨大的怪物。

获胜者:SD3被淘汰,这场比赛是MidJourney和Ideogram的平局。

艺术风格

提示:一男一女在未来派餐厅用餐,插图,后印象派,impasto。

这项测试评估了模特再现特定艺术动作的能力。SD3表现出色,产生了impasto笔触,捕捉到了后印象派的精髓。SD3输出中油漆的纹理和层次感显而易见,显示出对风格的深刻理解。

SDXL紧随其后,成功地模仿了后印象派风格,但缺乏明显的impasto技术。MidJourney和Ideogram没有表现出对艺术风格的清晰理解,制作的通用插图与提示的规范不一致。

获胜者:SD3。

特定艺术家及其风格

提示:一男一女在一家未来主义餐厅用餐,插图为文森特·梵高风格。

SD3展示了复制梵高风格的强大能力,将他独特的笔触和调色板融入其中,尤其是对这对夫妇的描绘。这幅作品还准确地描绘了一家未来派餐厅。SDXL紧随其后,将现实主义漫画风格的人物与梵高风格的环境融合在一起。

MidJourney的作品不太连贯,没有描绘餐厅,也缺乏所要求的艺术风格。这对夫妇似乎在水中用餐,这与提示不符。Ideogram制作了一张餐厅里一男一女的直白照片,没有试图模仿梵高的风格。

获胜者:SD3。

写实主义

提示:专业照片,特写人像照片,一个白人男子,穿着黑色毛衣,严肃的脸,戏剧性的灯光,自然,阴郁,多云的天气,bokeh。

SD3以戏剧性的灯光和浅景深有效地捕捉到了严肃、阴郁的表情和黑色毛衣服装,营造出一种忧郁、专业的外观。构图包括一个灰暗的自然环境,与提示很好地吻合。

SDXL的输出遵循了传统的人工智能生成的肖像风格,模糊的背景中有阴天和树叶。然而,这张脸似乎经过了大量编辑,缺乏逼真的瑕疵。MidJourney的版本采用了暖色调和城市背景,偏离了提示的自然方面。

Ideogram的构图符合所有标准,提供了特写框架、黑色毛衣、严肃的表情、昏暗的户外灯光和背景中的一丝散焦。这也是模特中最逼真的照片。

获奖者:Ideogram。

文本生成

提示:在一个未来派城市,一名女子在墙前摆姿势,并举着一块写着“解密崛起”的牌子

事实证明,文本生成对所有模型都具有挑战性。没有一个模型成功地准确地呈现了文本“通过解密出现”。SDXL提供了最具未来感的城市景观,但未能包含提示中指定的所有元素。SD3成功地生成了墙、标志和城市——尽管文本不准确。

MidJourney是最准确的一个,产生了标志、城市和城墙的未来氛围。Ideogram生成了墙和城市,但省略了标志。尽管存在这些问题,但SD3能够融入作品的所有关键元素,即使是不完美的文本,也使其在这种情况下成为赢家。

获胜者:MidJourney——但这是幸运的一代,因为Ideogram在生成图像文本方面总体上更为一致。

结论

SD3与前代SDXL相比有了显著改进,在各种场景中与MidJourney和Ideogram相比具有竞争力。正如承诺的那样,SD3擅长迅速的坚持,以及细节和艺术风格的再现。SD3已经证明了其作为稳健基础模型的潜力。

然而,它的严格审查和在培养某些职位的人才方面令人困惑的局限性表明,它可能最好与其他工具结合使用。

例如,用户可能希望使用SD 1.5、SDXL或Pixart生成他们的图像,然后对这些生成进行编码,并将它们发送到具有SD3的去噪采样器。这将把图像创建过程卸载到SD3,但将使用上一代作为参考,而不是从头开始生成所有内容。目前,这更有意义,因为没有自定义模型,甚至没有Controlnets或LoRA来给用户更多的选择来影响模型。

在目前的状态下,SD3在许多用例中都优于SDXL,但不足以取代它。

由Ryan Ozawa编辑。

最新 更多 >
  • 1 4-Way Mirror Money(4WMM)发行价多少钱?

    4-Way Mirror Money(4WMM)发行价多少钱?随着加密货币市场的不断发展,越来越多的数字货币项目开始涌现。其中一个备受瞩目的项目是4-Way Mirror Money(4WMM),它在加密货币社区引起了广泛关注。关于4WMM的发行价是多少钱成为了许多投资者关注的焦点。4-Way Mirror Money(4WMM)是一个基于区块链技术的数字货币项目,旨在通过创建一个具有卓越隐私保护

  • 2 Simpson MAGA(MAGA币)发行量是多少?

    Simpson MAGA(MAGA币)发行量是多少? Simpson MAGA(MAGA币)是一种虚拟货币,它在数字货币市场上备受关注。许多人都想了解Simpson MAGA的发行量究竟是多少,这将直接影响其价值和市场表现。 目前,Simpson MAGA的发行量是固定的,总共只有10亿枚。这意味着全球只有10亿个Simpson MAGA,供大众使用和交易。这种固定的发行量使得Simpson MA

  • 3 SPURDO(SPURDO币)值得长期投资吗?

    SPURDO币的背景SPURDO币是一种基于区块链技术的加密货币,诞生于2017年,它的名称源自于网络迷因“Spurdo Sparde”。SPURDO币的特点SPURDO币采用Proof of Stake共识机制,可以通过持有币数量来获得更多的SPURDO币。这种机制相对于传统的挖矿方式更节能环保,也更具可持续性。SPURDO币的价值目前,SPURDO币的价格较为稳定,市值也在逐渐增长。作为一种加

  • 4 Polimec(PLMC币)未来价值如何?

    Polimec(PLMC币)未来的潜在价值Polimec(PLMC币)是一种新兴的加密货币,它的设计初衷是为了提供更安全、高效和去中心化的支付和交易方式。随着区块链技术的不断发展和普及,人们对PLMC币的未来价值也开始进行探讨。首先,PLMC币的价值在于其去中心化的特性。与传统的金融体系不同,PLMC币不受任何中央机构或政府的控制,这意味着用户可以在全球范围内进行安全、快速和低成本的交易,而不必担

  • 5 CADAICO(WCADAI)发行量是多少?

    CADAICO(WCADAI)发行量是多少? CADAICO(WCADAI)是一种新型的数字货币,它的发行量是多少呢?这是许多人关注的问题。CADAICO作为一种数字货币,其发行量和价值由其发行商决定,一般情况下会有一个固定的总发行量。据了解,CADAICO的总发行量是一定的,一旦达到了这个数量,就不会再继续发行。这和传统的货币有所不同,传统货币由中央银行决定印刷数量,可以根据需要随时增加货币的供

  • 6 Simpson MAGA(MAGA币)是什么币种?

    Simpson MAGA(MAGA币)是什么币种? 如果你是一位数字货币爱好者或投资者,你可能已经听说过Simpson MAGA(MAGA币)。但对于许多人来说,他们可能还不太了解这种新兴货币。那么Simpson MAGA到底是什么币种? Simpson MAGA是一种加密货币,它是基于区块链技术的一种数字货币。它的名称来自于美国电视剧《辛普森一家》中的主要人物之一,是一种充满趣味性的币种。 作为

  • 7 Caprisun Monkey(CAPRI)是什么币种?

    Caprisun Monkey(CAPRI)是什么币种?Caprisun Monkey(CAPRI)是一种加密货币,它在区块链技术的基础上发展而来。作为一种数字货币,CAPRI的特点是去中心化、匿名性和安全性。CAPRI的特点1. 去中心化:CAPRI的交易不依赖于任何中央机构或第三方,而是通过区块链网络完成。这意味着用户可以直接进行交易,无需经过中介。2. 匿名性:CAPRI使用加密技术保护用户

  • 8 Awkward Monkey Base(AWK币)值得长期投资吗?

    Awkward Monkey Base(AWK币)值得长期投资吗?虚拟货币作为一种新兴的投资方式,吸引了不少投资者的关注。其中,Awkward Monkey Base(AWK币)作为一种较为热门的数字货币,备受投资者关注。那么,AWK币是否值得长期投资呢?这就需要我们对其进行深入的分析。市场前景分析首先,我们可以从市场前景入手。AWK币作为一种虚拟货币,其市场前景主要取决于其应用场景和用户群体。目

  • 9 Giga Trump(GTRUMP币)未来价值如何?

    Giga Trump(GTRUMP币)未来价值如何? 作为一种新兴的数字货币,Giga Trump(GTRUMP币)在过去几年里备受瞩目。GTRUMP币是基于区块链技术的一种加密数字货币,其独特的发行方式和背后的支持团队吸引了众多投资者的注意。随着数字货币市场的持续发展,GTRUMP币的未来价值备受关注。很多人认为,GTRUMP币有着巨大的增值潜力,可能成为未来数字货币市场的领头羊之一。技术创新和

  • 10 BoostAI($BOOST币)值得长期投资吗?

    BoostAI ($BOOST币)值得长期投资吗?BoostAI($BOOST币)是一种基于人工智能技术的加密货币,旨在通过其独特的算法和智能合约技术为投资者提供更加智能和安全的投资机会。随着加密货币市场的不断发展和创新,$BOOST币备受关注,但是它是否值得长期投资呢?市场前景和潜力在当今的数字经济时代,人工智能技术正在逐渐渗透到各个行业中,并且被认为是未来的关键发展方向之一。$BOOST币作为