SD3与SDXL、MidJourney和Ideogram针锋相对——哪款AI图像生成器最好?

时间:2024-09-24 编辑: 浏览:(760)

稳定性人工智能最新的大型发布SD3在人工智能社区引起了相当大的轰动。SD3承诺提高即时遵守性、效率、准确性和整体质量,昨天上线,希望在图像生成方面树立一个新的基准。我们很快就开始观察SD3与其前身SDXL以及其他领先机型MidJourney和Ideogram相比有多好。

我们的面对面比较对每个模型都使用了相同的提示,以确保公平竞争,尽管由于模型之间的内在差异,这似乎是非常规的。评估包括各种场景,测试模型处理详细艺术提示和日常场景的能力。SD3和SDXL使用相同的种子,稳定扩散世代使用标准化的负面提示,比赛场地变得平坦。

以下是我们对各种图像类型的结果。所有图像按相同顺序显示:SD3(左上)、SDXL(右上)、MidJourney(左下)和Ideogram(右下)。我们将分享我们对每一个的看法,但你也可以自己判断。

插图

提示:一只巨型蜘蛛在丛林中追逐一名女子的手绘插图,极度恐怖、痛苦、黑暗和令人毛骨悚然的景色、恐怖、模拟摄影影响的暗示、素描。

SD3和SDXL都采用了让人想起旧漫画的黑白风格。然而,SD3的输出要详细得多,捕捉到了蜘蛛的腿和女人痛苦的表情等复杂的元素。MidJourney采用了一种更巧妙的方法,制作了一幅充满活力的插图,虽然在视觉上很有吸引力,但偏离了提示的“手绘”和“草图”指示。Ideogram的解释反映了SD3的风格方法,但添加了提示中没有指定的蓝色色调,也不是草图。

就准确性而言,SD3和Ideogram正确地描绘了逃离蜘蛛的女人,与提示的叙述紧密一致。相反,SDXL和MidJourney错误地显示了该女子接近蜘蛛的画面,这与提示相矛盾。考虑到提示的草图规格,SD3的黑白、高度详细的插图比Ideogram的彩色构图更准确,后者缺乏面部细节。

获胜者:SD3。

非标准代

提示:一只穿着西装的蜥蜴。

SD3对一只穿着西装的蜥蜴进行了精确的描绘,并严格遵循提示。这只蜥蜴保留了其自然的外表,有鳞片和爬行动物的特征,无缝地融入了一套剪裁得体的西装中。相比之下,SDXL、MidJourney和Ideogram将蜥蜴拟人化,转而创造了人形蜥蜴。

SDXL和MidJourney的版本非常详细和逼真,类似于照片。MidJourney的输出具有逼真的纹理和深度,几乎类似于模拟摄影,但并没有生成套装。Ideogram的肖像经过了大量编辑,类似于政客们拍摄的官方照片,看起来精致而正式。尽管这些输出质量很高,但SD3在真实性、即时性和准确性方面表现出色,使其结果最可信。

获胜者:SD3。

房间里的大象:“L”字

提示:一个美丽的女人躺在草地上。

SD3显然出了问题。

这一提示之所以被删除,是因为人工智能艺术界首先注意到的一件事是SD3无法生成躺在草地上的人的照片。事实上,这很快就变成了一个迷因。

SDXL展示了这名女子的腰部以上照片,重点是她的上半身和脸部。MidJourney和Ideogram选择了特写图像。MidJourney的结果是最逼真的,展示了女性特征和周围草地的精细细节。然而,它过分强调了散焦效果,不仅模糊了背景,还模糊了女性身体的某些部分。Ideogram避免了过度的bokeh问题,保持了女性身体和草地的清晰。

至于SD3,这是一个莫名其妙的失败。事实上,SD3似乎很难生成人类“躺”在草地上,甚至任何东西上的图像。我们尝试了照片、插图和渲染。我们试着培养男人、女人、老人、孩子,以及任何与人相似的人。这种“撒谎”的姿势把它们都变成了巨大的怪物。

获胜者:SD3被淘汰,这场比赛是MidJourney和Ideogram的平局。

艺术风格

提示:一男一女在未来派餐厅用餐,插图,后印象派,impasto。

这项测试评估了模特再现特定艺术动作的能力。SD3表现出色,产生了impasto笔触,捕捉到了后印象派的精髓。SD3输出中油漆的纹理和层次感显而易见,显示出对风格的深刻理解。

SDXL紧随其后,成功地模仿了后印象派风格,但缺乏明显的impasto技术。MidJourney和Ideogram没有表现出对艺术风格的清晰理解,制作的通用插图与提示的规范不一致。

获胜者:SD3。

特定艺术家及其风格

提示:一男一女在一家未来主义餐厅用餐,插图为文森特·梵高风格。

SD3展示了复制梵高风格的强大能力,将他独特的笔触和调色板融入其中,尤其是对这对夫妇的描绘。这幅作品还准确地描绘了一家未来派餐厅。SDXL紧随其后,将现实主义漫画风格的人物与梵高风格的环境融合在一起。

MidJourney的作品不太连贯,没有描绘餐厅,也缺乏所要求的艺术风格。这对夫妇似乎在水中用餐,这与提示不符。Ideogram制作了一张餐厅里一男一女的直白照片,没有试图模仿梵高的风格。

获胜者:SD3。

写实主义

提示:专业照片,特写人像照片,一个白人男子,穿着黑色毛衣,严肃的脸,戏剧性的灯光,自然,阴郁,多云的天气,bokeh。

SD3以戏剧性的灯光和浅景深有效地捕捉到了严肃、阴郁的表情和黑色毛衣服装,营造出一种忧郁、专业的外观。构图包括一个灰暗的自然环境,与提示很好地吻合。

SDXL的输出遵循了传统的人工智能生成的肖像风格,模糊的背景中有阴天和树叶。然而,这张脸似乎经过了大量编辑,缺乏逼真的瑕疵。MidJourney的版本采用了暖色调和城市背景,偏离了提示的自然方面。

Ideogram的构图符合所有标准,提供了特写框架、黑色毛衣、严肃的表情、昏暗的户外灯光和背景中的一丝散焦。这也是模特中最逼真的照片。

获奖者:Ideogram。

文本生成

提示:在一个未来派城市,一名女子在墙前摆姿势,并举着一块写着“解密崛起”的牌子

事实证明,文本生成对所有模型都具有挑战性。没有一个模型成功地准确地呈现了文本“通过解密出现”。SDXL提供了最具未来感的城市景观,但未能包含提示中指定的所有元素。SD3成功地生成了墙、标志和城市——尽管文本不准确。

MidJourney是最准确的一个,产生了标志、城市和城墙的未来氛围。Ideogram生成了墙和城市,但省略了标志。尽管存在这些问题,但SD3能够融入作品的所有关键元素,即使是不完美的文本,也使其在这种情况下成为赢家。

获胜者:MidJourney——但这是幸运的一代,因为Ideogram在生成图像文本方面总体上更为一致。

结论

SD3与前代SDXL相比有了显著改进,在各种场景中与MidJourney和Ideogram相比具有竞争力。正如承诺的那样,SD3擅长迅速的坚持,以及细节和艺术风格的再现。SD3已经证明了其作为稳健基础模型的潜力。

然而,它的严格审查和在培养某些职位的人才方面令人困惑的局限性表明,它可能最好与其他工具结合使用。

例如,用户可能希望使用SD 1.5、SDXL或Pixart生成他们的图像,然后对这些生成进行编码,并将它们发送到具有SD3的去噪采样器。这将把图像创建过程卸载到SD3,但将使用上一代作为参考,而不是从头开始生成所有内容。目前,这更有意义,因为没有自定义模型,甚至没有Controlnets或LoRA来给用户更多的选择来影响模型。

在目前的状态下,SD3在许多用例中都优于SDXL,但不足以取代它。

由Ryan Ozawa编辑。

最新 更多 >
  • 1 ALOHA币有风险吗

    ALOHA币是一种数字货币,在币圈中备受关注。尽管有很多人对ALOHA币抱有很高的期望,但我们也不能忽视其存在的一些风险。首先,ALOHA币存在市场风险。数字货币市场波动较大,其价格可能会受到多种因素的影响,如市场供需关系、政策变化、技术风险等。因此,ALOHA币价格的波动性也是不可忽视的。其次,ALOHA币存在技术风险。虽然区块链技术被认为是安全的,但仍然可能受到黑客攻击、网络故障等问题的影响。

  • 2 ARMOR币有风险吗

    随着区块链技术的不断发展,加密货币作为一种全新的数字资产形式正逐渐进入人们的视野。ARMOR币作为其中的一种,也在近几年逐渐受到了大众的关注。然而,对于投资者来说,不可避免地会面临一个问题,那就是ARMOR币是否存在风险。首先,ARMOR币作为加密货币的一种,其本身就具备一定的风险。与传统金融市场不同,加密货币市场相对不稳定,价格波动较大。这使得投资者在交易ARMOR币时需时刻关注市场行情,并做好

  • 3 APCH币有希望吗

    APCH币是近期备受关注的数字货币之一,人们对其前景抱有很高的期望。然而,我们需要对这样的期望有一个理性的判断。在分析APCH币是否有希望之前,我们需要了解一下该币种的基本情况。APCH币是一种基于区块链技术的数字货币,它旨在提供去中心化的支付解决方案。该币种使用了一种名为\"共振投票\"的机制来确定网络中的节点,并通过这种方式确保交易的安全性和快速性。此外,APCH币还采用了零知识证明技术,保护

  • 4 AROR币有希望吗

    AROR币是一种近期备受关注的加密货币,投资者和社区对其未来发展前景褒贬不一。然而,究竟AROR币有没有希望呢?本文将从技术、市场、竞争等多个角度进行分析,来探讨AROR币的潜力。首先,AROR币在技术方面具有一定的优势。它采用了最新的区块链技术,拥有强大的安全性和可扩展性。AROR币的交易速度快,手续费低,可以实现快速转账和支付,这使得它在日常生活中的应用场景更加广泛。此外,AROR币还支持智能

  • 5 AMZE币值多少钱一枚

    AMZE币是一种加密数字货币,它的价值随着市场供需的变化而波动。目前,AMZE币的价值每枚为多少钱呢?让我们来一起探讨一下。首先,我们先了解一下AMZE币的背景和特点。AMZE币是一种建立在区块链技术上的数字货币,它具有去中心化、匿名性和安全性等特点。它的发行量有限,不会受到政府的控制和操纵。由于其特殊的性质,许多人投资AMZE币,希望能够获得高额回报。AMZE币的价值是由市场供需关系决定的。当市

  • 6 aqx币值多少钱一枚

    在加密货币市场上,AQX币是一种备受关注的数字货币。AQX币是由AQX项目推出的币种,它在加密货币领域内有着广泛的应用场景。那么,AQX币值多少钱一枚呢?让我们一起来了解一下。AQX币的价格是不断波动的,受到市场供需和投资者情绪等因素的影响。在过去几个月的时间里,AQX币的价值稳步上涨。根据最新数据,AQX币当前的价值约为X元一枚,具体的价格变动请以实时行情为准。与其他加密货币相比,AQX币作为新

  • 7 APD币值多少钱一枚

    APD币是一种虚拟货币,现在的币值是多少钱一枚呢?让我们来一起了解一下。首先,APD币是由一个名为APD的区块链公司发行的。与传统货币不同,APD币是一种数字货币,它的交易记录都被记录在一个名为区块链的分布式账本上。APD币在市场上的价值是由供求关系决定的。当有足够多的人对APD币感兴趣并愿意购买时,它的价格就会上涨;相反,当人们对APD币失去兴趣或者愿意出售时,它的价格就会下降。除了供求关系外,

  • 8 ARG币值多少钱一枚

    ARG币是一种虚拟货币,它在数字货币市场上备受关注。作为一种加密数字货币,ARG币在去中心化的区块链网络上运行,并采用了先进的加密算法确保其安全性和匿名性。目前,ARG币的价值一枚有多少钱一直是人们关注的话题。首先,要了解ARG币的价值,我们需要关注其市场表现。与其他加密货币一样,ARG币的价格是由供求关系决定的。当投资者对ARG币兴趣高涨时,需求增加,价格也会上涨。相反,如果投资者对ARG币失去

  • 9 AQUARI币有希望吗

    AQUARI币是近年来备受瞩目的加密货币之一,其在区块链技术和社交媒体领域的巧妙结合,让人们对其未来发展充满了期待。首先,AQUARI币拥有强大的技术支持。作为一种基于区块链的加密货币,AQUARI币采用了先进的加密算法,确保了用户交易的隐私安全和资金的安全性。同时,AQUARI币还借鉴了社交媒体平台的一些特点,通过建立去中心化的社交平台,将用户与用户之间的信息传递和价值交换更加高效便捷。其次,A

  • 10 ARBINU币有希望吗

    近年来,随着区块链技术的迅猛发展,加密数字货币成为了传统金融外的新投资方式。诸如比特币、以太坊等知名币种已经成为了人们关注的焦点。而在众多的币种中,ARBINU币是一种备受关注的新兴数字货币。ARBINU币是基于区块链技术开发的一种加密数字货币,与其他币种相比,ARMINU币具有许多独特的优势。首先,ARBINU币的交易速度极快,可以在几秒钟内完成交易,这为用户提供了便捷的支付体验。其次,ARBI