卷价格的风还是吹到了AI大模型

时间:2024-10-02 编辑: 浏览:(27)

文章来源:硬AI

AI“快进”到价格战阶段?从Deepseek-V2定价看大模型降本新风向

图片来源:由无界AI生成

卷价格的风还是吹到了AI大模型。

近日,大模型DeepSeek-V2将每百万tokens输入/输出价格分别卷至1/2元,远低于行业平均水平。

对此,华福证券发布报告称,大模型成本优化与算力需求并不是直接的此长彼消,而是互相搭台、相互成就。定价的持续走低有望带来更快的商业化落地,进而会衍生出更多的微调及推理等需求,将逐步盘活国内AI应用及国产算力发展。

DeepSeek-V2是知名私募巨头幻方量化旗下AI公司深度求索(DeepSeek)发布的全新第二代MoE大模型。

华尔街见闻此前文章提到,DeepSeek-V2拥有2360亿参数,其中每个token210亿个活跃参数,相对较少,但仍然达到了开源模型中顶级的性能。

华福证券则在报告中写道,从综合性能方面来看,DeepSeek-V2位列第一梯队。在AlignBench、MT-Bench、MMLU等多个benchmark上表现出色,其中AlignBench在开源模型中居首位,与GPT-4-Turbo,文心4.0比肩。MTBench超过最强MoE开源模型Mixtral 8x22B。

01

DeepSeek-V2定价将至冰点

大模型价格战拉开序幕

DeepSeek-V2(32k)每百万tokens输入/输出价格分别为1/2元,而GPT-4-Turbo-1106分别为72/217元,DeepSeek-V2性价比显著。

相对于Claude 3 Haiku,DeepSeek-V2每百万tokens输入/输出价格也仅为其50%/22.2%。除此之外,同为32k上下文版本的moonshot-v1、SenseChat-32K、Qwen1.5 72B每百万tokens输入/输出价格分别为24/24、36/36、20/20元。

DeepSeek表示,采用8xH800 GPU的单节点峰值吞吐量可达到每秒50000多个解码token。如果仅按输出token的API的报价计算,每个节点每小时的收入就是50.4美元,假设利用率完全充分,按照一个8xH800节点的成本为每小时15美元来计算,DeepSeek每台服务器每小时的收益可达35.4美元,甚至能实现70%以上的毛利率。

有分析人士指出,即使服务器利用率不充分、批处理速度低于峰值能力,DeepSeek也有足够的盈利空间,同时颠覆其他大模型的商业逻辑。

华福证券也认为,此次DeepSeek-V2定价发布有望掀起新一轮大模型价格战,api定价有望持续走低。

02

大模型定价下降的背后离不开成本的优化

价格是怎么被打下去的?来自DeepSeek-V2的全新架构。

据悉,DeepSeek-V2采用Transformer架构,其中每个Transformer块由一个注意力模块和一个前馈网络(FFN)组成,并且在注意力机制和FFN方面,研究团队设计并采用了创新架构。 

华福证券指出,目前众多大模型已经通过多种方式降低成本。

从模型压缩的方向看,可以通过量化的形式将浮点表征为低位宽模型来压缩模型存储空间,加速模型推理;从模型架构的方向看,MoE架构由于其内部的专家模型能够分配到不同设备,并可以执行并行计算,其计算效率较稠密模型显著提升,进而带来更低的成本。

从tokens量的方向来看,可以通过prompt压缩等方式直接降低输入端tokens,进而降低成本。除此之外,多种新的方案已出现在相关论文中,未来多种成本优化方案的融合将进一步加速模型成本的下降。

本文主要观点来自华福证券钱劲宇(执业证书编号:S0210524040006)5月9日发布的报告《计算机行业跟踪:从 Deepseek-V2 定价看大模型降本新风向》

最新 更多 >
  • 1 分析师预测比特币的六位数潜力-最新加密货币新闻

    据经验丰富的加密货币分析师Credible Crypto称,比特币(BTC)可能很快会达到前所未有的高度。分析师预测,BTC在未来几个月可能会飙升至10万至30万美元的价格。然而,他警告说,这种快速上升之后可能会出现大幅调整。 内容隐藏1比特币能达到15万美元吗?2什么可能引发大崩盘?投资者的3个关键要点 比特币能达到15万美元吗? 在最近的一次YouTube讨论中,Credib

  • 2 国际清算银行对希望持有XRP和其他第2组资产的银行发布新要求

    国际清算银行(BIS)发布了对希望持有XRP和其他第2组加密资产的银行的新要求。 国际清算银行将自己定位为全球央行的银行,并出台了新的规定来管理银行对第2类加密货币的敞口。值得注意的是,国际清算银行过去曾定义了第2组加密资产是什么,以将其与其他加密货币区分开来。 第2组资产包括无担保的加密资产,如XRP、比特币(BTC)和以太坊(ETH)。该类别还包含缺乏有效稳定机制的稳定币。根据国际清算银行的分

  • 3

  • 4 Aotrmen(奧特曼)正式上線,即將開啟RWA元資產的新時代

    Aotrmen(奧特曼)正式上線以來,僅幾天時間錢包地址數量就突破了30000+,其熱度已經成為加密資產行業關注的焦點,更有國際媒體和行業大V加入關注報導。自2021年11月以來,加密市場一直還處在熊市狀態,DeFi的總定值(TVL)已下降了超過1600億美元,雖然比特幣已經完成第四次減半,但是大家期待已久牛市依然遲遲沒有到來,諸多行業大咖認為本輪牛市到來還需要一個真正的引爆點,而這個引爆點就是R

  • 5 Pantera合伙人:NEAR协议的演进——技术进步、AI立场和热门项目

    作者:Paul Veradittakit,Pantera Capital合伙人;编译:0xjs@引言随着加密货币行业继续快速发展,我相信区块链技术将成为多个行业创新的关键驱动力。比特币和以太坊处于这场革命的前沿,拥有巨大的市值和广泛的用户采用。比特币的市值超过 6000 亿美元,因其在加密货币领域的先锋作用而受到广泛认可。以太坊在促进可编程区块链方面处于领先地位,支持各种去中心化应用程序 (dAp

  • 6 区块链技术的关键创新及其在DDO Chain中的应用

    在当今数字经济的时代,数据已成为一种宝贵的资源。然而,如何安全、高效地存储和管理这些数据仍然是一个巨大的挑战。去中心化存储作为区块链技术的重要创新之一,正在为这一问题提供解决方案。本文将详细介绍去中心化存储的概念、工作原理,以及DDO Chain如何利用去中心化存储技术提升其生态系统的安全性和效率。去中心化存储的定义和工作原理去中心化存储是一种数据存储方式,利用区块链技术将数据分散存储在多个节点上

  • 7 XRP下跌 、ETH现在将如何走势、TON失去关键支撑位

    XRP正处于调整过程中,其价格在过去 24 小时内下跌了 7%,可能推动市场出现首次重大调整。不过,这可能是暂时的,几天后情况可能会再次转好。 50 日移动平均线是 XRP 的第一个主要支撑位。如果 XRP 保持在此屏障之上,它可能会趋于平稳甚至再次上涨。作为交易者的心理屏障,这一水平历来是价格反弹的基础。支撑位在 0.50 美元,紧随其后的是 100 日移动平均线。在过去的下行趋势中,它提供了坚

  • 8 比特币ETF吸引投资者-最新加密货币新闻

    截至7月18日,比特币ETF现货数据反映了又一个重要的资金流入日,强调了投资者的热情。8470万美元的净流入突显了投资者通过这些金融产品对比特币的持续承诺,即使在市场动荡的情况下也是如此。 内容隐藏1主要现货比特币ETF表现如何?2哪些ETF表现各异?3个关键投资者要点 主要现货比特币ETF表现如何? 根据SoSoValeu的数据,贝莱德在纳斯达克上市的IBIT ETF表现突出。

  • 9 比特币矿商Northern Data采取行动驳回前雇员的诉讼

    Northern Data驳斥了前雇员的欺诈指控。该公司已采取行动驳回这些指控,为其在美国的首次公开募股铺平道路。 欧洲最大的比特币矿商Northern Data驳斥了前雇员的欺诈指控,并驳回了前雇员提起的诉讼。 在最近接受彭博社采访时,Northern Data首席运营官Rosanne Smith证实了驳回指控的举措。 “这些投诉完全没有法律依据。我们已经提出了驳回投诉的动议,我们相信法律程序

  • 10 NBA向华纳兄弟Discovery发送媒体条款,正式开始为期五天的比赛期

    随着美国国家篮球协会媒体版权接近最终形式,华纳兄弟探索公司即将开始其业务。联盟已将其拟议的新媒体版权合同的正式条款发送给华纳兄弟探索公司,开始为期五天的时间,媒体公司可以选择匹配一揽子广播权。TNT发言人证实收到了这些文件,并承认该公司目前正在审查这些条款。据知情人士透露,华纳兄弟探索公司于周三晚上收到了合同框架。由于细节保密,该人士要求不具名。目前正在构建的媒体版权协议包括与迪士尼、康卡斯特旗下