这款超轻AI模型适合你的手机,可以击败ChatGPT

时间:2024-09-20 编辑: 浏览:(965)

微软今天声称,它已经发布了“最有能力、最具成本效益的小语言模型”,并表示Phi-3——其小语言模型Phi系列的第三次迭代——优于同等大小的模型和一些更大的模型。

小型语言模型(SLM)是一种人工智能模型,旨在非常有效地执行特定的语言相关任务。与非常适合各种通用任务的大型语言模型(LLM)不同,SLM建立在较小的数据集上,使其在特定用例中更高效、更具成本效益。

微软解释说,Phi-3有不同的版本,最小的是Phi-3 Mini,这是一个在3.3万亿代币上训练的38亿参数模型。尽管其规模相对较小——Llama-3的语料库重达超过15万亿个数据令牌——但Phi-3 Mini仍然能够处理128K个上下文令牌。这使得它可以与GPT-4相媲美,并在代币容量方面击败了Llama-3和Mistral Large。

换言之,像Meta.AI上的Llama-3和Mistral Large这样的人工智能巨头可能会在长时间聊天或提示后崩溃,早在这种轻量级模型开始挣扎之前。

Phi-3 Mini最显著的优势之一是它能够在典型的智能手机上安装和运行。微软在iPhone 14上测试了这款手机,它运行时没有出现任何问题,每秒生成14个代币。运行Phi-3 Mini只需要1.8GB的VRAM,对于有更集中需求的用户来说,这是一种轻量级、高效的替代方案。

虽然Phi-3 Mini可能不太适合高端编码器或有广泛需求的人,但它可能是有特定需求的用户的有效替代品。例如,需要聊天机器人的初创公司或利用LLM进行数据分析的人可以使用Phi-3 Mini进行数据组织、提取信息、进行数学推理和构建代理等任务。如果该模型能够接入互联网,它可以变得非常强大,用实时信息弥补其功能的不足。

由于微软专注于利用最有用的信息管理其数据集,Phi-3 Mini获得了很高的测试分数。事实上,更广泛的Phi家族不适合需要事实知识的任务,但高推理能力使他们超越了主要竞争对手。Phi-3 Medium(一个140亿参数的模型)在大多数合成基准中始终击败了GPT-3.5等强大的LLM(为免费版本的ChatGPT提供动力的LLM),Mini版本则击败了Mixtral-8x7B等强大的模型。

然而,值得注意的是,Phi-3并不像其前身Phi-2那样是开源的。相反,它是一个开放的模型,这意味着它可以访问和使用,但它没有与Phi-2相同的开源许可,这允许更广泛的使用和商业应用。

在未来几周,微软表示将发布更多Phi-3系列机型,包括Phi-3 Small(70亿参数)和上述Phi-3 Medium。

微软已经在Azure AI Studio、Hugging Face和Ollama上推出了Phi-3 Mini。该模型针对ONNX Runtime进行了指令调整和优化,支持Windows DirectML,并支持不同GPU、CPU甚至移动硬件的跨平台支持。

最新 更多 >
  • 1 Revolut向Bitstamp转入约230万美元的SHIB和UNI

    最新消息:据Arkham监测,Revolut地址向Bitstamp存款地址转入630亿枚SHIB(价值95.8万美元)和20万枚UNI(价值135.6万美元),向Kraken存款地址转入2746枚USDC,价值2746万美元。

  • 2 币界网大额成交监控

    最新消息:Binance刚发生一笔【USDCUSDT】大额成交,成交单价为0.9996USDT,共成交了960414.00个,价值960029.83USDT

  • 3 币界网大额成交监控

    最新消息:Binance刚发生一笔【BTCUSDT】大额成交,成交单价为64025USDT,共成交了8.73个,价值559091.91USDT

  • 4 EigenLabs员工接受其他项目提供的价值数百万美元空投,引发潜在利益冲突问题

    最新消息:BlockBeats 消息,8 月 15 日,据 CoinDesk 报道,调查发现,EigenLayer 开发商 Eigen Labs 的员工接受了来自一些依赖其技术的其他项目提供的数百万美元的支付,引发了潜在利益冲突的问题。某团队告诉 CoinDesk,它将一部分代币作为「感谢」赠送给了每位 Eigen Labs 员工。每位员工的分配份额最终价值达到了 80,000 美元。Eigen

  • 5 日元正再次走强,比特币交易员需保持谨慎

    最新消息:BlockBeats 消息,8 月 19 日,本月初日元的优异表现引发了套利平仓,并震动了包括加密货币在内的风险资产。自周四晚些时候以来,日元兑美元汇率已升值 2.4% 至 145,结束了自 8 月 5 日 141.68 的低点反弹势头,表明投资者对「抗风险」货币的偏好再度升温。日元兑澳元(风险偏好的晴雨表)升值逾 1%。日元兑欧元和英镑的活力甚至更强。传统市场风险敞口的降低也给比特币和

  • 6 知情人士:Cboe移除相关19b-4文件之前,SEC与发行人讨论Solana潜在证券属性

    最新消息: 知情人士透露,在 Cboe BZX 移除相关的 Solana ETF 19b-4 备案文件之前,美国 SEC 与潜在发行人进行了会谈,讨论其对 Solana 作为证券的潜在地位的担忧。他们表示,在讨论之后,SEC 和 Cboe 同意不向《联邦公报》(Federal Register)提交 19b-4 表格,否则将启动审批程序。这样做会给 SEC 带来压力,迫使其做出与 Solana E

  • 7 CerboAI:LoRA 与区块链结合可提升 AI 效率与隐私保护

    最新消息:8月19日消息,去中心化人工智能网络 CerboAI 表示其使用 LoRA 结合区块链技术实现联邦学习验证,能够大幅提升 AI 模型定制的效率和数据隐私保护,提供了安全高效的人工智能解决方案。

  • 8 Ceffu托管钱包向Binance存入3523万枚FRONT

    最新消息:深潮 TechFlow 消息,8 月 2 日,据 The Data Nerd 监测,Ceffu 的托管钱包 6 小时前向 Binance 存入 3523 万枚 FRONT,约合 255 万美元。

  • 9 币界网实时价格午报:YGG站上0.3947美元/枚,涨幅达3.00%

    最新消息:BOSS Wallet数据来源,Yield Guild Games今日行情消息,YGG最新价格:$0.3947,24小时跌-6.49%,交易量$5167.05万从k线图的解析中看出,现在属于下降趋势。相比23:00大幅下跌,穿破18:00的低点,比16:00有所下降。价格和交易量同时下降,通常意味着市场活跃度降低,买卖双方都不活跃。市场可能处于观望状态,等待新的驱动因素。这种情况下,未来

  • 10 老牌意大利银行BancaSella现已在其平台上直接提供比特币服务

    最新消息:深潮 TechFlow 消息,8月19日,据 Fintech Finance 报道,成立于 1886 年的意大利知名银行 Banca Sella 现已在其移动银行平台 Hype 上推出比特币交易服务。该平台拥有超过 120 万用户,目前正在对 Hype Plus(高级)用户进行小范围测试,预计几天后将向所有用户开放。用户无需通过交易所即可直接在 Hype 平台上买卖比特币。此外,Hype