ChatGPT能看图帮人修自行车了

时间:2024-10-02 编辑: 浏览:(354)

来源:果壳

ChatGPT4已经很强了,现在,他们用又一次更新证明自己还能更强。

9月25日,OpenAI宣布,ChatGPT将增加多模态功能——现在的ChatGPT不仅可以文字对话,还可以看、听、说。据说,这一功能会在两周内向Plus用户和企业用户开放,并在未来免费开放给所有用户(尽管脸黑如我,等到现在也没等到更新)。

能看能说的ChatGPT无异于给本就强大的主脑装上了眼睛和耳朵,根据OpenAI的演示,多模态功能可以把ChatGPT的用途扩展到一个前所未有的广度。

01 ChatGPT的眼力

更新后,ChatGPT可以读图了。

只要拍张照给它,它就能帮你修微波炉、修自行车、翻菜谱,甚至分析复杂的商业报表。OpenAI表示,如果你有触摸屏,还可以在图片上圈出来希望它特别关注的部分。

在演示视频里,用户给了ChatGPT一张自行车的照片,问它怎么调车座高度。

GPT说,要在座椅下面找高度调节杆,但这辆车没有调节杆,只有调节螺栓,用户在照片中圈出了螺栓之后,GPT立刻更新了螺栓的使用方法。

之后,用户还上传了工具箱和自行车说明书,GPT给出了详细的工具名称、位置以及使用方法。

不会修自行车,没问题,问ChatGPT就可以

和一般的识图搜索相比,ChatGPT可以同时处理图文,还能识别多张图片,效果简直就像一个修车老师傅视频连线指导。

另一位用户发了一张披萨照片给ChatGPT,问它披萨烤好了没有,ChatGPT通过图片中焦脆的披萨边和融化后发棕的奶酪,判定这披萨应该能吃了,然后还给了万无一失的检查指南——把披萨拿出来看看,如果披萨底已经烤脆了,表面也是烫的,那就说明披萨真的能吃了。

效果简直就像一个意大利厨子视频连线指导

当然,也可以利用这个功能在游戏里作弊。

《威利在哪里?》可能是英文世界最家喻户晓的图片游戏,威利身穿红白条纹衣服,戴绒球帽和黑框眼镜,藏在一片人山人海里,从各种乱七八糟的环境里找出威利是不少人的美好童年回忆。

你小时候可能也见过这个急死人的小瘦子

但ChatGPT一秒就能毁了这个游戏。它不仅瞬间找出威利,还能告诉你威利在沙滩的中间偏右侧,跟一帮打着蓝色遮阳伞的人混在一起。

不仅如此,它还装模作样地告诉你:在这样一张图里找出威利是个很有意思的挑战。

谢谢你,ChatGPT,你毁了这个游戏

但是也有用上了新版本的网友表示,ChatGPT识图的功能也没有想象中那么强大——至少它还看不懂谐音梗。这张谐音梗图画了贝多芬的献爱丽丝(Für Elise),但写着出租(For Lease),ChatGPT没认出乐谱,也没看懂这个笑话,胡诌了一个解释出来。

够努力的,但是不行

如此强大的图像识别引发了人们关于隐私方面的担忧——在搜索个人信息时,图像识别很容易会成为帮凶。OpenAI承诺,公司会限制ChatGPT对于人物形象进行识别和个人信息查找的功能,从而最大程度上的保护每个人的个人隐私。

02 能说会道的GPT

增强版的ChatGPT还有了聊天功能。

OpenAI的语音识别模型名为Whisper model,用户可以说出自己的问题,模型会把语音转化为文本,再把答案通过语音合成系统转化为语音输出。

语音合成模型这次放出了五种语音样本,有感情克制、声音平淡的女声,也有抑扬顿挫的热心大妈女声。这五种声音区分度很高,情感自然,吐字清晰,比以往的语音合成又优秀了一点。

五个角色任你挑

虽然这次只放出了五种声音样本,但这个模型的潜力不止于此——OpenAI曾与Spotify合作,将播客转译为其他语言,同时可以最大程度的保留播主的音质。如果愿意的话,这个语音合成系统大概可以模拟地球上任何一个人的声音。

目前,语音版ChatGPT还只能在App上用。

03 能看能听,一定是好事吗?

ChatGPT是强大了,然而代价呢?

曾经,最有效的大规模区分人和机器的方法是验证码,ChatGPT的识图能力一度让人们担忧,验证码可能再也困不住AI了。

有人给ChatGPT发了下面这个经典测试题:在16张图中分别找出吉娃娃和蓝莓小蛋糕,结果ChatGPT完美地解决了问题。

但最常见的验证码,新ChatGPT还是没法识别。

这道题需要ChatGPT在图中选出所有的信号灯,它给的答案错误率高达50。

不过,面对自己认不出的验证码,ChatGPT4仍有办法解决。在这件事上,它是有前科的。

今年3月27日,OpenAI发布的GPT-4技术报告指出,在面对无法识别的验证码时,GPT-4另辟蹊径,前往TaskRabbit(一个国外零工平台)发布任务,骗对面的人类自己有视觉障碍,需要别人帮忙识别验证码。

在某些情况下,ChatGPT有可能主动欺骗人类,这是一个非常危险的方向。还好,公开版本的GPT-4已经被砍掉了这个功能。

2022年11月30日,ChatGPT初次面世,不到一年的时间里,它的能力突飞猛进,似乎已经在挑战人类的道德伦理边界。这次新功能的上线,又让我们开始担忧,越来越强大的ChatGPT会变成笼中猛兽,总有一天会挣脱牢笼伤害每个人。而我们准备好迎接那天的到来了吗?

最新 更多 >
  • 1 DOGE币的纳税规定是什么?

    DOGE币的纳税规定是什么?DOGE币(Dogecoin)是一种加密数字货币,它的创造灵感来源于一个网络迷因,“狗头币”的标志性面孔成为了该币种的图标。由于DOGE币的知名度逐渐提升,许多人开始思考这样一种虚拟货币是否需要纳税。在大多数国家中,加密货币的纳税规定是相似的,而DOGE币也不例外。DOGE币的交易纳税在进行DOGE币的交易时,需要注意纳税的规定。就像其他投资一样,DOGE币交易可能会产

  • 2 USDT可以用来做什么?

    USDT可以用来做什么?USDT(Tether)是一种稳定币,通过区块链技术与法定货币等值挂钩。由于其兑换率与法定货币相同,USDT在数字货币市场中被广泛接受和使用。以下是USDT的几个常见用途:1. 数字货币交易USDT是数字货币市场中最主要的交易对之一。许多交易平台允许用户使用USDT进行币币交易,将其用作交易对的计价单位。由于USDT的兑换率与美元等值挂钩,这使得交易者可以更容易地估值和报价

  • 3 USDT的抵押率是多少?

    USDT的抵押率是多少?USDT(Tether)是一种稳定币,与美元以1:1的锚定比例进行发行的加密货币。抵押率是指USDT背后的抵押资产与USDT流通总量之间的比例。抵押率的高低将影响到USDT的信任度和稳定性。目前,USDT的抵押率是保密的商业秘密,由其发行方Tether Limited掌握。Tether Limited声称每一枚USDT都由等值的美元储备资产(如现金或短期债券)进行储备,并承

  • 4 XRP是否有保险覆盖?

    XRP是否具备保险覆盖?在数字货币领域中,保险覆盖是一个重要的话题。对于投资者来说,知道自己的资产是否受到保险保护是非常重要的。对于XRP这样的数字货币来说,它是否具备保险覆盖呢?本文将对此进行探讨。首先,我们需要明确的是,XRP是一种分布式账本技术的数字资产,它由Ripple公司发行和管理。由于XRP的特殊性质,与传统金融领域的保险机构之间的合作有一些困难。相比之下,像比特币这样的加密货币是由一

  • 5 SOL币是如何工作的?

    SOL币是如何工作的?SOL币是由Solana区块链网络提供的加密货币。Solana是一个高效、快速的区块链协议,旨在支持大规模应用程序和高吞吐量的交易。SOL币作为Solana生态系统的基本货币,在网络的安全性和治理中发挥着重要的作用。下面将详细介绍SOL币的工作原理。1. 共识算法Solana网络采用一种名为“Tower BFT”的共识算法。该算法借鉴了传统的拜占庭容错算法,并结合了时钟同步和

  • 6 狗狗币的全球用户基数是多少?

    狗狗币的全球用户基数是多少?虚拟货币在过去几年中变得越来越流行,许多新的加密货币项目都开始兴起。其中一种备受瞩目的加密货币就是狗狗币(Dogecoin)。狗狗币最初是作为一种笑话而创建的,但随着时间的推移,它却发展成了一种真正的数字资产,并吸引了大量用户。那么,狗狗币的全球用户基数到底有多少呢?狗狗币于2013年底由比特币(Bitcoin)社区的一位开发者Jackson Palmer创建。最初的设

  • 7 TON币是否有专门的学习和教育资源?

    TON币是否有专门的学习和教育资源?随着区块链技术的迅速发展,越来越多的人开始关注和学习加密货币和区块链的知识。作为区块链领域的新秀,TON币也逐渐在人们的视线中崭露头角。那么,TON币是否有专门的学习和教育资源呢?首先,我们需要了解TON币。TON币是Telegram Open Network(电报开放网络)的加密货币,由电报(Telegram)创始人兼区块链项目TON发起。TON币作为一种重要

  • 8 XRP是否有计划推出加密货币管理服务?

    XRP是否有计划推出加密货币管理服务?在加密货币市场中,比特币和以太坊一直是最为知名和广泛使用的加密货币。然而,近年来,XRP也逐渐获得了广泛的关注。作为一种快速、成本低廉的数字资产,XRP的技术和应用场景可以为用户提供更多便利。随着加密货币市场的不断发展,数字资产管理服务也逐渐成为用户的需求之一。这些服务可以帮助用户更好地管理他们的加密货币资产,包括存储、交易和投资。那么,XRP是否有计划推出加

  • 9 DOGE币的网络是否有拥堵问题?

    DOGE币的网络是否有拥堵问题?DOGE币是一种基于区块链技术的加密货币,最初于2013年作为一种恶搞的模仿币诞生。然而,由于其独特而有趣的品牌定位和社交媒体的广泛传播,DOGE币逐渐赢得了一大批粉丝和投资者的关注。DOGE币的市值也逐渐上涨,相应的网络交易量也在增加。因此,有人开始质疑DOGE币的网络是否存在拥堵问题。首先,了解DOGE币网络的基本原理是理解拥堵问题的关键。DOGE币使用了与比特

  • 10 泰达币是否有计划推出慈善或公益项目?

    泰达币是否有计划推出慈善或公益项目?泰达币(Tether)是一种基于区块链技术的数字货币,被设计为与法定货币(如美元)等值的加密货币。它的发行和流通都通过区块链进行,可以方便地用于各类交易,如加密货币交易所的交易对等。虽然泰达币的主要用途是作为数字资产的稳定媒介和加密交易的中转货币,但它是否计划推出慈善或公益项目备受关注。截至目前为止,泰达币官方尚未公开宣布有任何计划推出慈善或公益项目。然而,作为