ChatGPT能看图帮人修自行车了

时间:2024-10-01 编辑: 浏览:(237)

来源:果壳

ChatGPT4已经很强了,现在,他们用又一次更新证明自己还能更强。

9月25日,OpenAI宣布,ChatGPT将增加多模态功能——现在的ChatGPT不仅可以文字对话,还可以看、听、说。据说,这一功能会在两周内向Plus用户和企业用户开放,并在未来免费开放给所有用户(尽管脸黑如我,等到现在也没等到更新)。

能看能说的ChatGPT无异于给本就强大的主脑装上了眼睛和耳朵,根据OpenAI的演示,多模态功能可以把ChatGPT的用途扩展到一个前所未有的广度。

01 ChatGPT的眼力

更新后,ChatGPT可以读图了。

只要拍张照给它,它就能帮你修微波炉、修自行车、翻菜谱,甚至分析复杂的商业报表。OpenAI表示,如果你有触摸屏,还可以在图片上圈出来希望它特别关注的部分。

在演示视频里,用户给了ChatGPT一张自行车的照片,问它怎么调车座高度。

GPT说,要在座椅下面找高度调节杆,但这辆车没有调节杆,只有调节螺栓,用户在照片中圈出了螺栓之后,GPT立刻更新了螺栓的使用方法。

之后,用户还上传了工具箱和自行车说明书,GPT给出了详细的工具名称、位置以及使用方法。

不会修自行车,没问题,问ChatGPT就可以

和一般的识图搜索相比,ChatGPT可以同时处理图文,还能识别多张图片,效果简直就像一个修车老师傅视频连线指导。

另一位用户发了一张披萨照片给ChatGPT,问它披萨烤好了没有,ChatGPT通过图片中焦脆的披萨边和融化后发棕的奶酪,判定这披萨应该能吃了,然后还给了万无一失的检查指南——把披萨拿出来看看,如果披萨底已经烤脆了,表面也是烫的,那就说明披萨真的能吃了。

效果简直就像一个意大利厨子视频连线指导

当然,也可以利用这个功能在游戏里作弊。

《威利在哪里?》可能是英文世界最家喻户晓的图片游戏,威利身穿红白条纹衣服,戴绒球帽和黑框眼镜,藏在一片人山人海里,从各种乱七八糟的环境里找出威利是不少人的美好童年回忆。

你小时候可能也见过这个急死人的小瘦子

但ChatGPT一秒就能毁了这个游戏。它不仅瞬间找出威利,还能告诉你威利在沙滩的中间偏右侧,跟一帮打着蓝色遮阳伞的人混在一起。

不仅如此,它还装模作样地告诉你:在这样一张图里找出威利是个很有意思的挑战。

谢谢你,ChatGPT,你毁了这个游戏

但是也有用上了新版本的网友表示,ChatGPT识图的功能也没有想象中那么强大——至少它还看不懂谐音梗。这张谐音梗图画了贝多芬的献爱丽丝(Für Elise),但写着出租(For Lease),ChatGPT没认出乐谱,也没看懂这个笑话,胡诌了一个解释出来。

够努力的,但是不行

如此强大的图像识别引发了人们关于隐私方面的担忧——在搜索个人信息时,图像识别很容易会成为帮凶。OpenAI承诺,公司会限制ChatGPT对于人物形象进行识别和个人信息查找的功能,从而最大程度上的保护每个人的个人隐私。

02 能说会道的GPT

增强版的ChatGPT还有了聊天功能。

OpenAI的语音识别模型名为Whisper model,用户可以说出自己的问题,模型会把语音转化为文本,再把答案通过语音合成系统转化为语音输出。

语音合成模型这次放出了五种语音样本,有感情克制、声音平淡的女声,也有抑扬顿挫的热心大妈女声。这五种声音区分度很高,情感自然,吐字清晰,比以往的语音合成又优秀了一点。

五个角色任你挑

虽然这次只放出了五种声音样本,但这个模型的潜力不止于此——OpenAI曾与Spotify合作,将播客转译为其他语言,同时可以最大程度的保留播主的音质。如果愿意的话,这个语音合成系统大概可以模拟地球上任何一个人的声音。

目前,语音版ChatGPT还只能在App上用。

03 能看能听,一定是好事吗?

ChatGPT是强大了,然而代价呢?

曾经,最有效的大规模区分人和机器的方法是验证码,ChatGPT的识图能力一度让人们担忧,验证码可能再也困不住AI了。

有人给ChatGPT发了下面这个经典测试题:在16张图中分别找出吉娃娃和蓝莓小蛋糕,结果ChatGPT完美地解决了问题。

但最常见的验证码,新ChatGPT还是没法识别。

这道题需要ChatGPT在图中选出所有的信号灯,它给的答案错误率高达50。

不过,面对自己认不出的验证码,ChatGPT4仍有办法解决。在这件事上,它是有前科的。

今年3月27日,OpenAI发布的GPT-4技术报告指出,在面对无法识别的验证码时,GPT-4另辟蹊径,前往TaskRabbit(一个国外零工平台)发布任务,骗对面的人类自己有视觉障碍,需要别人帮忙识别验证码。

在某些情况下,ChatGPT有可能主动欺骗人类,这是一个非常危险的方向。还好,公开版本的GPT-4已经被砍掉了这个功能。

2022年11月30日,ChatGPT初次面世,不到一年的时间里,它的能力突飞猛进,似乎已经在挑战人类的道德伦理边界。这次新功能的上线,又让我们开始担忧,越来越强大的ChatGPT会变成笼中猛兽,总有一天会挣脱牢笼伤害每个人。而我们准备好迎接那天的到来了吗?

最新 更多 >
  • 1 以太坊跌破3400美元/枚,日内跌3.43%

    每经AI快讯,以太坊跌破3400美元/枚,日内跌3.43%。

  • 2 比特币和以太坊价格上涨-最新加密货币新闻

    在最近的市场走势中,领先的加密货币比特币(BTC)和以太坊(ETH)经历了大幅下跌,拖累了一些替代币。比特币的价值降至6.5万美元,而以太坊的价格进一步下跌。Solana(SOL)等流行替代币以及Dogecoin(DOGE)和Shiba Inu(SHIB)等表情包代币也出现了大幅下跌,跌幅在9%至13%之间。 内容隐藏1比特币和以太坊性能2 Altcoins的现状3投资见解 BTC和ETH性能

  • 3 美联储“软着陆”叙事背后的真实故事

    编译:刘教链教链按:本文是来自“米塞斯学院”Ryan McMaken的稿子,原标题是「美联储“软着陆”叙事背后的真实故事(The Real Story Behind the Fed’s “Soft Landing” Narrative)」。美联储对于今年的降息预期是一推再推。下半年即将到期需要置换的美债,如何找到接盘侠?可能与你想象的恰恰相反,美联储坚持高息,是为了让美债更容易卖得出去,从而帮助美

  • 4 Toncoin(TON)创下新高 10 美元是下一站吗

    原文来源:钮轱辘瑶开放网络的原生代币 Toncoin (TON) 在本周期中表现最佳。该代币本周五两次创下历史新高 (ATH),本周以太坊的活跃用户数量也大幅增加。市场观察人士认为,此次突破和近期表现可能为 10 美元大关的反弹奠定基础Toncoin 创下 8 美元历史新高加密货币分析师 Ali Martinez 最近表示,Toncoin 即将实现重大突破。该分析师强调了TON 图表上的上升三角形

  • 5 波场TRON​携手首席安全官桑尼 让交易更快速

    新加坡门将哈桑·桑尼(Hassan Sunny)已出任波场TRON与火币HTX首席安全官和官方代言人。携手桑尼,波场TRON将继续发挥高吞吐量优势,保障用户每一笔交易和转账都更加畅快便捷。得益于独特的DPoS共识机制及高吞吐量优势,波场网络上的交易得以被快速高效地确认,波场TRON也始终为众多用户提供着安全、快速的服务,承载了大量交易活动。区块链浏览器TRONSCAN数据显示,波场网络可承载的TP

  • 6 Altcoins低于1美元,可以让你致富

    介绍 与知名人士的低价代币相比,由价格更高的明星支持的加密货币的收益潜力更小。低于1美元的四种可以让你致富的替代币:以下是PawFury、Cardano(ADA)、XRP和Dogecoin(DOGE)。 PawFury:名单上的下一个:PavFury是一个优秀的模因币,它以独特的个性、活跃的论坛和宏伟的项目开发计划吸引了投资者。 成功预售 PawFury能够通过预售过程筹集到大量资金,截至目前,该

  • 7 Corpay向新西兰扩张,巩固亚太地区业务

    全球企业支付公司Corpay周二宣布,将在新西兰奥克兰开设新办事处,扩大其跨境支付业务。此举扩大了科派在亚太地区的业务。 Corpay与新西兰办事处拓展跨境支付业务 奥克兰办事处将为科佩的客户提供全套跨境支付产品,包括面向批发客户的全球支付和货币风险管理解决方案。 Corpay跨境解决方案亚太区董事总经理David Britten表示:“我们决定在新西兰建立业务,突显了我们对优先考虑当前和未来客户

  • 8 苹果分析师郭表示,新款Apple Watch将采用更大屏幕、更薄设计

    在这篇文章中,AAPL关注你最喜欢的股票REATE FREE帐号 苹果手表系列9资料来源:苹果股份有限公司。 苹果分析师郭明志周一在一篇博客文章中表示,下一代苹果手表将更薄,屏幕更大。苹果手表系列10预计将于9月发布,届时该公司通常会推出下一批可穿戴设备和新款iPhone。郭说,两款苹果手表的屏幕尺寸将从41毫米增加到44毫米,从45毫米增加到49毫米。郭补充道,Apple Watch Ult

  • 9 ZkSync(ZK)在币安上市和新代币分发计划中下跌20%

    ZkSync,以太坊零知识第二层扩展解决方案,因其新代币而备受关注。上周,该项目宣布其ZK代币空投遭到了投资者和加密货币社区的强烈反对。 在强烈反对之后,加密货币交易所币安宣布将ZK上市,并提供了一个新的分销计划来解决用户的担忧。自推出以来,ZK已经下跌了20%以上。 ZkSync的空投戏剧 6月11日,ZK Nation宣布即将推出并空投zkSync的代币。周一,69.5万个符合条件的地址可能会

  • 10 Tether宣布推出新的黄金支持的Stablecoin,其储备过度国际化

    市值最大的稳定币背后的公司正在推出一种由真金支持的新数字资产。 USDT发行人Tether宣布推出一种由过度抵押Tether Gold(XAUT)支持的新数字资产,名为aUSDT。 根据新闻稿,aUSDT是名为Alloy by Tether的新产品系列中的第一款产品。 “Alloy by Tether引入了一种新的数字资产类别,称为系留资产,旨在通过流动资产过度抵押和二级市场流动性池等稳定策略来跟