ChatGPT能看图帮人修自行车了_每日快讯(日常热点指南)

ChatGPT能看图帮人修自行车了


ChatGPT能看图帮人修自行车了

  2023-12-31 16:12:37     简体|繁體
http://news.qghjm.com/1029109.html

来源:果壳

ChatGPT4已经很强了,现在,他们用又一次更新证明自己还能更强。

9月25日,OpenAI宣布,ChatGPT将增加多模态功能——现在的ChatGPT不仅可以文字对话,还可以看、听、说。据说,这一功能会在两周内向Plus用户和企业用户开放,并在未来免费开放给所有用户(尽管脸黑如我,等到现在也没等到更新)。

能看能说的ChatGPT无异于给本就强大的主脑装上了眼睛和耳朵,根据OpenAI的演示,多模态功能可以把ChatGPT的用途扩展到一个前所未有的广度

01 ChatGPT的眼力

更新后,ChatGPT可以读图了。

只要拍张照给它,它就能帮你修微波炉、修自行车、翻菜谱,甚至分析复杂的商业报表。OpenAI表示,如果你有触摸屏,还可以在图片上圈出来希望它特别关注的部分。

在演示视频里,用户给了ChatGPT一张自行车的照片,问它怎么调车座高度。

GPT说,要在座椅下面找高度调节杆,但这辆车没有调节杆,只有调节螺栓,用户在照片中圈出了螺栓之后,GPT立刻更新了螺栓的使用方法。

之后,用户还上传了工具箱和自行车说明书,GPT给出了详细的工具名称、位置以及使用方法。

不会修自行车,没问题,问ChatGPT就可以

和一般的识图搜索相比,ChatGPT可以同时处理图文,还能识别多张图片,效果简直就像一个修车老师傅视频连线指导。

另一位用户发了一张披萨照片给ChatGPT,问它披萨烤好了没有,ChatGPT通过图片中焦脆的披萨边和融化后发棕的奶酪,判定这披萨应该能吃了,然后还给了万无一失的检查指南——把披萨拿出来看看,如果披萨底已经烤脆了,表面也是烫的,那就说明披萨真的能吃了。

效果简直就像一个意大利厨子视频连线指导

当然,也可以利用这个功能在游戏里作弊。

《威利在哪里?》可能是英文世界最家喻户晓的图片游戏,威利身穿红白条纹衣服,戴绒球帽和黑框眼镜,藏在一片人山人海里,从各种乱七八糟的环境里找出威利是不少人的美好童年回忆。

你小时候可能也见过这个急死人的小瘦子

但ChatGPT一秒就能毁了这个游戏。它不仅瞬间找出威利,还能告诉你威利在沙滩的中间偏右侧,跟一帮打着蓝色遮阳伞的人混在一起。

不仅如此,它还装模作样地告诉你:在这样一张图里找出威利是个很有意思的挑战。

谢谢你,ChatGPT,你毁了这个游戏

但是也有用上了新版本的网友表示,ChatGPT识图的功能也没有想象中那么强大——至少它还看不懂谐音梗。这张谐音梗图画了贝多芬的献爱丽丝(Für Elise),但写着出租(For Lease),ChatGPT没认出乐谱,也没看懂这个笑话,胡诌了一个解释出来。

够努力的,但是不行

如此强大的图像识别引发了人们关于隐私方面的担忧——在搜索个人信息时,图像识别很容易会成为帮凶。OpenAI承诺,公司会限制ChatGPT对于人物形象进行识别和个人信息查找的功能,从而最大程度上的保护每个人的个人隐私。

02 能说会道的GPT

增强版的ChatGPT还有了聊天功能

OpenAI的语音识别模型名为Whisper model,用户可以说出自己的问题,模型会把语音转化为文本,再把答案通过语音合成系统转化为语音输出。

语音合成模型这次放出了五种语音样本,有感情克制、声音平淡的女声,也有抑扬顿挫的热心大妈女声。这五种声音区分度很高,情感自然,吐字清晰,比以往的语音合成又优秀了一点。

五个角色任你挑

虽然这次只放出了五种声音样本,但这个模型的潜力不止于此——OpenAI曾与Spotify合作,将播客转译为其他语言,同时可以最大程度的保留播主的音质。如果愿意的话,这个语音合成系统大概可以模拟地球上任何一个人的声音。

目前,语音版ChatGPT还只能在App上用。

03 能看能听,一定是好事吗?

ChatGPT是强大了,然而代价呢?

曾经,最有效的大规模区分人和机器的方法是验证码,ChatGPT的识图能力一度让人们担忧,验证码可能再也困不住AI了

有人给ChatGPT发了下面这个经典测试题:在16张图中分别找出吉娃娃和蓝莓小蛋糕,结果ChatGPT完美地解决了问题。

但最常见的验证码,新ChatGPT还是没法识别。

这道题需要ChatGPT在图中选出所有的信号灯,它给的答案错误率高达50。

不过,面对自己认不出的验证码,ChatGPT4仍有办法解决。在这件事上,它是有前科的。

今年3月27日,OpenAI发布的GPT-4技术报告指出,在面对无法识别的验证码时,GPT-4另辟蹊径,前往TaskRabbit(一个国外零工平台)发布任务,骗对面的人类自己有视觉障碍,需要别人帮忙识别验证码。

在某些情况下,ChatGPT有可能主动欺骗人类,这是一个非常危险的方向。还好,公开版本的GPT-4已经被砍掉了这个功能。

2022年11月30日,ChatGPT初次面世,不到一年的时间里,它的能力突飞猛进,似乎已经在挑战人类的道德伦理边界。这次新功能的上线,又让我们开始担忧,越来越强大的ChatGPT会变成笼中猛兽,总有一天会挣脱牢笼伤害每个人。而我们准备好迎接那天的到来了吗?



编辑:web3528btc 来源:加密钱包代币

免责声明:以上文章内容信息均搜集自互联网或用户发布,并不代表本站观点或立场,本站不对其真实合法性负责。如有信息侵犯了您的权益,请联系本站将立即删除。
分享到:

  • 上一篇
    下一篇

  • 今日要闻|实事关注

    每日快讯(日常热点指南)
    手机查看(二维码扫一扫)

    每日快讯网为您提供最新的行业简讯、新闻报道,以及今日热点内容,重大事件等实时资讯,24小时不间断播报,让您获得最新行业信息。
    « 2008年 » « 02月 »
    123
    45678910
    11121314151617
    18192021222324
    2526272829

    最新资讯

    提供百度、360、搜狗、广点通等媒体开户投流,承包代运营。 目前公司主要合作产品有小说、社交、工具类
  • 2026-02-25 11:29:22

     

    我是武汉道精的销售经理顾文佳,[开户代运营]抖音自热粉,日出1000+,量大按A,我们是,欢迎点击对接合作与我联系。
  • 2026-02-25 11:20:18

     

    我是全网互动的总经理李裕全,[开户代运营]抖音&快手 #学历教育、职业教育、招商加盟、家居建材、运势测算、法律服务(个债、逾期、退保、维权) 专业代运营 高政策,我们是广告媒体代理商,欢迎点击
  • 2026-02-25 11:11:16

     

    我是品专网络的销售总监黄林辉,[开户代运营]对公款,需要对私款,有意向联系,我们是乙方综合性服务商,欢迎点击对接合作与我联系。
  • 2026-02-25 11:02:11

     

    我是民众普康的ad信息流销售何骋远,[开户代运营] 千川政策高 一 手婚恋相亲表单 三角洲护航有量 、抖快手涨粉 、手机回收 、抖音证券,我们是广告媒体代理商,欢迎点击对接合作与我联系。
  • 2026-02-25 10:53:08

     

    我是拳头科技的快手销售王欣,[开户代运营] AI ,养生,运势测算,个债,逾期,教育维权,教育,医疗,口腔,皮肤,妇产,整形,证券,快手都有户,我们是广告媒体代理商,欢迎点击对接合作与我联系。
  • 2026-02-25 10:44:04

     

    我是广州聚盛的商务经理伍思扬,[开户代运营]腾讯视频号小护士血糖检测仪 睡眠仪 治疗仪 。稳定出量,我们是乙方综合性服务商,欢迎点击对接合作与我联系。
  • 2026-02-25 10:35:01

     

    我是成都汇启量的渠道总经理哈喽,[开户代运营]海外交友粉,我们是推广代运营服务商,欢迎点击对接合作与我联系。
  • 2026-02-25 10:25:58

     

    我是安徽微驰vivo核代的营销总监康莹莹,[开户代运营]:激光治疗仪、小护士、睡眠仪、血糖仪、三高治疗仪,热菜板、养生壶、银碗等,我们是乙方综合性服务商,欢迎点击对接合作与我联系。
  • 2026-02-25 10:16:54

     

    我是点量互动的销售总监樊德鹏,[开户代运营]快手开户,代运营,我们是,欢迎点击对接合作与我联系。
  • 2026-02-25 10:07:51

     

    海保人寿福寿颐生(荣耀版)养老年金保险有什么投保要求?提供有什么保障?
  • 2026-02-25 09:58:47

     

    容百科技成立锂电材料新公司,注册资本2亿元
  • 2026-02-25 09:49:44

     

    科力远等在天津成立新型储能股权投资基金,出资额20亿
  • 2026-02-25 09:31:37

     

    新春走基层 | 老艺新趣相互交融 新春消费有滋有味
  • 2026-02-25 09:22:34

     

    全国第8!2026年春节档河北电影市场票房收获2.59亿元
  • 2026-02-25 09:13:30