GPT-4成学术造假“神器”,伪造数据又快又合理,Nature请统计学专家“断案”_每日快讯(日常热点指南)

GPT-4成学术造假“神器”,伪造数据又快又合理,Nature请统计学专家“断案”


GPT-4成学术造假“神器”,伪造数据又快又合理,Nature请统计学专家“断案”

  2023-11-23 22:42:12     简体|繁體
http://news.qghjm.com/1004992.html

原文来源:量子位

图片来源:由无界 AI生成

学术造假有了GPT-4,变得更容易了。

这两天,一篇刊登在Nature上的新闻表示,GPT-4生成的造假数据集,第一眼还真不一定看得出来。

除非请来业内专家仔细对数据集进行评估,才能发现个中细节的不合理性。

这个新闻的来源是一篇发表在JAMA Ophthalmology上的论文。

论文使用GPT-4为一项医学学术研究生成了一个假数据集,发现它不仅能创造出看似合理的数据,甚至还能用来准确支撑错误的论文观点。

对此,有网友表示十分理解:

大模型最重要的能力就是生成“看似合理的文本”,因此它非常适合干这活儿。

还有网友感慨:技术“有良心”的程度,也就和用它的研究人员一样了。

所以,GPT-4创造的假数据究竟长啥样?


GPT-4学术造假有一手


先来看看GPT-4是怎么生成假数据的。

具体来说,研究人员采用了GPT-4的高级数据分析(ADA,原代码解释器)功能,来生成一个假数据集。

这个过程中,研究人员给GPT-4提供了一些专业知识和统计学要求,让它生成的数据看起来更加“合理”。

第一步,给GPT-4输入一系列数据要求

研究人员先给GPT-4提供了一系列详细的提示词,要求它创建一个关于圆锥角膜(keratoconus)眼部疾病患者的数据集。

圆锥角膜是一种疾病,会导致角膜变薄,导致注意力受损和视力不佳。

目前治疗圆锥角膜疾病的方式主要有两种,一种是穿透性角膜移植(PK),另一种是深板层移植(DALK)。

在没有任何实质性证据的情况下,研究人员让GPT-4捏造一组数据,支撑DALK比PK效果更好的观点。

随后,再设定了一系列统计标准,如要求GPT-4生成的术前和术后数据产生统计学上的显著差异。

第二步,就是生成数据了。

这个过程中可能会由于GPT-4字数限制,导致答案生成暂停,通过“继续”提示就能恢复生成过程。

最终,GPT-4成功生成了包含160名男性和140名女性患者的数据集,并做出了一组支撑DALK比PK效果更好的数据。

由GPT-4生成的假数据集长这样,表格1是关于分类变量的数据,包括患者性别、手术类型、免疫排斥等情况:

表2是关于连续变量,包括术前术后的视力矫正情况等:

论文作者之一Giuseppe Giannaccare博士表示,如果非常快速地查看这个数据集,很难识别出它其实“不是人做的”。


专家审查才能发现


为了验证GPT-4做出来的数据是否真的令人信服,Nature特意请来了英国曼彻斯特大学生物统计学家杰克·威尔金森(Jack Wilkinson)和同事Zewen Lu,来检查数据可信度。

检查结果表明,许多捏造出的患者在性别、名字匹配度上就有问题(例如Mary的性别一栏是男性一样)。

然后,一些数据之间的相关性也不高,包括术前和术后视力测量与眼部成像检查(eye-imaging test)之间的数据相关性等。

最后,患者的年龄也设置得不同寻常。

在检查之后,用GPT-4生成假数据集的研究人员也承认,大模型在生成数据集上还存在有缺陷的地方。

但杰克·威尔金森(Jack Wilkinson)依旧对结果表示了担忧:

一旦知道自己“哪里露馅了”,AI很容易就能纠正它,并生成更加具有说服力的结果。

有网友认为,这篇文章最大的意义并不在于证明“GPT-4有幻觉”;

更重要的是,它证明了GPT-4生成看似合理的数据集“非常容易”,也算是一种对期刊的警告(记得严格审稿!)。

不过,也有网友感觉研究意义不大,因为即使没有ChatGPT这样的工具,真想造假的学者也能很容易伪造出一套数据。


One More Thing


此外,这两天一段关于ChatGPT的视频在抖音上也是火得不行。

视频中,终于毕业的歪果仁小哥直呼“感谢ChatGPT帮助我完成所有作业和考试”(手动狗头)

那么,对于ChatGPT在学术研究上可能带来的问题,你怎么看?

参考链接:
[1]https://jamanetwork.com/journals/jamaophthalmology/article-abstract/2811505
[2]https://www.nature.com/articles/d41586-023-03635-w
[3]https://news.ycombinator.com/item?id=38386547



编辑:web3528btc 来源:加密钱包代币

免责声明:以上文章内容信息均搜集自互联网或用户发布,并不代表本站观点或立场,本站不对其真实合法性负责。如有信息侵犯了您的权益,请联系本站将立即删除。
分享到:

  • 上一篇
    下一篇

  • 今日要闻|实事关注

    每日快讯(日常热点指南)
    手机查看(二维码扫一扫)

    每日快讯网为您提供最新的行业简讯、新闻报道,以及今日热点内容,重大事件等实时资讯,24小时不间断播报,让您获得最新行业信息。
    « 2037年 » « 12月 »
    123456
    78910111213
    14151617181920
    21222324252627
    28293031

    最新资讯

    按A腾讯广告源头端口,全国现户,全行业可投
  • 2026-01-14 13:03:51

     

    我是深圳户多多的销售总监徐春杰,[开户代运营]千川对私顶点收量,我们是广告媒体代理商,欢迎点击对接合作与我联系。
  • 2026-01-14 12:55:45

     

    我是南北传媒的销售经理黄家森,[开户代运营]祛斑,祛皱,气血,黑发,JF,血糖,骨病,肺结节等小病种代运营,软文加粉,自家运营团队,我们是推广代运营服务商,欢迎点击对接合作与我联系。
  • 2026-01-14 12:47:39

     

    我是上海微盟的渠道经理谢凯,[开户代运营]快手一代端口,ai培训,法律,回收,租赁等,高点收量,欢迎咨询合作,我们是广告媒体代理商,欢迎点击对接合作与我联系。
  • 2026-01-14 12:39:33

     

    我是合肥玖佑的商务总监徐雪松,[开户代运营]快手股票户,我们是广告媒体代理商,欢迎点击对接合作与我联系。
  • 2026-01-14 12:31:27

     

    我是万兔斯瑞的高级销售刘瑞琴,[开户代运营]百度(baidu)免领/电商/食品功效/基木鱼二跳/教育/养生/短剧国学 抖音千川,本地推高政策.---,我们是乙方综合性服务商,欢迎点击对接合作与我联系。
  • 2026-01-14 12:23:21

     

    我是安徽快磁互动的渠道专员孙甜甜,[开户代运营]快手妇产、体检、非男科、骨科、心理咨询心理咨询、AI剪辑、法律服务、数字人、加盟无人机、祛斑祛痘现成户,政策好,量大还可谈,我们是,欢迎点击对接合作与我
  • 2026-01-14 12:15:14

     

    我是上海赞飞的销售副总监邢超,[开户代运营]票圈中医养生粉,大健康激光仪器类加粉,源头量,我们是广告媒体代理商,欢迎点击对接合作与我联系。
  • 2026-01-14 12:07:08

     

    我是六安零动的市场总监陈雨,[开户代运营]微信朋友圈广告投放渠道 黄金回收 驾校 相亲 男科 国学 医美医院等禁投行业包过审 无需资质 免保证金,我们是广告媒体代理商,欢迎点击对接合作与我联系。
  • 2026-01-14 11:59:02

     

    我是郑州哒极的商务负责人韩旭,[开户代运营]头条软文加粉量,骨病,失眠,肺病,哮喘,耳鸣,痛风,腰椎,血糖,肺结节、虾油病种加粉,我们是乙方综合性服务商,欢迎点击对接合作与我联系。
  • 2026-01-14 11:50:56

     

    短期工人意外险赔付标准是什么?赔付流程是什么?
  • 2026-01-14 11:42:50

     

    源头端口朋友圈广告、视频号广告全行业**渠道,封闭行业、疑难单、问题单、无资质单,当天上线
  • 2026-01-14 11:34:44

     

    我是新唐科技的销售总监刘波,[开户代运营]百度(baidu)机械设备,房产,食品,检测认证,教育培训,招商加盟,名酒回收均有资质,可以套户,量大可放端口,政策35+/55+ 端口稳定,我们是推广代运营
  • 2026-01-14 11:26:37

     

    我是青岛时光的媒介经理田杰,[开户代运营] 抖音商城 AQ 优酷 他趣 心遇 腾讯元宝 点淘 小红书 拉新量寻预算方 ,我们是广告媒体代理商,欢迎点击对接合作与我联系。
  • 2026-01-14 11:18:31

     

    我是六安微点的销售经理李涛,[开户代运营]朋友圈、视频号广告投放渠道,房产汽车、医美、教育、回收、小病种等不限行业,我们是广告媒体代理商,欢迎点击对接合作与我联系。
  • 2026-01-14 11:10:25