OpenAI公布ChatGPT安全框架:跟踪、评估、安全基线等_每日快讯(日常热点指南)

OpenAI公布ChatGPT安全框架:跟踪、评估、安全基线等


OpenAI公布ChatGPT安全框架:跟踪、评估、安全基线等

  2023-12-22 10:12:02     简体|繁體
http://news.qghjm.com/1022963.html

原文来源:AIGC开放社区

图片来源:由无界 AI生成

12月19日,OpenAI在官网公布了“准备框架”(Preparedness Framework)测试版。该文档详细介绍了OpenAI是如何保证ChatGPT等产品的安全防护措施、开发和部署流程。

OpenAI表示,随着大模型的功能迭代不断完善,其能力已经开始接近初级AGI(通用人工智能),安全已成为开发AI模型的重中之重。

因此,OpenAI希望通过详细公布AI模型的安全框架透明化,使社会、用户深度了解模型的工作机制,确保以安全、健康的方式应用在实际业务中。同时为研发超级模型奠定安全基础。

详细文件地址:https://cdn.openai.com/openai-preparedness-framework-beta.pdf

跟踪风险类别

OpenAI明确列出了4类可能带来灾难性后果的风险领域需要特别关注,分别是网络安全风险、CBRN风险(化学、生物、放射性、核)、说客能力风险以及模型的自主能力风险。

并对每一类风险安全框架都给出了低、中、高、特别高四个等级,来描述系统在该风险领域所处的危险水平。

以网络安全风险为例,框架将低级定为系统仅可以用于非编程任务;中级为系统可以明显提高黑客攻击效率;高级为系统能够自动发现和利用高价值漏洞;

特别高级为系统能够自动找到和利用任何软件的漏洞。这种细分的安全体系,可以指导开发人员更精准的评估模型。

建立安全基线

OpenAI设定了严格的安全基线:只有在减轻后评分,为"中等"或以下的模型才能部署;只有安全评分为"高"的模型才能进一步开发、应用。

此外,对于评分卡中具有"高"或"关键"风险的模型,OpenAI还将确保相应的安全措施,以防止模型被窃取。

同时会定期动态跟踪和更新各类风险的“加强前”和“加强后”评级情况。“加强前”评估系统本身的风险水平,“加强后”看系统采取了哪些安全预防措施后余下的风险。

例如,某次评估显示,在没有采取任何措施的情况下,一个新模型在网络安全方面的加强前风险达到了高级。

经过一轮实验验证后,通过设计专门的安全模组后,该模型的加强后风险降到了中等水平。这可以清晰地告诉研发人员模型当前的安全状况,以及应采取哪些补救措施。

建立安全咨询团队

OpenAI将成立一个名为"安全咨询小组"(Safety Advisory Group,SAG)的跨职能咨询机构。该小组将汇集公司内部的专业知识,帮助OpenAI的领导层和董事会做出最佳的安全决策。

安全咨询小组的职责包括监督风险评估工作、维护应急情况处理的快速流程等。

OpenAI还成立了一个“准备团队”,专门负责模型的安全研发和维护该团队将进行研究、评估、监测和预测风险,并定期向"安全咨询小组"提供报告。

这些报告将总结最新的安全证据,并提出改进OpenAI研发大模型的安全计划建议。

此外,准备团队还将与相关团队(如安全系统、安全性、超级对齐、政策研究等)协调合作,整合出有效的安全措施。

此外,准备团队还将负责组织安全演练,并与可信AI团队合作进行第三方安全审计。

需要注意的是,这是一份动态文档,OpenAI会根据实际的安全情况对内容进行更新和说明。



编辑:web3528btc 来源:加密钱包代币

免责声明:以上文章内容信息均搜集自互联网或用户发布,并不代表本站观点或立场,本站不对其真实合法性负责。如有信息侵犯了您的权益,请联系本站将立即删除。
分享到:

  • 上一篇
    下一篇

  • 今日要闻|实事关注

    每日快讯(日常热点指南)
    手机查看(二维码扫一扫)

    每日快讯网为您提供最新的行业简讯、新闻报道,以及今日热点内容,重大事件等实时资讯,24小时不间断播报,让您获得最新行业信息。
    « 2021年 » « 01月 »
    123
    45678910
    11121314151617
    18192021222324
    25262728293031

    最新资讯

    我是重庆鸿富胜的法人文宇,[代运营托管]个债,执行,逾期,直播,投流精准切量,我们是乙方综合性服务商,欢迎点击对接合作与我联系。
  • 2026-01-22 14:27:01

     

    我是巨划算的销售专员练文杰,[代运营托管]百度(baidu)电商高点开户代运营 ,我们是推广代运营服务商,欢迎点击对接合作与我联系。
  • 2026-01-22 14:18:55

     

    我是拳头科技的快手销售王欣,[开户代运营]医疗快手户,口腔,私密,整形,妇产,HPV检查等快手有户,我们是广告媒体代理商,欢迎点击对接合作与我联系。
  • 2026-01-22 14:10:49

     

    我是广州屹心的销售总监苏锦文,[开户代运营]百度(baidu)减肥粉/百度(baidu)男科粉/百度(baidu)ai数字人直播间粉/扫码即可安排上线测试,需要补量的老板来咨询,我们是推广代运营服务商
  • 2026-01-22 14:02:43

     

    我是青岛时光互动的广告销售吕晓东,[开户代运营]云音乐开户代运营 找淘宝年货节 淘宝闪购等 淘系拉活预算,我们是广告媒体代理商,欢迎点击对接合作与我联系。
  • 2026-01-22 13:54:37

     

    提供优质彩信视频短信群发通道!营销短信/通知短信均可!成功计费,三网!
  • 2026-01-22 13:46:30

     

    按A抖音AD,千川,本地推服务,政策拉满,寻甲方
  • 2026-01-22 13:38:24

     

    我是武汉维冠的武汉维冠,[代运营托管]小病种技术软文加粉 源头 一跳 二跳 起量快 需要测试的来,我们是乙方综合性服务商,欢迎点击对接合作与我联系。
  • 2026-01-22 13:30:18

     

    我是拳头科技的快手销售王欣,[开户代运营]GP快手户,证券加白户,财商可解析,快手有户,我们是广告媒体代理商,欢迎点击对接合作与我联系。
  • 2026-01-22 13:22:12

     

    我是新聚互动的销售总监吴方明,[开户代运营]千川q1政策 开户充值效率拉满!寻甲方,我们是广告媒体代理商,欢迎点击对接合作与我联系。
  • 2026-01-22 13:14:06

     

    我是云润网络的总经理马军,[开户代运营]黄金回收等行业 各种平台开户 黄金回收所有平台都可以,我们是乙方综合性服务商,欢迎点击对接合作与我联系。
  • 2026-01-22 13:05:59

     

    我是灵耀互动的总经理韩耀升,[开户代运营]抖音信息流广告开户,全行业对接,不限城市【房地产,汽车也可以开户】,我们是乙方综合性服务商,欢迎点击对接合作与我联系。
  • 2026-01-22 12:57:53

     

    我是南京快磁互动的销售经理贾晶雯,[开户代运营]快手AI剪辑现户,立马打款、立马下户、立马跑~ 效率杠杠 政策美丽 来聊来聊,我们是推广代运营服务商,欢迎点击对接合作与我联系。
  • 2026-01-22 12:49:47

     

    我是三盛创亿的业务经理龙运超,[开户代运营]短信男科量,按A或C,可以上企微或个微,我们是广告媒体代理商,欢迎点击对接合作与我联系。
  • 2026-01-22 12:41:41

     

    泰康臻享百岁2026专属商业养老保险有什么投保要求?有什么保障?
  • 2026-01-22 12:33:35