“大模型”激战正酣,“小模型”在开辟新战场_每日快讯(日常热点指南)

“大模型”激战正酣,“小模型”在开辟新战场


“大模型”激战正酣,“小模型”在开辟新战场

  2023-12-17 03:57:47     简体|繁體
http://news.qghjm.com/1019582.html

原文来源:硬 AI 

作者 | 赵 颖 

图片来源:由无界 AI生成

AI模型军备竞赛风起云涌,各家大模型打得火热的同时,小模型竞争开辟出新战场。

本周多家公司在“小模型”方面开疆拓土,试图证明其模型可以事半功倍。周一,法国初创公司MistralAI公布的开源模型Mixtral 8x7B引起轰动,该模型不仅性能比肩GPT-3.5,另一大优势是规模小到足以在一台电脑上运行。

周二,微软亮出了小模型大招,发布27亿参数规模的小语言模型Phi-2,在部分基准测试中超过谷歌的Gemini Nano 2,可以在笔记本电脑、手机等移动设备上运行。

毫无疑问,规模较小的模型可以降低了大规模运行人工智能应用的成本,同时极大地拓宽了生成式AI技术的应用范围。

此外,事关模型能力强大与否的关键——强化学习(RL)技术最新的优化进展也引起业界的关注。


01“小模型开辟新战场”


MistralAI的小模型Mixtral 8x7B为开源模型,其规模参数相对较小,而能力却能达到GPT-3.5的水平,迅速引起了业内研究人员的关注。

Mixtral 8x7B 之所以叫 Mixtral 8x7B,是因为它属于稀疏模型,将各种为处理特定任务而训练的较小模型组合在一起,从而提高了运行效率。

性能方面,Mixtral表现优于Llama 2 70B,推理速度提高了整整6倍;在大多数标准基准测试上与GPT-3.5打平,甚至略胜一筹。

成本方面,由于Mixtral的参数较小,所以其成本也更低。与Llama 2相比,Mixtral 8x7B表现出自己高能效的优势。

值得一提的是,MistralAI刚刚完成4.15亿美元融资,最新估值已经冲破20亿美元,在短短6个月中增长了7倍多。

本周另一家登场的小模型是微软自制模型Phi-2,Phi-2 的参数只有27亿,小到足以在手机上运行。该模型在精心挑选的数据集上进行了训练,数据集的质量足够高,即使手机的计算能力有限,也能确保模型生成准确的结果。

从性能表现看,Phi-2在Big Bench Hard(BBH)、常识推理、语言理解、数学和编码基准测试中,其平均性能得分已经超过70亿、130亿参数规模的Mistral和Llama 2,在部分基准测试中超过谷歌的Gemini Nano 2。

目前微软正发力小模型的布局,分析指出,微软与OpenAI的紧密合作,使得GPT模型的表现在大模型市场一骑绝尘,再加上微软参数规模更小的Phi系列,能进一步抢占开源模型长尾市场。


02 模型能力强大的关键:强化学习技术


AI领域的另一大进展则是强化学习技术的优化,强化学习是一种基于“奖励期望行为”和“惩罚不期望行为”的机器学习训练方法。

许多人猜测,OpenAI的模型之所以表现如此出色,主要是因为它使用了人类来告诉模型哪些结果是好的,哪些结果是坏的,也就是所谓的“人类反馈强化学习”(RLHF)。

根据强化学习初创公司Adaptive的联合创始人Julien Launay介绍,AI缺少如何将这些知识整合在一起的规则。

例如,一个看似简单的问题“我的iPhone掉了会怎样?”需要模型理解iPhone是什么?物体掉落时会发生什么?iPhone很贵,掉了我会很伤心以及所有这些想法之间的关系。强化学习在某种程度上为模型提供了自己的知识图谱,告诉模型某些信息是如何关联的。

不过,强化学习远非完美,执行起来成本也很昂贵,业内期待更便宜、更有效的训练方案。这一点很重要,因为它意味着小型开发者可能很快就能利用,以前只有大型模型提供商才能使用的训练技术来改进他们的模型。

近期,一家利用私人数据开发定制模型的初创公司Contextual AI开发了一种方法,只需要人类发出信号,也许是在聊天机器人上点击,就能知道模型的反应是可取的还是不可取的。

这种方法改进了传统的、更加主观的做法,即要求人类从多个可能的回应中选出他们认为最佳的模型回应。Contextual 将这种新方法命名为“Kahneman-Tversky Optimization”,以纪念这两位著名的经济学家。

Contextual AI研究员Kawin Ethayarajh指出,研究人员还利用像OpenAI的GPT-4 这样更大、更复杂的模型,对更小、能力更弱的模型进行训练。

就目前而言,强化学习仍然是一个复杂而困难的过程,但像这样的新发现有望让处于劣势的开发者在与OpenAI的竞争中占得先机。



编辑:web3528btc 来源:加密钱包代币

免责声明:以上文章内容信息均搜集自互联网或用户发布,并不代表本站观点或立场,本站不对其真实合法性负责。如有信息侵犯了您的权益,请联系本站将立即删除。
分享到:

  • 上一篇
    下一篇

  • 今日要闻|实事关注

    每日快讯(日常热点指南)
    手机查看(二维码扫一扫)

    每日快讯网为您提供最新的行业简讯、新闻报道,以及今日热点内容,重大事件等实时资讯,24小时不间断播报,让您获得最新行业信息。
    « 2025年 » « 12月 »
    1234567
    891011121314
    15161718192021
    22232425262728
    293031

    最新资讯

    我是云狄网络的广告销售余思雨,[开户代运营]千川白牌对私4 品牌4.5 团购公14私16 线索公10私12不用配合直签AD 部分行业收对私,我们是广告媒体代理商,欢迎点击对接合作与我联系。
  • 2026-01-15 20:23:42

     

    我是杭州激石的商务专员胡思思,[开户代运营]全国各地 广点通、抖音 学历提升(专本、研究生)首咨,量大质优!欢迎甲方机构沟通合作,我们是,欢迎点击对接合作与我联系。
  • 2026-01-15 20:15:36

     

    我是奕宸网络的销售经理张秀杰,[开户代运营]本地推医美套户 双眼皮,玻尿酸,超声炮,热玛吉,童颜针,少女针,黄金微针,热拉提等,我们是广告媒体代理商,欢迎点击对接合作与我联系。
  • 2026-01-15 20:07:30

     

    我是有信科技的市场总监卢文羽,[开户代运营]腾讯朋友圈广告,视频号,禁投限制行业接单,无资质单,特殊行业,源头端口,套户现户资质全包!,我们是广告媒体代理商,欢迎点击对接合作与我联系。
  • 2026-01-15 19:59:24

     

    我是晟景时代的商务总监莫云山,[开户代运营]社群养生出粉:貂绒大衣 买菜小推车 养生壶 驼绒被 驼绒马甲 绞肉机 暖菜板 艾灸枕鞋毯 价格美丽 有量可切[勾引],我们是推广代运营服务商,欢迎点击对
  • 2026-01-15 19:51:17

     

    我是陕西启维的营销总监惠建军,[开户代运营]闲鱼广告服务,一代高点收量,适配个人/商家不同需求,我们是广告媒体代理商,欢迎点击对接合作与我联系。
  • 2026-01-15 19:43:11

     

    我是广州博芯的商务经理刘焕鹏,[开户代运营]千川一代端口开户收量品牌对公2.5白牌对公1.5对私3,我们是广告媒体代理商,欢迎点击对接合作与我联系。
  • 2026-01-15 19:35:08

     

    我是奕维网络的销售总监陈小凡,[开户代运营]抖音本地推生美 ​本地推妇产 ​本地推口腔 ​本地推体检有户 痛风 胃肠 甲状腺 耳鼻,可自运营可代运营,我们是乙方综合性服务商,欢迎点击对接合作与我联系
  • 2026-01-15 19:26:59

     

    恭喜俄罗斯与乌克兰,打了近4年,终于打成了全世界都喜欢的样子
  • 2026-01-15 19:18:53

     

    前脚刚吹嘘空中战果,后脚F16V坠海,到底是技术不行还是另有隐情?
  • 2026-01-15 19:10:47

     

    高市安排秘密惊喜,李在明高兴坏了,但中方说的话,一点也没敢忘
  • 2026-01-15 19:02:40

     

    天宇迎来本年度最小残月
  • 2026-01-15 18:54:34

     

    市民群众点赞厦门出入境“夜办专场”很体贴
  • 2026-01-15 18:46:28

     

    为什么日本女人也热衷切腹,脱去上半身衣服,匕首刺向自己的腹部
  • 2026-01-15 18:38:22

     

    父母有高血压/结节/糖尿病?2026带病投保医疗险清单,免健康告知
  • 2026-01-15 18:30:16