只有27亿参数,性能却高25倍!微软发布Phi-2_每日快讯(日常热点指南)

只有27亿参数,性能却高25倍!微软发布Phi-2


只有27亿参数,性能却高25倍!微软发布Phi-2

  2023-12-17 20:25:25     简体|繁體
http://news.qghjm.com/1019953.html

原文来源:AIGC开放社区

图片来源:由无界 AI生成

12月13日,微软在官方网站正式发布了,27亿参数的大语言模型—Phi-2。

Phi-2是基于微软的Phi-1.5开发而成,可自动生成文本/代码、总结文本、数学推理等功能。

虽然Phi-2的参数很小,性能却优于130亿参数的Llama-2和70亿参数的Mistral,以及谷歌最新发布的Gemini Nano 2。

值得一提的是,Phi-2没有进行过RLHF(人类反馈强化学习)和指令微调只是一个基础模型,但在多个任务评测中,其性能可以媲美或超过25倍参数的模型。

目前,微软已经开源了Phi-1.5和Phi-1,帮助开发者们深度研究和应用小参数模型。

Phi-1.5开源地址:https://huggingface.co/microsoft/phi-1_5‌

Phi-1开源地址:https://huggingface.co/microsoft/phi-1‌

Phi-1.5论文地址:https://arxiv.org/abs/2309.05463‌

目前,大模型界有一个很怪的现象,就是出的模型参数越来越大,几百亿参数只能算刚入门,上千亿的比比皆是,有的模型甚至已经达到上万亿。

参数高的模型并非不好,而是要看应用场景。对于像微软、OpenAI、百度、科大讯飞这样的基础模型服务商来说,参数越高覆盖能力就越广,例如,ChatGPT已经进化到多模态,除了生成文本,还能生成图片听懂声音等。

Phi-2评测数据

但参数高的模型同样也有很多缺点:过拟合,如果训练数据较差会出现能力不升反降的现象;算力成本巨大,用户每一次的提问都像是在“燃烧金钱”;预训练时间长,每一次模型的迭代需要耗费大量训练时间。

调优困难,高参数的模型拥有庞大且难控制的神经元,想进行部分功能调优和控制非常困难,最近变懒的GPT-4便是最好的案例。

所以,微软开发Phi系列模型的主要目的是研究,小参数模型如何在保证功能的前提下,也能与大参数的模型相媲美甚至超越,这对于企业和应用者来说是一个双赢的局面。

Phi-2简单介绍

Phi-2和Phi-1.5一样采用了24层的Transformer架构,每个头的维度为64,并使用了旋转嵌入等技术来提升模型性能。

Phi-2只是一个基础模型,没有进行过人类反馈强化学习和指令微调。但在文本生成、数学推理、代码编程方面丝毫不比大参数的模型差,甚至比他们更好。

训练数据和流程方面,Phi-2使用了1.4T超高质量的“教科书级”数据进行了预训练,并非是网络爬取的杂乱、黑箱数据。微软表示,这也是小参数模型比大参数模型性能高的关键原因之一。

Phi-2 在 96 个 A100 GPU上一共训练了14天。

Phi-2实验数据

微软在MMLU、BBH、PIQA、WinoGrande、ARC easy、Challenge、SIQA和GSM8k等主流测试平台对Phi-2进行了测试。

数据显示,在各种聚合基准上的测试超过了,Mistral -7B和Llama-2-13B。

值得一提的是,在多步推理测试任务中,例如,编码和数学,Phi-2的性能超过了700亿参数的Llama-2。



编辑:web3528btc 来源:加密钱包代币

免责声明:以上文章内容信息均搜集自互联网或用户发布,并不代表本站观点或立场,本站不对其真实合法性负责。如有信息侵犯了您的权益,请联系本站将立即删除。
分享到:

  • 上一篇
    下一篇

  • 今日要闻|实事关注

    每日快讯(日常热点指南)
    手机查看(二维码扫一扫)

    每日快讯网为您提供最新的行业简讯、新闻报道,以及今日热点内容,重大事件等实时资讯,24小时不间断播报,让您获得最新行业信息。
    « 2026年 » « 01月 »
    1234
    567891011
    12131415161718
    19202122232425
    262728293031

    最新资讯

    我是杭州激石的商务专员胡思思,[开户代运营]全国各地 广点通、抖音 学历提升(专本、研究生)首咨,量大质优!欢迎甲方机构沟通合作,我们是,欢迎点击对接合作与我联系。
  • 2026-01-15 20:15:36

     

    我是奕宸网络的销售经理张秀杰,[开户代运营]本地推医美套户 双眼皮,玻尿酸,超声炮,热玛吉,童颜针,少女针,黄金微针,热拉提等,我们是广告媒体代理商,欢迎点击对接合作与我联系。
  • 2026-01-15 20:07:30

     

    我是有信科技的市场总监卢文羽,[开户代运营]腾讯朋友圈广告,视频号,禁投限制行业接单,无资质单,特殊行业,源头端口,套户现户资质全包!,我们是广告媒体代理商,欢迎点击对接合作与我联系。
  • 2026-01-15 19:59:24

     

    我是晟景时代的商务总监莫云山,[开户代运营]社群养生出粉:貂绒大衣 买菜小推车 养生壶 驼绒被 驼绒马甲 绞肉机 暖菜板 艾灸枕鞋毯 价格美丽 有量可切[勾引],我们是推广代运营服务商,欢迎点击对
  • 2026-01-15 19:51:17

     

    我是陕西启维的营销总监惠建军,[开户代运营]闲鱼广告服务,一代高点收量,适配个人/商家不同需求,我们是广告媒体代理商,欢迎点击对接合作与我联系。
  • 2026-01-15 19:43:11

     

    我是广州博芯的商务经理刘焕鹏,[开户代运营]千川一代端口开户收量品牌对公2.5白牌对公1.5对私3,我们是广告媒体代理商,欢迎点击对接合作与我联系。
  • 2026-01-15 19:35:08

     

    我是奕维网络的销售总监陈小凡,[开户代运营]抖音本地推生美 ​本地推妇产 ​本地推口腔 ​本地推体检有户 痛风 胃肠 甲状腺 耳鼻,可自运营可代运营,我们是乙方综合性服务商,欢迎点击对接合作与我联系
  • 2026-01-15 19:26:59

     

    恭喜俄罗斯与乌克兰,打了近4年,终于打成了全世界都喜欢的样子
  • 2026-01-15 19:18:53

     

    前脚刚吹嘘空中战果,后脚F16V坠海,到底是技术不行还是另有隐情?
  • 2026-01-15 19:10:47

     

    高市安排秘密惊喜,李在明高兴坏了,但中方说的话,一点也没敢忘
  • 2026-01-15 19:02:40

     

    天宇迎来本年度最小残月
  • 2026-01-15 18:54:34

     

    市民群众点赞厦门出入境“夜办专场”很体贴
  • 2026-01-15 18:46:28

     

    为什么日本女人也热衷切腹,脱去上半身衣服,匕首刺向自己的腹部
  • 2026-01-15 18:38:22

     

    父母有高血压/结节/糖尿病?2026带病投保医疗险清单,免健康告知
  • 2026-01-15 18:30:16

     

    海泰新能违规信披,相关责任人近期将接受监管谈话
  • 2026-01-15 18:22:10