Stable Video Diffusion问世!3D合成功能引关注,网友:进步太快_每日快讯(专注热点分享网)

Stable Video Diffusion问世!3D合成功能引关注,网友:进步太快


Stable Video Diffusion问世!3D合成功能引关注,网友:进步太快

  2023-11-24 04:40:49     简体|繁體
http://news.qghjm.com/1005166.html


原文来源:量子位

图片来源:由无界 AI生成

Stable Diffusion官方终于对视频下手了——

发布生成式视频模型Stable Video Diffusion(SVD)

Stability AI官方博客显示,全新SVD支持文本到视频、图像到视频生成:

并且还支持物体从单一视角到多视角的转化,也就是3D合成

根据外部评估,官方宣称SVD甚至比runway和Pika的视频生成AI更受用户欢迎。

虽然目前只发布了基础模型,但官方透露“正计划继续扩展,建立类似于Stable Diffusion的生态系统”。

目前论文代码权重已上线。

最近视频生成领域不断出现新玩法,这次轮到Stable Diffusion下场,以至于网友们的第一反应就是“快”,进步太快!

但仅从Demo效果来说,更多网友们表示并没有感到很惊喜。

虽然我喜欢SD,而且这些Demo也很棒……但也存在一些缺陷,光影不对、而且整体不连贯(视频帧与帧之间闪烁)。

总归来说这是个开始,网友对SVD的3D合成功能还满是看好:

我敢打赌,很快就会有更好的东西出来,到时候只要描述一下,就会得到一个完整的3D场景。


SD视频官方版来袭


除了上面展示的,官方还发布了更多Demo,先来看一波:

太空漫步也安排上:

背景不动,只让两只鸟动也可以:

SVD的研究论文目前也已发布,据介绍SVD基于Stable Diffusion 2.1,用约6亿个样本的视频数据集预训练了基础模型。

可轻松适应各种下游任务,包括通过对多视图数据集进行微调从单个图像进行多视图合成。

微调后,官方公布的是两种图像到视频模型,可以以每秒3到30帧之间的自定义帧速率生成14(SVD)和25帧(SVD-XT)的视频:

之后又微调了多视角视频生成模型,叫做SVD-MV:

根据测试结果,在GSO数据集上,SVD-MV得分优于多视角生成模型Zero123、Zero123XL、SyncDreamer:

值得一提的是,Stability AI表示SVD目前仅限于研究,不适用于实际或商业应用。SVD目前也不是所有人都可以使用,但已开放用户候补名单注册。


视频生成大爆发


最近视频生成领域呈现出一种“混战”的局面。

前有PikaLabs开发的文生视频AI:

后又有号称“史上最强大的视频生成AIMoonvalley推出:

最近Gen-2的“运动笔刷”功能也正式上线,指哪画哪:

这不现在SVD又出现了,又有要卷3D视频生成的可能。

但文本到3D生成方面好像还没有太多进展,网友对这一现象也很是困惑。

有人认为数据是阻碍发展的瓶颈:

还有网友表示原因在于强化学习还不够强:

家人们对这方面的最新进展有了解吗?欢迎评论区分享~

论文链接:https://static1.squarespace.com/static/6213c340453c3f502425776e/t/655ce779b9d47d342a93c890/1700587395994/stable_video_diffusion.pdf

参考链接:
[1]https://stability.ai/news/stable-video-diffusion-open-ai-video-model
[2]https://news.ycombinator.com/item?id=38368287



编辑:web3528btc 来源:加密钱包代币

免责声明:以上文章内容信息均搜集自互联网或用户发布,并不代表本站观点或立场,本站不对其真实合法性负责。如有信息侵犯了您的权益,请联系本站将立即删除。
分享到:

  • 上一篇
    下一篇

  • 今日要闻|实事关注

    每日快讯(专注热点分享网)
    手机查看(二维码扫一扫)

    每日快讯网,最有影响力热点信息分类网站,覆盖品牌价值、汽车资讯、视频、基金、财经、房产、金融新闻、券商、公司等多类信息分享交流,免费提供最有价值的头条信息平台。
    « 2025年 » « 03月 »
    12
    3456789
    10111213141516
    17181920212223
    24252627282930
    31

    最新资讯

    [开户代运营]招商加盟精准百度(baidu)大搜资源酒水餐饮小吃零食店行业时效24h内保有效率,质量高
  • 2025-04-26 04:39:24

     

    [开户代运营]抖音砂锅,艾草护膝,足底按摩垫,决明子枕头,保温杯日出2W粉,15一个A。一手源头量
  • 2025-04-26 04:34:20

     

    [开户代运营]学历提升,全国精准资源,成本低
  • 2025-04-26 04:29:16

     

    [开户代运营]专升本学历、研究生实时数据,在线首咨,量大稳定质量好,支持测试
  • 2025-04-26 04:24:12

     

    [开户代运营]口腔牙科种植意向表单,帮助医院门店机构精准拓客引流,稳定出量中!!!
  • 2025-04-26 04:19:07

     

    [开户代运营]广点通,头条,抖音,各种中老年免领粉,有想法的聊聊
  • 2025-04-26 04:14:03

     

    [开户代运营]北京助贷量
  • 2025-04-26 04:08:59

     

    专业技术团队在线接软件开发,小程序开发
  • 2025-04-26 04:03:55

     

    日推15-30条线索 客户主动找你谈合作
  • 2025-04-26 03:58:51

     

    提供能扩大曝光量的线上渠道,有需求滴滴我
  • 2025-04-26 03:53:46

     

    提供抖音cid/巨量cid、快手B站腾讯百度小红书等CID广告开户代运营、收量,具体看详情~
  • 2025-04-26 03:48:42

     

    三方支付产品,运营商存量产品
  • 2025-04-26 03:43:38

     

    汽车成交,试驾,到店,保险
  • 2025-04-26 03:38:34

     

    拉美北美巴西等区域游戏发行,寻找自研合作厂商
  • 2025-04-26 03:33:30

     

    提供情趣**产品推广,诸如杜蕾斯、多乐士品牌,电商优先,寻找甲方联系方式和推广预算
  • 2025-04-26 03:28:26