魔改 Stable Diffusion,开源创新“单目深度估计”模型_每日快讯(日常热点指南)

魔改 Stable Diffusion,开源创新“单目深度估计”模型


魔改 Stable Diffusion,开源创新“单目深度估计”模型

  2024-01-03 23:12:01     简体|繁體
http://news.qghjm.com/1031114.html

文章来源:AIGC开放社区

图片来源:由无界 AI生成

单目深度估计一直是计算机视觉领域的难点。仅凭一张 RGB 图像,想要还原出场景的三维结构,在几何结构上非常不确定,必须依赖复杂的场景理解能力。

即便使用更强大的深度学习模型来实现,也面临算力需求高、图像数据注释量大、泛化能力弱等缺点。

为了解决这些难题,苏黎世联邦理工学院的研究人员开发了Marigold模型。Marigold不需要从零开始训练,而是在Stable Diffusion(著名开源文生图模型)的基础上进行微调,只需要使用合成数据微调了中间的去噪网络,其他模块例如,编码/解码结构均保持原样,极大降低了训练成本。

实验数据显示,尽管Marigold从未直接学习过真实的深度信息,但在真实场景的测试中,其性能却超越了其他专门训练过的模型,并且迁移、兼容性非常强。

开源地址:https://github.com/prs-eth/Marigold

论文地址:https://arxiv.org/abs/2312.02145

Marigold的核心技术思路是,利用Stable Diffusion模型所捕获的丰富先验知识,来提升深度估计的泛化能力和性能。

简单来说,就是把Stable Diffusion当成一个图片查询数据库,只修改其去噪模块,就变成了可实现单目深度估计的全新模型

Marigold的关键点在于保持预训练扩散模型的潜在空间,只对去噪U-Net进行修改和微调。

这种方法非常高效,无需实际深度图像的训练数据,就能在多个真实数据集上取得出色的性能表现。

Marigold提供了一个简单而资源高效的微调协议,将预训练的扩散生成模型转化为图像条件的深度估计器,成为了一种功能强大的单目深度估计模块。

Marigold通过使用合成的RGB-D数据以及在一块消费级显卡上只训练了几天,将Stable Diffusion转化为Marigold模型。主要流程如下:


去噪U-Net


研究人员主要通过修改和微调Stable Diffusion模型的去噪U-Net模块,来实现深度估计。去噪U-Net是一个编码器-解码器结构的神经网络,用于从输入图像中学习去除噪声的表示。

在Marigold模型中,研究人员保持了扩散模型的潜空间不变,只对去噪U-Net模块进行微调,以适应深度估计任务。


合成数据训练


为了微调Marigold模型,研究人员使用了合成的RGB-D训练数据,对模型进行训练。合成数据是通过在虚拟环境中,渲染图像并生成对应的深度图来创建的。

通过使用合成数据进行训练,Marigold可以学习到广泛的场景和物体形状,从而提高其在未见过数据集上的泛化能力。


仿射不变深度估计


Marigold使用了一种仿射不变的深度估计方法,能够估计图像中每个像素的深度值,而不受全局偏移和尺度的影响。

这种仿射不变性对于在不同场景和尺度下进行深度估计非常重要。通过估计仿射不变的深度,Marigold可以消除由于相机内参的不确定性,而引入的深度估计误差。



编辑:web3528btc 来源:加密钱包代币

免责声明:以上文章内容信息均搜集自互联网或用户发布,并不代表本站观点或立场,本站不对其真实合法性负责。如有信息侵犯了您的权益,请联系本站将立即删除。
分享到:

  • 上一篇
    下一篇

  • 今日要闻|实事关注

    每日快讯(日常热点指南)
    手机查看(二维码扫一扫)

    每日快讯网为您提供最新的行业简讯、新闻报道,以及今日热点内容,重大事件等实时资讯,24小时不间断播报,让您获得最新行业信息。
    « 2025年 » « 12月 »
    1234567
    891011121314
    15161718192021
    22232425262728
    293031

    最新资讯

    我是的屹心科技,[开户代运营]百度(baidu)直播AI量寻稳定绿色甲方,可定制专属直播间话术,我们是推广代运营服务商,欢迎点击对接合作与我联系。
  • 2025-12-31 01:05:33

     

    我是巨巢(河北)科技的销售经理孟晨晨,[开户代运营]快手、腾讯、百度(baidu)企业贷,有限公司占比优,有需要的来,我们是乙方综合性服务商,欢迎点击对接合作与我联系。
  • 2025-12-31 00:57:27

     

    我是云汇算的运营专员周洋,[开户代运营]快手 vivo 360(so) 贷款下载户,我们是广告媒体代理商,欢迎点击对接合作与我联系。
  • 2025-12-31 00:49:21

     

    我是凯乐鑫汇的商务专员未帅,[开户代运营]抖音敏感肌加粉 企微,我们是乙方综合性服务商,欢迎点击对接合作与我联系。
  • 2025-12-31 00:41:15

     

    我是民众普康的ad信息流销售何骋远,[开户代运营]千川白 牌4.5 抖音快手涨粉 婚恋相亲表单 、黑发祛斑毛孔核减 、手机回收、 抖音证券,我们是广告媒体代理商,欢迎点击对接合作与我联系。
  • 2025-12-31 00:33:09

     

    我是六安零动的市场总监陈雨,[开户代运营]微信朋友圈广告全行业渠道 黄金回收 医疗医美 电商 中医 八字 驾校等禁投行业包过审,我们是广告媒体代理商,欢迎点击对接合作与我联系。
  • 2025-12-31 00:25:03

     

    我是奇元乐餐饮的会计陈雅熹,[开户代运营]全平台全行业对公验证查款服务,我们是乙方综合性服务商,欢迎点击对接合作与我联系。
  • 2025-12-31 00:16:56

     

    [开户代运营]千川白牌4.5 婚恋相亲表单 抖音股票、减肥问答、黄金回收、手机回收、个债 全风险户
  • 2025-12-30 21:59:12

     

    何超仪携手丈夫陈子聪再度回归!《拾荒法师2》开机引爆港片新热潮
  • 2025-12-30 21:43:00

     

    新股消息 | 卓越睿新数码通过港交所聆讯 公司已交付超过4.4万款数字化教育内容产品
  • 2025-12-30 21:26:47

     

    礼来、诺和诺德、辉瑞、默沙东、强生、阿斯利康等全球32家大药厂2025年第三季度财报业绩汇总
  • 2025-12-30 21:18:41

     

    大回暖后迎大降温,下周东北或连遇三轮降雪
  • 2025-12-30 21:10:35

     

    辛芷蕾66万天价随礼引爆热搜!为弟买房购车被赞为“神仙姐姐”
  • 2025-12-30 21:02:29

     

    A股申购 | 摩尔线程(688795.SH)开启申购 已推出四代GPU架构
  • 2025-12-30 20:54:22

     

    投资科创!上海国投预计今年出资破450亿元,规模为去年7倍
  • 2025-12-30 20:46:16