魔改 Stable Diffusion,开源创新“单目深度估计”模型_每日快讯(日常热点指南)

魔改 Stable Diffusion,开源创新“单目深度估计”模型


魔改 Stable Diffusion,开源创新“单目深度估计”模型

  2024-01-03 23:12:01     简体|繁體
http://news.qghjm.com/1031114.html

文章来源:AIGC开放社区

图片来源:由无界 AI生成

单目深度估计一直是计算机视觉领域的难点。仅凭一张 RGB 图像,想要还原出场景的三维结构,在几何结构上非常不确定,必须依赖复杂的场景理解能力。

即便使用更强大的深度学习模型来实现,也面临算力需求高、图像数据注释量大、泛化能力弱等缺点。

为了解决这些难题,苏黎世联邦理工学院的研究人员开发了Marigold模型。Marigold不需要从零开始训练,而是在Stable Diffusion(著名开源文生图模型)的基础上进行微调,只需要使用合成数据微调了中间的去噪网络,其他模块例如,编码/解码结构均保持原样,极大降低了训练成本。

实验数据显示,尽管Marigold从未直接学习过真实的深度信息,但在真实场景的测试中,其性能却超越了其他专门训练过的模型,并且迁移、兼容性非常强。

开源地址:https://github.com/prs-eth/Marigold

论文地址:https://arxiv.org/abs/2312.02145

Marigold的核心技术思路是,利用Stable Diffusion模型所捕获的丰富先验知识,来提升深度估计的泛化能力和性能。

简单来说,就是把Stable Diffusion当成一个图片查询数据库,只修改其去噪模块,就变成了可实现单目深度估计的全新模型

Marigold的关键点在于保持预训练扩散模型的潜在空间,只对去噪U-Net进行修改和微调。

这种方法非常高效,无需实际深度图像的训练数据,就能在多个真实数据集上取得出色的性能表现。

Marigold提供了一个简单而资源高效的微调协议,将预训练的扩散生成模型转化为图像条件的深度估计器,成为了一种功能强大的单目深度估计模块。

Marigold通过使用合成的RGB-D数据以及在一块消费级显卡上只训练了几天,将Stable Diffusion转化为Marigold模型。主要流程如下:


去噪U-Net


研究人员主要通过修改和微调Stable Diffusion模型的去噪U-Net模块,来实现深度估计。去噪U-Net是一个编码器-解码器结构的神经网络,用于从输入图像中学习去除噪声的表示。

在Marigold模型中,研究人员保持了扩散模型的潜空间不变,只对去噪U-Net模块进行微调,以适应深度估计任务。


合成数据训练


为了微调Marigold模型,研究人员使用了合成的RGB-D训练数据,对模型进行训练。合成数据是通过在虚拟环境中,渲染图像并生成对应的深度图来创建的。

通过使用合成数据进行训练,Marigold可以学习到广泛的场景和物体形状,从而提高其在未见过数据集上的泛化能力。


仿射不变深度估计


Marigold使用了一种仿射不变的深度估计方法,能够估计图像中每个像素的深度值,而不受全局偏移和尺度的影响。

这种仿射不变性对于在不同场景和尺度下进行深度估计非常重要。通过估计仿射不变的深度,Marigold可以消除由于相机内参的不确定性,而引入的深度估计误差。



编辑:web3528btc 来源:加密钱包代币

免责声明:以上文章内容信息均搜集自互联网或用户发布,并不代表本站观点或立场,本站不对其真实合法性负责。如有信息侵犯了您的权益,请联系本站将立即删除。
分享到:

  • 上一篇
    下一篇

  • 今日要闻|实事关注

    每日快讯(日常热点指南)
    手机查看(二维码扫一扫)

    每日快讯网为您提供最新的行业简讯、新闻报道,以及今日热点内容,重大事件等实时资讯,24小时不间断播报,让您获得最新行业信息。
    « 2026年 » « 08月 »
    12
    3456789
    10111213141516
    17181920212223
    24252627282930
    31

    最新资讯

    石家庄市第二十八中学举行校园防欺凌主题讲座
  • 2025-12-31 05:57:16

     

    纵览新闻&春回音乐节获奖名单揭晓,快看有你吗?
  • 2025-12-31 05:49:09

     

    我是凯乐鑫汇的商务专员未帅,[开户代运营]大健康社群养生粉 抖音 视频号 百货 仪器粉都有源头价,我们是乙方综合性服务商,欢迎点击对接合作与我联系。
  • 2025-12-31 05:41:03

     

    我是中谷数据的商务经理王振华,[开户代运营]甲状腺 肺结节 眩晕 肺气肿 骨病 血糖等头条腾讯软文加粉,我们是乙方综合性服务商,欢迎点击对接合作与我联系。
  • 2025-12-31 05:32:57

     

    全国海量高校资源,专业服务商,需求各行品牌方,承接各类落地活动,线上线下,任务量以及投放项目
  • 2025-12-31 05:24:51

     

    全国百万级高校学生流量&社群资源,人力兼职校招社群 寻各种合作
  • 2025-12-31 05:16:45

     

    我是尧冀网络的竞价经理陈育焕,[开户代运营] 来客无门店代入驻,可以自提或者这边包资质,我们是推广代运营服务商,欢迎点击对接合作与我联系。
  • 2025-12-31 05:08:38

     

    我是民众普康的ad信息流销售何骋远,[开户代运营]千川白牌4.5 一手婚恋相亲表单 三角洲护航有量 、抖音快手涨粉 、手机回收、 抖音证券,我们是广告媒体代理商,欢迎点击对接合作与我联系。
  • 2025-12-31 05:00:32

     

    让“年味儿”可感可触!沈阳路幼儿园萌娃寻味文化新年
  • 2025-12-31 04:52:26

     

    郑州航空港未来五年怎么做?一图读懂!
  • 2025-12-31 04:44:20

     

    京东京喜自营2025年成交额增长10倍 5大产业带订单量破亿
  • 2025-12-31 04:36:14

     

    河南拟新建8家省重点实验室
  • 2025-12-31 04:28:08

     

    从“卖酒”到“卖生活方式” 仁怀市酒文旅融合发展跑出加速度
  • 2025-12-31 04:20:02

     

    “红领巾领航”少先队辅导员实践行活动在江夏举办
  • 2025-12-31 04:11:56

     

    服务、监管齐发力 龙岩市场监管护航地方特色产业高质量发展
  • 2025-12-31 04:03:49