李飞飞团队新作:AI透视眼,穿越障碍看清你,渲染遮挡人体有新突破了_每日快讯(日常热点指南)

李飞飞团队新作:AI透视眼,穿越障碍看清你,渲染遮挡人体有新突破了


李飞飞团队新作:AI透视眼,穿越障碍看清你,渲染遮挡人体有新突破了

  2024-01-06 02:46:02     简体|繁體
http://news.qghjm.com/1032187.html

原文来源:机器之心

图片来源:由无界 AI生成

即使遮挡,也能渲染出高保真的 3D 人体。

AR/VR 、电影和医疗等领域都在广泛地应用视频渲染人类形象。由于单目摄像头的视频获取较为容易,因此从单目摄像头中渲染人体一直是研究的主要方式。Vid2Avatar、MonoHuman  和 NeuMan  等方法都取得了令人瞩目的成绩。尽管只有一个摄像头视角,这些方法仍能从新的视角准确地渲染人体。

不过,大多数现有的方法在渲染人体时都是针对较为理想的实验场景进行设计的。在这些场景中,障碍物几乎不存在,人的各个身体部分在每一帧中也都能全部展示出来。可这与现实场景大为不同。现实场景中常有多个障碍物,人体也会在移动过程中被障碍物遮挡。

大多数的神经渲染方法在处理现实世界的场景时都会因为遮挡而困难重重,其中一大原因就是缺乏监督。实际场景往往无法提供有关人体外观、形状和姿态的真实监督数据,因此模型需要根据现有的少量证据来推断其他信息,而这十分具有挑战性,尤其是大部分人体被遮挡的情况。

由于许多神经方法采用的基于点的渲染方案,当一个被遮挡和一个未被遮挡时,两个非常接近的坐标会在渲染输出上产生巨大差异。因此,那些未适应被遮挡场景的方法在遇到遮挡时经常会显示出不完整的人体,或者渲染出漂浮物和其他视觉上的错误。

最近,著名人工智能教授李飞飞在 X 上发布了有关 3D 人体渲染工作的新进展 —— 一种名为 Wild2Avatar 的新模型,该模型即使在有遮挡的情况下仍然能够完整、高保真地渲染人体。

Wild2Avatar 是一种适用于有遮挡的野外单目视频的神经渲染方法。研究团队提出了遮挡感知场景参数化,将场景解耦为三个部分 —— 遮挡、人体和背景,分别渲染这三个部分,并设计了新颖的优化目标。

  • 论文地址:https://arxiv.org/pdf/2401.00431.pdf
  • 项目地址:https://cs.stanford.edu/~xtiange/projects/wild2avatar/

方法介绍

Wild2Avatar 可以为带有遮挡的野外单目视频渲染具有完整几何形状和高保真外观的 3D 人体。Wild2Avatar 模型的整体架构如下图 2 所示:

具体来说,Wild2Avatar 将遮挡物、人体和背景建模为三个独立的神经场,无论遮挡物如何,都能对人体进行清晰的三维重建。为此,该研究采用场景自分解技术,在倒球参数化(inverted sphere parametrization)的基础上,提出了遮挡感知场景参数化。

除了倒球参数化定义的第一个球外,该研究还引入了第二个内球,并将从摄像机到内球边缘的区域定义为遮挡区域。通过单独渲染这一区域,Wild2Avatar 成功将遮挡与场景的其他部分分离开来。

此外,为了确保高保真和完整地渲染人体,该研究提出通过像素光度损失、场景分解损失、遮挡解耦损失和几何完整性损失的组合来汇总三种渲染。

实验及结果

数据集

OcMotion:该数据集由人体与各种物体接触的室内场景组成,同时被这些物体部分遮挡。研究者从该数据集的 48 个视频中选用了 5 个,它们展示了不同程度的遮挡。他们从每个视频中只抽取了 100 帧来训练模型,并使用数据集提供的相机矩阵、人体姿态和 SMPL 参数来初始化优化过程。帧内的二进制人体分割掩码是通过「分割一切 (SAM)」获得的。

野外视频:研究者对两段真实世界的视频进行了额外的实验,其中一段是从 YouTube 下载的,另一段是研究团队使用手机摄像头拍摄的。他们从这两段视频中抽取了 150 帧进行训练,并使用 SLAHMR 获取了摄像机矩阵、人体姿势和 SMPL 参数。由于没有提供真实姿态,因此对这些视频的评估也表明了各种方法对不准确估计的稳健性。

被遮挡单目摄像头视频上的结果

图 5 比较了 Vid2Avatar 和 Wild2Avatar 在两个数据集上的渲染结果。

在表 1 中,研究者报告了两种方法的量化结果,并观察到二者在可见部分的渲染性能不相上下。不过,需要注意的是,Wild2Avatar 在身体几何形状和遮挡部分的渲染质量上始终优于 Vid2Avatar。

与 OccNeRF 的比较

研究者将 Wild2Avatar 与最近推出的遮挡人体渲染软件 OccNeRF 进行比较。比较结果如图 6 所示。

为了进行公平比较,他们分别在 500 帧和 100 帧图像上对 OccNeRF 进行了训练。由于没有隐式 SDF 表征,OccNeRF 存在浮游物和伪影等常见缺陷。虽然 OccNeRF 也能恢复被遮挡的人体部位,但人体通常会意外扭曲,导致渲染质量较低。

场景分解的可视化

Wild2Avatar 以组合的方式渲染了三个场景部分。人和背景 / 遮挡物分别在两个不同的神经场中建模。图 7 展示了这三个场景部分的单独渲染图。需要注意的是,由于这项工作只专注于人体渲染,因此背景和遮挡物的无伪影渲染不在这项工作的讨论范围内。

消融实验

尽管 Wild2Avatar 仍能恢复被遮挡的外观,但在没有提出的参数化的情况下,渲染结果中会出现许多伪影,见图 8 第一行。

如果不采用建议的损失函数,则无法完全恢复被遮挡的区域,见图 8 第二行。

提出的损失函数作为一个正则化器,强制人体几何形态与 SMPL 网格先验保持一致,这防止了错误姿态的渲染,见图 8 第三行。



编辑:web3528btc 来源:加密钱包代币

免责声明:以上文章内容信息均搜集自互联网或用户发布,并不代表本站观点或立场,本站不对其真实合法性负责。如有信息侵犯了您的权益,请联系本站将立即删除。
分享到:

  • 上一篇
    下一篇

  • 今日要闻|实事关注

    每日快讯(日常热点指南)
    手机查看(二维码扫一扫)

    每日快讯网为您提供最新的行业简讯、新闻报道,以及今日热点内容,重大事件等实时资讯,24小时不间断播报,让您获得最新行业信息。
    « 2048年 » « 06月 »
    1234567
    891011121314
    15161718192021
    22232425262728
    2930

    最新资讯

    我是全网互动的总经理李裕全,[开户代运营]抖音 快手 HPV 痛风 精分 白癜风 肺结节 骨病全病种开户 开户效率高,我们是广告媒体代理商,欢迎点击对接合作与我联系。
  • 2026-02-25 17:31:38

     

    我是聚搜广告的媒介总监聚搜广告,[开户代运营]百度(baidu)、抖音、视频号渠道的劳动、执行,维权退费等法律案源,案源精准匹配需求,助力业务高效拓展,我们是乙方综合性服务商,欢迎点击对接合作与我联系
  • 2026-02-25 17:22:35

     

    中荷长盈金生年金保险怎么样?怎么理赔?
  • 2026-02-25 17:13:31

     

    我是武汉维冠的武汉维冠,[代运营托管]小病种技术软文加粉 源头公司 成本低 需要长期合作 来,我们是乙方综合性服务商,欢迎点击对接合作与我联系。
  • 2026-02-25 17:04:28

     

    Tk直播流量,寻注册,下载,cpa合作
  • 2026-02-25 16:55:25

     

    我是巨峰网络的高级渠道经理赖坤娣,[开户代运营]:抖音本地推二奢回收黄金回收的量,自运营代运营均可,量大!缺量的朋友快来找我!,我们是推广代运营服务商,欢迎点击对接合作与我联系。
  • 2026-02-25 16:46:21

     

    我是行煜网络的运营总监王海,[开户代运营]:抖音本地推斑疤痘皱纹眼袋的量,可以跑加粉,申请加白即可,量很大,缺量的快来!,我们是推广代运营服务商,欢迎点击对接合作与我联系。
  • 2026-02-25 16:37:18

     

    我是微驰互动的大客户经理孙华琦,[开户代运营]精准中老年流量,我们是推广代运营服务商,欢迎点击对接合作与我联系。
  • 2026-02-25 16:28:14

     

    我是花辰月夕的销售经理邓献忠,[开户代运营]|:抖音本地推心理咨询线上推广,目前跑的客户量大稳定,寻甲方!,我们是推广代运营服务商,欢迎点击对接合作与我联系。
  • 2026-02-25 16:19:11

     

    我是拳头科技的快手销售王欣,[开户代运营] 证券,财商,AI ,养生,运势测算,个债,逾期,教育维权,教育,医疗,口腔,皮肤,妇产,整形, 快手都有户,我们是广告媒体代理商,欢迎点击对接合作与我联系。
  • 2026-02-25 16:10:07

     

    我是成都汇启量的渠道总经理哈喽,[开户代运营]百度(baidu)电子游戏,我们是推广代运营服务商,欢迎点击对接合作与我联系。
  • 2026-02-25 16:01:04

     

    我是百度(baidu)的大客户高级经理蔡桂丽,[开户代运营]百度(baidu)直营签框政策,服务及扶持,我们是广告媒体方,欢迎点击对接合作与我联系。
  • 2026-02-25 15:52:01

     

    人保寿险优选嘉定期寿险2025介绍:保障责任 + 投保条件 + 理赔流程全解析
  • 2026-02-25 15:42:57

     

    我是品诺传媒的法人吕春龙,[代运营托管]百度(baidu)男科nk百度(baidu)信息流专业代运营!,我们是推广代运营服务商,欢迎点击对接合作与我联系。
  • 2026-02-25 15:33:54

     

    我是加减乘除的知乎负责人代佳鑫,[开户代运营]知乎全行业开户,高政策,可代运营服务,3CIT,网服信息流,教育大盘有量,,我们是乙方综合性服务商,欢迎点击对接合作与我联系。
  • 2026-02-25 15:24:50