李飞飞团队实现“隔空建模”,透过遮挡物还原完整3D人体模型 李飞飞团队实现“隔空建模”,透过遮挡物还原完整3D人体模型
admin
2024-01-04 20:21:14
0

克雷西 发自 凹非寺
量子位 | 公众号 QbitAI

注意看,这个男人搬着一个长长的柜子,画面中半个人都被遮挡住了。

但即使有这样的遮挡,男人的整个身体在AI面前依然是无所遁形。



哪怕是蹲在椅子背后只露出头,依然可以被模型完整还原。



从遮挡物背后把人“揪”出来的,是李飞飞团队推出的人体建模新工具Wild2Avatar(本文简称W2A)。

只要一段4秒左右的的单角度视频,就能构建出完整的3D模型,有遮挡也不怕。



相比此前的SOTA方法,Wild2Avatar在人体建模上可谓是实现了质的飞跃

建模效果完胜Vid2Avatar

从下面的对比图中(从左到右依次为带遮挡原图、Vid2Avatar提取结果和W2A提取结果)可以看到,作为baseline的Vid2Avatar方法只能大概描绘出人的轮廓,遮挡物直接被“拍扁”到了人物身上,而且轮廓看上去也不够准确。

而W2A提取出的人物不仅轮廓更加精确,看上去也更具立体感,关键是遮挡物被完美地去除,显现出了完整的人物结构。



对遮挡物的去除,W2A操作得也更为彻底,没有留下多余的痕迹。



而baseline中部分结构缺失的现象,在W2A中也没有发生,人物的结构十分完整。



而且,W2A的人物建模是动态的,视频画面中,就算整个人都藏在椅子后面,依然可以输出人物模型。



和另一baseline OccNeRF相比,W2A只需100帧的训练视频就能复原出完整干净的结构,但后者用了500帧的系列视频后不仅结构缺陷极大,还存在许多“鬼影”。



测试数据也表明,对于陌生场景,W2A的提取质量和完整性(comp.)都比V2A有所提升,特别是对遮挡(llm)部分,合成质量得分接近翻番



和OccNeRF相比,W2A与500帧训练数据的OccNeRF整体成绩接近,但遮挡部分仍然是有明显增强。



那么,Wild2Avatar是如何实现的呢?

人物与遮挡分层处理

工作过程中,W2A将整个场景分成了遮挡物、人物本体和背景三部分

这三个部分由独立的NeRF网络分别预测特征,渲染图像时再将三个部分的输出拼合。



这种做法的主要目的是为了避免遮挡被误当成人体的一部分,出现Video2Avatar那样把遮挡物合成进人物的情况。

具体来说,李飞飞团队将图像映射到一个球空间,背景位于球外,人物和遮挡物则分别位于球空间内部的不同位置。

遮挡空间是通过内部采样点的坐标和距离来构造的。用于遮挡部分的生成网络与背景共享,可以预测遮挡空间样本点的颜色和密度值。

而人体部分的处理则是使用SMPL的参数化方式,通过正向和反向皮肤拟合,先将人体变形到一个姿态不变的坐标空间,再输入神经网络进行学习。



为了增强任务模型的完整性,李飞飞团队还设计了新的损失计算方式

首先利用现成的分割模型输出人体的二值分割掩码,并掩码取反得到“非人体”区域的掩码,即为可能的遮挡区域。

同时,从W2A渲染的三个部分中遮挡部分的密度图,然后根据提取结果再分离出人体部分。

其中人体部分与前面得到的“非人体”掩码进行与非运算,得到的结果再和遮挡部分的密度图做二值交叉熵运算,就得到了遮挡解耦损失Locc。



Locc会与像素重构损失、场景分解损失等其他损失参数一并纳入到整个网络的端到端训练过程,用于优化更新网络参数。

论文地址:
https://arxiv.org/abs/2401.00431

相关内容

热门资讯

年货C位锁定!拆解乐事新春“硬... 作为兼具强心智认知与场景化产品力的休闲零食头部品牌,乐事本身就是终端高动销的保障,其产品的节庆辨识度...
网络控价的重要性:选择与控价公... 对于如今的品牌而言,电商渠道是一把双刃剑。它带来了巨大的流量和销售增长,但同时也滋生了让管理者头疼不...
业之峰张钧荣获“2025家居年... 乐居财经12月30日,由乐居财经主办的“破局·致远:2025年美好生活荣誉盛典”举行。业之峰装饰集团...
结直肠癌意识提升行动!尼日利亚... 引言 近年来,结直肠癌的发病率在全球范围内逐渐上升,尤其是在西撒哈拉非洲地区。根据数据显示,从199...
山海:只要节奏踏的对,不惧黄金... 山海:只要节奏踏的对,不惧黄金的极限涨跌! 请大家反复研究一下山海周一讲过的内容,一个字都没有改,...
华光源海“华光领航”号正式启航... 挖贝网 12月30日消息,北交所上市企业华光源海(920351.BJ)于近期发布的最新公司船期显示,...
【IPO追踪】国货护肤品“以油... 年末的港股IPO市场热闹非凡,锣声回荡。12月30日,6家企业同日登陆港交所,包括英硅智能(0369...
英国消费者五年来首次削减刷卡消... 来源:环球市场播报 据巴克莱银行,英国消费者使用借记卡和信用卡的消费支出在2025年下降,为自新冠疫...
茅台说随行就市,五粮液进退两难 原创 | 涌流商业 作者 | 李伟 随行就市,这四个字第一次出现在茅台经销商大会上。 它的意思价格跟...
原创 丁... 网易的双丁格局,没了! 12月27日,网易公告宣布,在公司服务23年后,执行副总裁、互动娱乐事业群负...
国债期货早盘收盘 30年期主力... 12月30日,国债期货早盘收盘多数上涨,30年期主力合约涨0.3%,10年期主力合约涨0.03%,5...
【IPO追踪】港股再现“六箭齐... 12月30日,港股新股市场再现“六箭齐发”景象——英矽智能(03696.HK)、五一视界(06651...
资金关注红利资产,中证红利质量... 资金偏好红利类资产,截至三季度,保险持有股票及证券投资规模增长至5.6万亿元,为2013年数据公布以...
汇丰晋信基金总经理李选进,最新... 【导读】汇丰晋信基金总经理李选进:坚守长期主义,让投资更简单 中国基金报记者 曹雯璟 “让投资更简单...
柯静:交易式单边主义扰动全球经... 来源:滚动播报 (来源:上观新闻) 2025年,世界经历深刻而复杂的“特朗普冲击”。特朗普发动...
智谱港股上市获证监会备案 IP... 北京智谱华章科技股份有限公司于2025年12月30日通过港交所公告,计划发行37,419,500股H...
宇信科技再闯港交所上市:业绩波... 近日,北京宇信科技集团股份有限公司(SZ:300674,下称“宇信科技”)再次递交招股书,报考在港交...
上任仅两个月,众泰汽车董事长李... 图片来源:视觉中国 12月29日,众泰汽车(000980.SZ)发布公告称,公司董事长李立忠因个人家...
中际旭创成交额超100亿元 12月30日10时40分,中际旭创成交额超过100亿元,达到108亿元。金风科技、中国卫星成交额居前...
高性价比靠谱之选:小红书聚光托... 在当今竞争激烈的营销市场中,小红书聚光托管服务成为众多品牌提升曝光度和转化率的重要途径。那么,如何选...