小鹏公然AI“造假”,啧啧啧 小鹏ai感知有多强 小鹏ai代驾
admin
2024-02-07 14:09:30
0

金磊 发自 凹非寺
量子位 | 公众号 QbitAI

家人们,我们先来看一段视频,你能否发现其中有什么异样?



如果说,在这段视频里,有一个物件是假的,是被合成进去的,你能发现吗?



不卖关子,现在就来揭晓答案。

“造假”的物体,正是这个出现在不该出现位置的红绿灯。



我们再来玩一把“大家来找茬”,请看题目:



答案是:放在置物架上的这个设备。



这就是来自小鹏汽车最新的一项研究——Anything in Any Scene

主打一个往真实环境里毫无违和感地“塞”进去任何东西。



并且研究团队给予这个通用框架的评价是:

它的应用远远超出了视频数据增强的范围,在虚拟现实、视频编辑和其他各种以视频为中心的应用中显示出巨大的潜力。

甚至有网友在看完效果之后直呼:

再见了视频证据~这个技术插入视频的物体可以保持与原始素材相同的真实感。



那么这项AI技术更多效果如何,我们继续往下看。

Anything in Any Scene

先从室外场景来看下效果。

在视频中合成某个物体的时候,往往不逼真的原因,可以总结为位置放置错误、无阴影、无HDR和无样式迁移等原因。

正如下面几个错误案例所示:



而小鹏团队的效果,是这样的:



相比刚才缺少各种因素的情况而言,效果显然是相对逼真的。

再与其它已有的算法和框架做比较,例如DoveNet、StyTR2和PHDiffusion,它们在室外场景中合成物体的效果是这样的:



小鹏的Anything in Any Scene从效果上来看,依旧是相对更为逼真。



同样的,在室内环境中,不论是包包还是鞋子,小鹏新AI技术所生成的效果可以说是真假难辨的那种了。



更多的效果展示如下图所示:



除了视觉效果之外,小鹏团队在CODA数据集的原始图像上,将训练的YOLOX模型的性能与Anything in Any Scene框架在原始和增强图像的组合上训练时的性能进行了比较。

从整体精度上来看也有了不小的提高。



怎么做到的?

从此次提出的框架上来看,Anything in Any Scene主要由三个关键部分组成。



首先是物体放置和稳定化的过程。

团队先确定相机在场景中的世界坐标系位置,并将其作为物体插入的参考点;使用相机的内参矩阵和姿态(旋转矩阵和位移向量)将世界坐标系中的点投影到像素坐标系中,以确定物体在视频帧中的放置位置。

为了避免与场景中其他物体的遮挡,团队还使用语义分割模型估计每个帧的分割掩模,并确保物体放置在未被遮挡的区域。

在物体稳定化方面,团队在连续帧之间估计光流,以跟踪物体的运动轨迹;并通过优化相机姿态(旋转矩阵和位移向量),最小化物体在连续帧中的3D到2D投影误差,确保物体在视频中的稳定运动。



其次,是光照估计和阴影生成

针对HDR全景图像重建,团队使用图像修复网络推断全景视图的光照分布,然后通过天空HDR重建网络将全景图像转换为HDR图像;并结合使用GAN训练编码器-解码器网络来模拟太阳和天空的亮度分布。

在环境HDR图像重建方面,研究人员则是收集了场景的多视角LDR图像,并通过现有模型恢复为HDR图像,以学习连续曝光值表示。

在物体阴影生成上,团队则是使用3D图形应用(如Vulkan)和光线追踪技术,根据估计的主要光源位置生成插入物体的阴影。



最后的步骤,则是照片风格迁移

框架对插入物体的外观进行微调,使其风格与背景视频完美融合,进一步提升了视频的逼真度。



这便是小鹏Anything in Any Scene在真实环境中生成物体较为逼真的原因了。

而与小鹏此次研究类似的效果,其实早在之前便有了许多工作。

例如名为GAIA-1的多模态生成式世界模型,便可以从头到脚的打造逼真的自动驾驶视频:



这里的每一帧都是由AI生成,甚至就连不同的路况和天气等等,都是可以做到以假乱真。



就连LeCun看了都惊叹不已:



不过这些AI效果虽真实,但也有网友提出了担忧之处,那便是网上虚假、生成的信息越发的逼真;因此,以后辨别信息的真假需要更加警惕。



目前,这个项目已经在GitHub中开源,感兴趣的小伙伴可以了解一下了~

参考链接:
[1]https://anythinginanyscene.github.io/
[2]https://arxiv.org/abs/2401.17509

相关内容

热门资讯

罕见9连跌,历史第二次!上证5... 最近,A股市场“冰火两重天”,有色金属、国防军工、电子等行业轮番走强,而大盘蓝筹却持续阴跌。 截至1...
见证历史!纽约白银期货、伦敦现... 1月23日晚,又见证历史了。1月23日晚间,纽约白银期货、伦敦现货白银双双突破100美元历史性关口!...
原创 淘... 当电商转向价值竞争,好服务成了好增长的密钥。 原创ⓒ新熵 新消费组 作者丨栀子 编辑丨九黎 进入20...
晚上9点后别做这几件事!一个好... 太原龙城中医医院科普:对于肺结节人群而言,除了饮食、运动等日常养护,优质睡眠的重要性往往被忽视。中医...
破“7”!人民币汇率中间价调升... 北京商报讯(记者 廖蒙)1月23日,中国人民银行授权中国外汇交易中心公布,当日银行间外汇市场人民币汇...
原创 异... 在探讨异性交往的微妙关系时,我们不得不提到一个至关重要的话题——男性回家后的行为模式。高情商的女性往...
和讯投顾王海洋:大盘震荡收星,... 1月23日,和讯投顾王海洋表示,大盘震荡收星,平均股价再创新高。昨日曾提到,今日大盘大概率会再次触摸...
马斯克成为科技行业“风向标” ... 来源:@投中网微博 【马斯克成为科技行业“风向标” 带火汽车航天光伏三大领域】作为科技行业标杆与全球...
凝“新”聚力│发挥“联”优势 ... 前 言 为深入贯彻落实习近平总书记同全国妇联新一届领导班子成员集体谈话时提出的“加大在新经济组织、新...
【日常消费品ETF收涨约0.8... 【日常消费品ETF收涨约0.8%,领跑美股行业ETF,半导体ETF跌约0.7%,银行业ETF跌超3....
每月最高800元!中度以上失能... 民政部、财政部日前印发通知,从今年1月1日起,面向中度以上失能老年人发放养老服务消费补贴的政策在全国...
龙虎榜揭秘!大牛股背后资金动向... 龙虎榜揭秘。 近期A股市场整体波动较为平稳,但不少个股波动剧烈,甚至连续涨停或连续跌停,近日的龙虎榜...
原创 全... 全球都在用美元? 中国偷偷搞了个大动作! 美元占全球支付50%时人民币干了啥? 你可能不知道的是,当...
我国银行理财市场规模突破33万... 银行业理财登记托管中心1月23日发布的《中国银行业理财市场年度报告(2025年)》显示,截至2025...
最高分红率35%!上市银行春节... 随着春节临近,上市银行2025年中期分红逐渐进入尾声。 1月23日,华夏银行、渝农商行迎来2025年...
蔡英丽医生:帕金森患者麻醉注意... 帕金森病是中老年人常见的神经系统退行性疾病,随着病情进展,不少患者可能需要接受各类手术,而麻醉环节的...
原创 利... 朋友们,今天A股发生了一件挺有意思的事:在地面光伏行业不少公司还在为亏损发愁的时候,一个叫做“太空光...
二游王战之局,鹰角先下一城 2026二游王战的启幕来了。1月22日,鹰角《明日方舟:终末地》(以下简称终末地)正式公测,和我们预...
大润发首次跨界合作蛋仔派对,以... 2026年春节前夕,高鑫零售旗下核心品牌大润发与国民级游戏IP《蛋仔派对》正式达成深度跨界合作,共同...
2025年基金4季报重仓股全扫... 随着基金2025年4季报基本披露完毕,记者注意到,截至去年底,基金的重仓股发生了比较明显的变化,有5...