小鹏公然AI“造假”,啧啧啧 小鹏黑科技是真的吗 小鹏ai感知有多强
admin
2024-02-07 23:42:56
0

金磊 发自 凹非寺
量子位 | 公众号 QbitAI

家人们,我们先来看一段视频,你能否发现其中有什么异样?



如果说,在这段视频里,有一个物件是假的,是被合成进去的,你能发现吗?



不卖关子,现在就来揭晓答案。

“造假”的物体,正是这个出现在不该出现位置的红绿灯。



我们再来玩一把“大家来找茬”,请看题目:



答案是:放在置物架上的这个设备。



这就是来自小鹏汽车最新的一项研究——Anything in Any Scene

主打一个往真实环境里毫无违和感地“塞”进去任何东西。



并且研究团队给予这个通用框架的评价是:

它的应用远远超出了视频数据增强的范围,在虚拟现实、视频编辑和其他各种以视频为中心的应用中显示出巨大的潜力。

甚至有网友在看完效果之后直呼:

再见了视频证据~这个技术插入视频的物体可以保持与原始素材相同的真实感。



那么这项AI技术更多效果如何,我们继续往下看。

Anything in Any Scene

先从室外场景来看下效果。

在视频中合成某个物体的时候,往往不逼真的原因,可以总结为位置放置错误、无阴影、无HDR和无样式迁移等原因。

正如下面几个错误案例所示:



而小鹏团队的效果,是这样的:



相比刚才缺少各种因素的情况而言,效果显然是相对逼真的。

再与其它已有的算法和框架做比较,例如DoveNet、StyTR2和PHDiffusion,它们在室外场景中合成物体的效果是这样的:



小鹏的Anything in Any Scene从效果上来看,依旧是相对更为逼真。



同样的,在室内环境中,不论是包包还是鞋子,小鹏新AI技术所生成的效果可以说是真假难辨的那种了。



更多的效果展示如下图所示:



除了视觉效果之外,小鹏团队在CODA数据集的原始图像上,将训练的YOLOX模型的性能与Anything in Any Scene框架在原始和增强图像的组合上训练时的性能进行了比较。

从整体精度上来看也有了不小的提高。



怎么做到的?

从此次提出的框架上来看,Anything in Any Scene主要由三个关键部分组成。



首先是物体放置和稳定化的过程。

团队先确定相机在场景中的世界坐标系位置,并将其作为物体插入的参考点;使用相机的内参矩阵和姿态(旋转矩阵和位移向量)将世界坐标系中的点投影到像素坐标系中,以确定物体在视频帧中的放置位置。

为了避免与场景中其他物体的遮挡,团队还使用语义分割模型估计每个帧的分割掩模,并确保物体放置在未被遮挡的区域。

在物体稳定化方面,团队在连续帧之间估计光流,以跟踪物体的运动轨迹;并通过优化相机姿态(旋转矩阵和位移向量),最小化物体在连续帧中的3D到2D投影误差,确保物体在视频中的稳定运动。



其次,是光照估计和阴影生成

针对HDR全景图像重建,团队使用图像修复网络推断全景视图的光照分布,然后通过天空HDR重建网络将全景图像转换为HDR图像;并结合使用GAN训练编码器-解码器网络来模拟太阳和天空的亮度分布。

在环境HDR图像重建方面,研究人员则是收集了场景的多视角LDR图像,并通过现有模型恢复为HDR图像,以学习连续曝光值表示。

在物体阴影生成上,团队则是使用3D图形应用(如Vulkan)和光线追踪技术,根据估计的主要光源位置生成插入物体的阴影。



最后的步骤,则是照片风格迁移

框架对插入物体的外观进行微调,使其风格与背景视频完美融合,进一步提升了视频的逼真度。



这便是小鹏Anything in Any Scene在真实环境中生成物体较为逼真的原因了。

而与小鹏此次研究类似的效果,其实早在之前便有了许多工作。

例如名为GAIA-1的多模态生成式世界模型,便可以从头到脚的打造逼真的自动驾驶视频:



这里的每一帧都是由AI生成,甚至就连不同的路况和天气等等,都是可以做到以假乱真。



就连LeCun看了都惊叹不已:



不过这些AI效果虽真实,但也有网友提出了担忧之处,那便是网上虚假、生成的信息越发的逼真;因此,以后辨别信息的真假需要更加警惕。



目前,这个项目已经在GitHub中开源,感兴趣的小伙伴可以了解一下了~

参考链接:
[1]https://anythinginanyscene.github.io/
[2]https://arxiv.org/abs/2401.17509

相关内容

热门资讯

原创 油... 2026年1月24日蛋价:蛋价“火箭”上涨,破3入4! 近日,国内鸡蛋市场,蛋价迎来了“春天”,受春...
原创 得... 特朗普上台不久,就将目光锁定在格陵兰岛——对他而言,这不仅仅是一块冰封的土地,而是一枚战略棋子,足以...
面临裁员无可奈何,亚马逊员工内... 来源:市场资讯 (来源:IT之家) IT之家 1 月 24 日消息,据《商业内幕》(Business...
2026投资指南,嘉实基金投策... 来源:时代周报-时代在线 2026年是“十五五”规划的开局之年,也是布局中国经济高质量发展红利的关键...
2026年首家!又一具身智能企... 1月23日,记者获悉,星海图(北京)人工智能科技有限公司已于2026年1月完成工商变更,正式更名为“...
原创 历... 在历经千年战争的漫长历史中,有一种特殊的战斗形式至今依旧困扰着军事指挥官们,那就是攻城战。从古至今,...
宁德时代钠电池量产上车,“钠锂... 1月22日,宁德时代正式推出行业首款量产钠离子电池(以下简称“钠电池”),这款适配小微卡、中小VAN...
“十四五”营收利润显著增长,宜... 来源:市场资讯 (来源:云酒头条) 在全国白酒行业普遍承压的背景下,作为川酒核心产区的宜宾,其...
白银价格持续上涨 工厂加班赶制... 本文转自【央视财经】; 国际银价创出历史新高的同时,国内银价也持续飙升,2025年至今以来,同比上涨...
芯片巨头,暴跌超17%! 周五(1月23日),美股三大股指收盘涨跌不一。 截至收盘,道琼斯工业指数跌0.58%报49098.7...
原创 从... 小时候读《范进中举》,总觉得那个故事荒诞可笑、夸张至极。范进那时候几乎废寝忘食地读书,却依旧困窘潦倒...
证监会1号罚单!余韩,被罚没超... 1月23日,证监会发布了2026年的1号罚单。 罚单显示,2019年6月至2024年8月期间,余韩控...
柯尼卡美能达智慧医疗自助打印解... (1月23日,上海) 在国家“互联网+医疗健康”政策的大力推动下,中国各级医院的数字化转型步入快车道...
新董事长操盘,中国移动新成立两... 通信老柳2026-01-24 10:29:00 据悉,中国移动新董事长上任后对内部进行了一系列管理创...
再现13.08%反对票!村镇银... 来源:每日经济新闻 13.08%的反对票比例,近日在苏州农商行2026年第一次临时股东会上,吸收合并...
币安考虑重启美股代币 全球加密... 来源:滚动播报 全球多家大型加密货币交易所正竞相推出可追踪美股走势的加密代币交易服务,打造出一个不受...
男子用SIM卡炼出近200克黄... 1月20日,广东一男子用170多公斤的手机SIM卡芯片废料,经过一系列复杂工序后,成功炼出191.7...
全国共有395家网约车平台公司... 据网约车监管信息交互系统监测,截至2025年12月31日,全国共有395家网约车平台公司取得网约车平...
原创 俄... 买岛惹争议,关税当杠杆 这事儿的起点,其实很“特朗普”:把地缘政治当成一笔能谈的交易。 特朗普在20...
原创 黄... 以前,苹果一直是台积电的最大客户,其贡献的营收占台积电的总营收,超过20%,妥妥的最大金主。 所以对...