加入收藏

一张图,就能「接着舞」,SHERF可泛化可驱动人体神经辐射场的新方法

2023-08-17 12:33:19 来源:机器之心
机器之心专栏
机器之心编辑部
输入的 一张任意相机角度 3D 人体图 片,Ta 就能动啦!

人体神经辐射场的目标是从 2D 人体图片中恢复高质量的 3D 数字人并加以驱动,从而避免耗费大量人力物力去直接获取 3D 人体几何信息。这个方向的探索对于一系列应用场景,比如虚拟现实和辅助现实场景,有着非常大潜在性的影响。


(资料图)

现有人体神经辐射场生成和驱动技术主要可以分为两类。

第一类技术利用单目或者多目人体视频去重建和驱动 3D 数字人。这类技术主要是针对特定数字人的建模和驱动,优化耗时大,缺乏泛化到大规模数字人重建上的能力。

第二类技术为了提升 3D 数字人重建的效率。提出利用多视角人体图片作为输入去重建人体神经辐射场。

尽管这第二类方法在 3D 人体重建上取得了一定的效果,这类方法往往需要特定相机角度下的多目人体图片作为输入。在现实生活中,我们往往只能获取到任意相机角度下人体的一张图片,给这类技术的应用提出了挑战。

在 ICCV2023 上,南洋理工大学 - 商汤科技联合研究中心 S-Lab 团队提出了基于单张图片的可泛化可驱动人体神经辐射场方法 SHERF。

论文地址:/abs/

项目地址:/SHERF

代码开源:/skhu101/SHERF

SHERF 可以基于用户输入的一张任意相机角度 3D 人体图片,该角度下相机和人体动作体型(SMPL)参数,以及给定目标输出空间下任意相机参数和人体动作体型(SMPL)参数,重建并驱动该 3D 数字人。本方法旨在利用任意相机角度下人体的一张图片去重建和驱动 3D 人体神经辐射场。

图 1

基本原理

人体神经辐射场重建和驱动主要分为五个步骤(如图 2 所示)。

图 2

第一步为目标空间(target space)到标准空间(canonical space)的坐标转换基于用户输入目标输出空间下任意人体动作体型参数和相机外参参数,在目标空间内射出光线,并在光线上采样一系列空间点,利用 SMPL 算法的逆线性蒙皮转换(Inverse Linear Blend Skinning)将目标空间里的空间点转换到标准空间中。

第二步为提取标准空间中 3D 点对应的层级特征(hierarchical feature)。

全局特征(global feature)提取:利用二维编码网络(2D Encoder)从输入图片提取一维特征,并利用映射网络(Mapping Network)和风格编码网络(Style-Based Encoder)进一步将 1D 特征转换为标准空间下的三平面特征(Tri-plane),接下来将标准空间中 3D 点投影到三平面提取相应的全局特征;

点级别特征(Point-Level Feature)提取:首先利用二维编码网络(2D Encoder)从输入图片提取二维特征,并将观测空间(observation space)下 SMPL 的顶点投影到输入图片成像平面上去提取相应特征,紧接着利用 SMPL 算法的逆线性蒙皮转换(Inverse Linear Blend Skinning)将观测空间下 SMPL 的顶点转到标准空间下构建稀疏三维张量,然后利用稀疏卷积得到标准空间中 3D 点的点级别特征;

像素级别特征(Pixel-Aligned Feature)提取:首先利用二维编码网络(2D Encoder)从输入图片提取二维特征,并利用 SMPL 算法的线性蒙皮转换(Linear Blend Skinning)将标准空间中 3D 点转到观测空间下,再投影到输入图片成像平面上去提取相应像素级别特征。

第三步为特征融合(Feature Fusion Transformer),利用 Transformer 模型将三种不同级别的特征进行融合。第四步为人体神经辐射场解码生成相应图片信息,将标准空间中 3D 点坐标,光线方向向量和对应特征输入到人体神经辐射场解码网络中得到 3D 点的体密度和颜色信息,并进一步基于体渲染(Volume Rendering)在目标空间下生成相应像素的颜色值,并得到最终用户输入目标输出空间下任意人体动作体型参数和相机外参参数下的图片。

基于以上步骤,给定目标输出空间下任意人体动作序列(SMPL)参数可以从 2D 图片恢复 3D 数字人并加以驱动。

结果比较

本文在四个人体数据集上人体数据集上进行了实验,分别是 THuman,RenderPeople,ZJU_MoCap,HuMMan。

该研究对比了对比了最先进的可泛化多视角人体图片的人体神经辐射场方法,NHP 和 MPS-NeRF。本文在 peak signal-to-noise ratio (PSNR),structural similarity index (SSIM),以及 Learned Perceptual Image Patch Similarity (LPIPS)进行了比较。如下图所示,本文在所有数据集,所有指标上均大幅超越之前的方案。

SHERF 动态驱动 3D 人体结果如下图所示:

从左到右分别为input Image、motion seq 1、motion seq 2

本文同样验证了在 in-the-wild DeepFashion 数据上的泛化和驱动效果,如下图 3 所示,给定任意一张输入图片,本文利用单视角估 SMPL 的先进算法估出 SMPL 和相应相机角度,后利用本文提出的算法对 3D 人体进行驱动。实验结果显示 SHERF 具有较强的泛化性。

从左到右分别为input Image、motion seq 1、motion seq 2

应用前景

在游戏电影制作,虚拟现实增强现实或者其他需要数字人建模的场景,用户可以无需专业技能,专业软件,即可通过输入的一张任意相机角度 3D 人体图片,该角度下相机的参数和相应的人体动作体形参数(SMPL),就可以达到重建并驱动该 3D 数字人的目的。

结语

本文提出一种基于单张输入图片可泛化可驱动的人体神经辐射场方法 SHERF。可以承认的是,本文依然存在一定的缺陷。

首先,对于输入图片观测不到一部分人体表面, 渲染出来的结果可以观察到一定的瑕疵,一个解决的办法是建立一种遮挡可知(occlusion-aware)的人体表征。

其次,关于如何补齐输入图片观测不到人体部分依旧是一个很难得问题。本文从重建角度提出 SHERF,只能对观测不到的人体部分给出一个确定性的补齐,对观测不到部分的重建缺乏多样性。一个可行的方案是利用生成模型在观测不到的人体部分生成多样性高质量的 3D 人体效果。

最后,我们的代码已经全部开源,大量基于单张图片生成的数字人结果也已经上传项目主页,欢迎大家下载玩耍!

©THE END

转载请联系本公众号获得授权

投稿或寻求报道:content@

关键词:

相关新闻

资讯

南昌大学抚州校区招生简章_南昌大学抚州校区
南昌大学抚州校区招生简章_南昌大学抚州校区

1、南昌大学抚州分校的临床医学毕业证与南昌大学医学......更多>

中央气象台:青海甘肃四川西部等地有中到大雨,江南华南等地多分散性强降水
中央气象台:青海甘肃四川西部等地有中到大雨,江南华南等地多分散性强降水

青海甘肃四川西部等地有中到大雨江南华南等地多分散性......更多>

龙虎榜丨1.52亿资金抢筹鸿博股份,2.23亿资金出逃韦尔股份(名单)
龙虎榜丨1.52亿资金抢筹鸿博股份,2.23亿资金出逃韦尔股份(名单)

8月15日,上证指数下跌0 07%,深证成指下跌0 7%,创......更多>

五年跨越2200公里,从学生变校友,他们和华东理工大学的缘分还在延续
五年跨越2200公里,从学生变校友,他们和华东理工大学的缘分还在延续

今年夏天,收到华东理工大学录取通知书的那一刻,云南......更多>

算力争夺战落幕!贝恩资本高价拿下秦淮数据
算力争夺战落幕!贝恩资本高价拿下秦淮数据

不过,在巨头入局争夺的情况下,贝恩资本私有化秦淮数......更多>

再迎“大鲶鱼” 消息称特斯拉组建本地运营团队:推动FSD中国落地
再迎“大鲶鱼” 消息称特斯拉组建本地运营团队:推动FSD中国落地

再迎“大鲶鱼”消息称特斯拉组建本地运营团队:推动FS......更多>

三大股指一度翻红!券商股 “暴力”护盘 人工智能龙头重挫
三大股指一度翻红!券商股 “暴力”护盘 人工智能龙头重挫

房地产板块复苏,天房发展等涨停!详情...更多>

定安探索生态产品价值转换 生态与发展双向奔赴
定安探索生态产品价值转换 生态与发展双向奔赴

记者李豌特约记者孙国富清澈的湖水、幽静的树林、红紫......更多>

699个!2023年度安徽省自然科学基金拟立项项目公示
699个!2023年度安徽省自然科学基金拟立项项目公示

据安徽省科技厅微信号消息,8月15日,安徽省科学技术......更多>

渭南高新区获陕西省科技厅专项奖励
渭南高新区获陕西省科技厅专项奖励

近日,陕西省科技厅对2022年实施创新驱动发展战略进步......更多>

关注

上海一男子虐猫埋尸时被邻居发现!所在公司:即刻开除,永不录用
上海一男子虐猫埋尸时被邻居发现!所在公司:即刻开除,永不录用
昨天(8月15日)上海一男子虐猫后掩埋尸体时被经常喂... 更多>
上海一男子虐猫埋尸时被邻居发现!所在公司:即刻开除,永不录用
昨天(8月15日)上海一男子虐猫后掩埋尸体时被经常喂... 更多>
马竞官方:科克右大腿肌腱损伤,已经开始接受治疗
直播吧8月17日讯马竞官方消息,科克右大腿肌腱近端处... 更多>
中煤新集公司救护大队强化安全意识 夯实安全根基
  为有效防范化解重大安全生产事故风险,8月14日,... 更多>
加速、加新、加温 建设银行福建省分行聚力做好灾后金融服务
加速、加新、加温建设银行福建省分行聚力做好灾后金融... 更多>
陕西省商南县发布高温黄色预警
商南县气象台2023年08月16日11时45分发布高温黄色预警... 更多>
蔡舒萌(关于蔡舒萌简述)
,你们好,今天0471房产来聊聊一篇舒萌,舒萌简述的文... 更多>
俄罗斯游戏工作室上线街头探索游戏《Neyasnoe》
俄罗斯游戏工作室ИЛЬЯМАЗО制作并发行的一款独... 更多>
职工占商务座脱鞋袜睡觉,乘警还提醒“不要打扰”?铁路部门道歉
8月15日,广铁集团广九客运段武广车队官方微博就网传... 更多>
项目为王,为河南带来什么
河南日报记者孙静整理核心提示经济增长靠什么?项目。... 更多>
农村取暖最佳方案(农村取暖)
大家好,最近小红发现有诸多的小伙伴们对于农村取暖最... 更多>
数读车市|经销商“半年考”:亏损超五成,超四成完成率不足80%
新车价格战叠加汽车消费需求恢复缓慢,今年上半年汽车... 更多>
娄底:聚焦“三个一” 以务实举措推动优化法治化营商环境专项行动走深走实
红网时刻新闻记者王媛通讯员吴祥辉娄底报道“感谢你们... 更多>