52
传感器与微系统
(Transducer
and
Microsyslem
Technologies)
2021
年第
40
卷第
6期
DOI
:
10.
13873/J.
1000-9787(2021)06-0052-05
基于卷积神经网络的单幅图像三维人脸重建
*
*
王育坚
,
李深圳
,
韩静园
,谭卫雄
(北京联合大学信息学院
,
北京100101)
摘
要
:
利用单幅二维图像进行三维人脸重建是图像处理研究领域的热点问题
。
受深度卷积神经网络
(CNN)
和三维形变模型
(3DMM)
的启发
,
提出一种采用
CNN
回归
3DMM
形状和表情参数的方法,进行三
维人脸重建
。
在
CNN
模型
VGG-16
的基础上设计一种
VGG-BN
的改进网络模型
,
通过在每个卷积层后加
入批归一化层
,
优化网络模型性能;并采用迁移学习方法
,
将预训练模型引入到
V
GG-BN
网络的训练中
。
将改进的网络模型在
300W-LP
数据集上训练
,
在
AFLW2000-3D
数据集上测试
,
并和现有方法进行了对比
分析
。
实验结果表明:改进的网络模型在人脸重建的准确性和泛化性方面都有一定的改善
,
重建人脸的形
状和表情效果较好。
关键词
:
三维人脸重建
;
三维形变模型
(3DMM)
;
卷积神经网络
(CNN)
;单幅图像
中图分类号
:
TP391.4
文献标识码
:
A
文章编号
:1000-9787(2021)06-0052-05
3D
face
reconstruction
of
single
image
bad
on
CNN*
WANG
Yujian,
LI
Shenzhen
,
HAN
Jingyuan
,
TAN
Weixiong
(
School
of
Information
,
Beijing
Union
University
,
Beijing
100101,China)
Abstract
:
Three-dimensional
face
reconstmction
using
a
single
two-dimensional
image
is
a
hot
topic
in
the
field
of
i澳洲龙虾多少钱一斤 mage
processing.
Inspired
by
deep
convolutional
neural
network
(
CNN
)
and
3D
niorphable
model
(3DMM
)
,
a
method
of
3D
face
reconstruction
using
convolution
neural
network
toregress
the
shape
and
expression
parameters
of
3
DMM
is
propod
.
Bad
on
the
convolution
neural
network
model
VGG-16,
an
improved
network
model
of
VGG-BN
is
designed
・
By
adding
batch
normalization
layer
after
each
convolulion
layer
,
the
performance
of
network
model
is
optimized.
The
pre-training
model
is
introduced
into
the
training
of
VGG-BN
network
by
transfer
learning
method.
The
improved
network
model
is
trained
on
300W-LP
dalal,
tested
on
AFLW2000-3D
datat,
and
compared
with
existing
methods.
Experimental
results
show桔子皮泡水喝有什么好处
that
the
improved
network
model
can
improve
the
accuracy
and
generalization
of
face
reconstruction
,
and
the
effect
of
face
reconstruction
is
better・
Keywords
:
3D
face
reconstruction
;
3D
morphable
model
(3
DMM)
;
convolutional
neural
network
(
CNN)
;
single
image
0
引言
个二维图像直接进行三维面部重建的方法
。
Feng
Y
等
人⑷设计了一个名为
UV
位置图的二维表示方法
,
记录
UV
空间中完整面部的三维形状
,
然后训练一个简单的卷积神
近年来
,
三维人脸重建成为计算机视觉
、
图像识别等研
究领域中的热点问题
。
三维人脸重建技术可以分为基于不
同视角的多幅图像的重建和基于单幅图像的三维人脸重
建。
现实生活中很多场合下
,
往往只有一张人脸图片可用
,
因此
,
基于单幅图像的三维人脸重建受到了国内学者的重
点关注。
经网络
(
convolutional
neural
network
,
CNN
),
从单个二维图
像中回归
。
Chang
F
J
等人⑸提岀了直接应用于人脸图像
强度
,
回归
3D
表情系数的
29D
向量的
ExpNet
CNN
模型
。
Tu
X
G
等人⑹针对
3D
标注训练数据短缺问题
,
提出一种
2D
辅助自监督学习方法
,
利用带嘈杂地标信息的无约束二
目前
,
针对单幅图像的三维人脸重建
,
传统方法有基于
模型的方法⑴
、
基于明喑形状恢复的方法⑵等
。
随着深度
学习被引入到三维人脸重建领域
,
并且取得了比传统方法
维人脸图像改善三维人脸模型的学习
,
在密集人脸对齐和
三维人脸重建方面取得了突出的效果
。
刘成攀等人⑺提出
一种基于自监督深度学习的人脸表征及三维重建方法
,
将二
维人脸的特征点信息映射到三维空间实现三维人脸重建。
更优异的效果
,
而逐渐成为主流的重建方法
。
Jackson
A
S
等人⑶提出使用
VRN(
volumetric
regression
networks)
从单
收稿日期
:2019-11-07
*
基金项目
:
国家自然科学基金资助项目(61572077)
第6
期
王育坚
,等:基于卷积神经网络的单幅图像三维人脸重建
53
在无约束条件下
,
人脸的表情
、
姿势
、
纹理和内在几何
存在很大差异
,
以上三维人脸重建方法仍然不够稳定
,
重建
的结果出现脸部不完整
、
重建脸型偏向平均脸型
、
表情不够
逼真等问题
。
针対上述问题
,
以卷积网络模型
VGG-16
⑻为
基础,设计一种
VGG-BN
的改进网络模型
,
用于回归三维形
变模型
(3D
morphable
model,
3
DMM)
参数进行三维人脸重
建
,
并在
300W-LP
数据集上训练
,
在
AFLW2000-3D
数据集
上进行测试。
13DMM
3DMM
是
Blanz
V
等人⑼提出的一种人脸线性表示模
型
。该模型使用形状向量
s
表示人脸的几何形状
,S=(X|,
y
1,z
1
,x
2
,-,y„,z
n
)
T
ei?
3n
,
其中口是人脸面部的顶点个
数是第
j
个顶点的三维坐标
。
该模型假设进行纹
理映射时,有效纹理值的数量等于顶点的数量
,
人脸的纹理
可通过纹理向量
7
•表示
,T=
(R
】,
Gi
,
血
,
…
,
G
”
,
B
”
)
T
6
疋
”
,
其中是第
i
个顶点对应的纹理值
。
利用
m
个
人脸样本数据构建一个可形变的人脸模型
,
每个人脸样本
由形状向量和纹理向量町表示
(
OwjWm)。
首先,
计算所有样本的平均形状向量
和平均纹理向
量亍
_
1
皿
—
1
空,n
⑴
其次
,
计算每个样本的形状向量和平均形状向量的差
值样本的纹理向量和平均纹理向量的差值
U=Tj
一亍
,
以及的协方差矩阵
C
s
和
口
的协方差矩
阵G
-
m
AS,AS
-
m
;
,C
r
=^
AT
;
(2)
最后,分别计算协方差矩阵的特征值和特征向量
,
按特
征值降序选取前
m
个最大的特征值
y=(yi
,丁
2,
…
,
7m)
和
5
=(
玄
…
,丸)
,
以及对应特征值顺序的特征向量孑
=
(si
,血,
…
,
sj
和
:
=(
,
切
…
厶)
,
使用主成分分
W(
princi
pal
component
analysis
,
PCA
)
对特征向量
:
和
7
构成的正交
坐标系进行基础变换
。模型公式如下
ni-1
m-1
Snew
=g
+
X
丐号
,
7
;
叶=亍
+
Y
0
旳
(3)
;=|
j=
其中
,
垃,
Re
肥
“
。
向量
<5,
p
是基向量组合参数
,
且符
合高斯分布
P(c?
)
=exp[
-寻
E
乂
尸],
2
心
気
7j
⑷
P(0)
=exp[
-y
)
2]
当模型具有纹理部分时
,
上述
3DMM
往往拟合效果不
够好
。
因此
,
重建人脸时通常只考虑人脸的形状部分
,
当需
要纹理时
,
一般直接从照片中提取纹理进行贴合
。
针对
3DMM
对人脸表情处理的不足
,
Cao
C
等人问提出了
FaceWarehou
人脸表情数据库,并将其引入到
3DMM
中
。
人脸线性模型可以扩充为
m-1
n
—1
Sg”
=5+
X
a
J
Sj
+
X
匂勺
(
5)
j=i
j
=i
式中
勺为在
FaceWarehou
数据上
,
通过
PC
A
得到的表情
协方差矩阵的特征向量
,
勺为对应的表情参数丿为使用的
数据量数
,
至此人脸重建问题可以转化为求解形状参数
a
和表情参数
<P
的问题。
在获得三维面部形状之后
,
可以使用弱透视投影
将三维面部投影到二维图像平面上
fl
0
0
P
V=/-
(
*
Sr
new
)
+t,Pr
=
(6)
(
0
1
0
丿
式中
y
存储投影到二维平面上的三维顶点的二维坐标
,
/
为比例因子,
P,
为正交投影矩阵,
R
为由
9
个参数组成的
投影矩阵,
t
为平移向量
。
改进模型中,
S
采用
BFM
1111
的
40
个基,
e
采用
FaceWarehou
的
10
个基
,
将这些参数放在一
起形成具有
62
个参数的向量
P
=
[/,/,/?,a,]T
。
研究的主
要目标就是使用深度
CNN
从单幅图像中预测对应的三维
人脸的参数
P,
以重建带有表情的三维人脸形状。
2
改进的
CNN
VGG-BN
2.
1
概述
CNN
已经被应用于三维人脸重建
,
Dou
P
F
等人
〔
⑵在
VGG-Face
人脸识别网络的基础上,增加了一个子
CNN(fu-
sion-CNN)
,
提出了端到端的三维人脸重建网络
(
UH-
E2FAR)
O
Tuan
Tran
A
等人]⑶使用深度残差网络
ResNet
-
101
回归
3DMM
形状和纹理参数,用于三维人脸重建。
Zhu
X
Y
等人[⑷利用级联
CNN(3DDFA)
回归
3DMM
参数
,
用于
大姿势的人脸对齐和三维人脸重建。
目前使用
CNN
重建三维人脸主要有两种方式,一是在
现有网络如
AlexNet,VGGNet,DenNet
等基础上增加网络
层数或修改首席设计师 模型结构
。
另一种是修改网络参数
,
对网络中
算法进行改进
,
来提升网络模型的性能
。
本文采用第二种
改进思路,通过在卷积操作之后
,
激活函数
ReLU
之前加入
批归一化(
batch
normalization
,
BN)
层,更改网络全连接层参
数
,
调整优化器
,
使用迁移学习
,提升网络模型对参数的预
测的性能。
2.2
VGG-BN的网络结构
改进方法设计的
VGG-BN
网络模型以
VGG-16
网络为
骨架
,
网络模型包含
13
个卷积层
、
5
个最大池化层
、
3
个全
连接层
,
网络结构如图
1
所示
。
卷积层网络参数如表
1
所示。
54
传感器与微系统
第
40卷
onvl_l
Convl_2
Conv2
」
Conv2_2
Conv3
」
Conv3_2
Conv3_3
Conv4_l
Conv4_2
Conv4_3
Conv5_l
Conv5_2
Conv5_3
图
1网络结构
表
1卷积层网络参数
卷积层
输入通道数
输出通道数
卷积核
步长填充
Convl_l
3
64
3
11
Convl_264
64
31
1
Pool
-
2
2
-Conv2_l
64
128
3
1
1
Conv2_2
128128
31
1
Pool2
2
-
Conv3_l
128
2563
11
Conv3_2
2562563
11Conv3_3
256
256
31
1
Pool
-一
2
2一
Conv4_l256
512
3
1
1
Conv4_2
512
512
31
1Conv4_3
512
512
31
1
Pool一
一
2
2一
Conv5_l512
5123
1
1
Conv5_2
5125123
1
1
Conv5
_3
512
512
31
1
Pool
-
-
2
2
在卷积层中,每个卷积核的大小为
3x3,
步长为
1,
填
充为
1,
即卷积之后图像大小不变
。
每个卷积层之后紧跟一
个激活函数
ReLU,其计算公式为
R
=max(0
,y)
(7)
R
为激活函数的输出值
』
为卷积层的输出值
。
Re-
函数的优点在于:当输入值
y
大于
0
时,它的导数恒为
1,
保持梯度不衰减
,
有效缓解了梯度消失问题
,
加快了网路
收敛速度。
对
VGG-16
网络结构的改进点,是在激活函数
ReLU
之
BN
层
,
即对输入激活函数的数据进行批量标准化
处理,使输入数据的均值为
0,
方差为
1
。
假设
BN
层输入数
0
=
{
衍严
2,
…
皿丨
,
其中
m
是单批次输入数据个数,
1
(8)
(9)
X
“
:
=
xi
1______
—
◎
(10)+s
咎"
。
rm
+
(H)
0,
设置的极小正数
,
取值为
1
x
5
,y
为尺度因子托为平移因子
。
引入
"0
的原因是咎
经过式
(
10)
归一化后被限制在正态分布下,使得网络表达
能力下降
。
丁,卩可通过梯度下降法求得。
在池化层中,每个卷积核的大小为
2x2
。
池化层的作
用是从小区域的特征中剔除不重要的特征
,
提取新的特征
信息
。
池化方式常用的有最大值池化和平均值池化,
改进
方法结构采用的是最大值池化方式
,
实现过程见图
2。
图
2最大值池化示意
网络模型包含
3
个全连接层
,
前两个全连接层都是
4096
个通道
,第三个全连接层通道原本是
1
000,
代表
1000
个类别
。
因为本文预测目标是
62
个参数
,
此处将其
改为
62
。
前两个全连接层之后紧跟
ReLU
激活函数和
Dropout
函数
。
Dropout
函数的作用是在网络训练过程中
,
按
照一定的概率
P
将神经元从网络中丢去
,
这样使网络模型
的泛化能力更强
,
让网络不会太依赖于某些局部特征
。
改
进模型
Dropout
函数的失活概率p
=0.5o
3实验与分析
3.1实验数据
目前
300W-LP
和
AFLW2000-3D
数据集被广泛用于人
脸对齐和人脸重建领域
。
300W-LP
是由
Zhu
X
Y
等人
[
⑷
采用其提岀的方法生成
61,225
个大型样品
,
其进一步通过
翻转将其扩展到
122,450
个样品
。
每个样品包括二维人脸
图像和对应
3DMM
系数
。
采用其中
636252
张图片和对应
的
3DMM
系数作为训练集
,51
602
张图片和对应的
3DMM
系数作为训练时的验证集。
将
AFLW2000^D
tl4
:
作为独立测试集
。
AFLW2000-3D
是选择
AFLW
的前
2000
张图片构建而成
,
每张图片都有对
应的
3DMM
参数和
68
个
3D
人脸特征点。
300W-LP
数据库中原始二维图像大小是
450
像素
x
450
像素,根据图像对应的三维信息文件中人脸区域的二维
坐标
,
将图像中人脸区域裁剪并调整大小为
150
像素
X150
像素
。
对训练数据和验证数据集进行归一化
,
将所有数据
都映射为均值为
0,
方差为
1
。
这里使用均值方差归一化方
法
,即
X^e=^-x
mem
)/x
atd
(12)
式中斗喰为均值,%为方差
,
兀
』
为归一化后的数据
,即
送入
CNN
的数据
。
对于训练数据和验证数据中的目标参
数
P
也进行均值方差归一化,即
Pgale
=
(
P
-
Pmean
)
久
(13
)
并将均值
P
ull
.
m
和方差P
ad
保存
。
因此,对于网络预测
输出的参数需要进行反归一化
,即
卢=人
*
P
“
d
+
九皿
(14)
式中
Em
为深度
CNN
直接输出的结果/为预测出的参数。
式中
LU
前加入
据为那么
式中&为避免分母为
10-
第6期
王育坚
,等:基于卷积神经网络的单幅图像三维人脸重建
55
3.2评价指标
本文采用定性评价和定量评价两种评价指标
。
其中
,
定性评价是对重建的三维人脸形状和表情的直观观察
,
定
量评价是参考文献
[
5
]
中评价方法
,
首先
,
使用迭代最近
点
(
iterative
clost
points,ICP)
算法来找到重建的
3D
人脸
顶点和真实
3D
人脸顶点之间相应最近点
,
然后计算相应最
近点之间的归一化均值误差
(
normalized
mean
error,
NME)
,
人脸区域的边界框大小用作归一化因子,
NME
值越小
,
说
明重建效果越精确。
ICP
算法步骤
:
1)
在模型重建的顶点集
V
中取顶点
;
e
认
2)
在真实顶点集人计算对应顶点备
w
匕
,
使|乜-备||
值最小
,
求得旋转矩阵
R
和平移矩阵
“
3
)
对
v,
进行平移和
旋转得到新的对应点
v'^Rv,
+/
;
4
)
按式
(
15)求距离
d=^~
X
II
<-v
gi
2
(15)
式中
n
为顶点集中顶点个数
。
若
d
小于给定阈值,
则停
止迭代
,
否则返回步骤
(2),
直到满足收敛条件。
当
ICP
算法执行完毕后
,
求得预测顶点集
0
对应的顶
点集计算NME
NME
=
(—n
(讥一%)
2)
/lien
(16)
式中
lien
=
y
width
x
height
,
height
为人脸区域的长度,
width
为人脸区域的宽度
。
3.3
实验过程
实验使用的硬件设备如下
:
处理器为
Intel
Core™i9-
9900
K
CPU
@3.6GHz
;
内存
8
GB
;
系统为
64
位
Ubuntu
1&04.3
LTS
操作系统
,
运行环境
Python3.
6,
运行软件
PyCharm,
—
块
NVIDIA
GeForce
RTX
2080
Ti
GPU,
硬盘大小
200
GBO
为减少网络训练时间和提高网络训练效率
,
在训练过
程中采用迁移学习方法,
引入了预训练好的
VGG-16
模型
参数
。
预训练好的
VGG-16
模型是通过
ImageNet
数据库
中的
100
万幅图像训练而成,具有较强的深度特征学习能
力
,
其拥有大量已经训练完成的参数和权重
,
特别是卷积
层关于图像的曲线
、
边缘
、
轮廓的特征提取具备较强的
能力。
改进模型基于
PyTorch
深度学习框架编码完成卷积网
络结构
。
通过实验对比
,
网络选择使用
Adam
优化器
,
初始
学习率
ba_lr
设为
0
.
0001,
学习率按
epoch
调整,
当
3
>
epoch
>
=1,
ba_lr
=ba_lr
*
0.
01
,
当
epoch
>
=3,ba_lr
=ba_lr
*
0.
001,
动量设为
0.9,
L2
正则化权重衰减参数
设置为
1
xlO-
5
,
Vl|
练集批处理大小为
64,
验证集批处理大
小为
8,
epoch
总数设为
100。
对于网络回归问题
,
常用的损失函数是回归参数之间
的欧氏距离
(
parameter
distance
cost,PDC)
,即
L(P)=寻
(17)
式中
P,
为卷积网络的预测结果,匕为输入图像对应的标
签参数
。
但在实验中发现
,
通过直接使用式
(
17)
作为损失
函数
,
重建效果并不好
,
主要由于三维人脸的重建是将预测
参数代入式
(
6)
中
,
计算出顶点之后
,
进行重建
,
直接预测出
的参数对于计算顶点的影响程度不同
,
导致某些参数稍微
预测不准确就会产生很大的误差
。
为了使拟合出的
3DMM
参数重建出更接近于真实的三维人脸形状
,
选择拟合预测
的顶点和真实的三维人脸顶点的距离(
vertex
distance
cost,
VDC)
作为损失函数
,即
L(P)
=寻
丿(
。
")
—
匕
(PR?
(18)
式中
讥(斤)为将预测参数
”代入式
(
6)
中求的顶点,
%(尺)为真实的顶点。
将改进的
VGG-16
网络以及使用迁移学习和使用
式
(
18)
作为损失函数的模型集记为
VGG-BN,
将未改进的
VGG-16
网络以及使用迁移学习和使用式
(
18)
作为损失函
数的模型集记为
VCG-preVDC,
将未改进的
VCC-16
网络以
及使用迁移学习和使用式
(
17)
作为损失函数的模型集记为
VGG-prePDC,
将未改进的
VGG-16
网络以及未使用迁移学
习和使用式
(
17)
作为损失函数的模型集记为
VGG-PDC
。
文中只详细介绍
VGG-BN
的具体训练参数,其余模型不再
赘述。
3.4
实验结果分析
从图
3
中
,
可以很明显地看出改进后的网络
VGG-BN
在验证集上的损失比未改进网络结构的
VGG-preVDC
低的
多,验证了改进方法的可行性。
图
3训练过程中在验证集上的损失对比
图
4
中第一列为从测试集
AFLW2000-3D
抽取的二维
图像,第二列
、
第三列为改进方法
VGG-BN
重建三维人脸的
正面图和侧面图
,
第三列
、
第四列为文献
[
14
]
方法重建三维
人脸的正而图和侧面图
,
第五列
、
第六列为文献
[
5
]
方法重
建三维人脸的正面图和侧面图
。
为保证对比的公平性
,
文
献
[
5
]
和文献
[
14
]
的重建结果均由对应文献公布的测试程
序生成
。由图
4
中可以看出
,
改进方法重建的人脸形生日数字红包 状比
文献
[
5
]
的重建结果更加平滑
,
重建的人耳部分更加完整
,
同时文献
[
5
]
重建的人脸具有明显条纹;对比文献
[
14
]
,
改
进方法和文献
[
14]
的部分重建结果相差不够明显
,
但图
4
第一行中改进方法重建的人脸的嘴张开的大小更加合理,
同时改进方法重建结果的面部细节相对更加丰富,
尤其在
56
传感器与微系统
第
40卷
眼部位置
。
图
4
本文方法
VGG-BN
和文献
[
14
]
、
文献
[
5
]对比结果
由于改进方法和文献
[
14
]
方法在测试时均使用
dlib
人
脸检测器进行人脸特征检测
,
同时
AFLW2000-3D
数据集中
存在人脸角度偏转较大的图片
,
该部分图片无法检测到人
脸
,
除去无法检测到人脸的图片,共使用
AFLW2000-3D
数
据集中的
1496
张图片进行测试评估
。
从图
5
中可以看出
,
在使用同样数量单幅图像进行重建时
,巨大的近义词
VGG-prePDC
的
NME
值远低于
VGG-PDC
的
NME
值,这说明改进方法使用
迁移学习提高了模型训练漫画的启示 效率
;
VGG-preVDC
的
NME
值远
低于
VCC-prePDC,
这说明改进方法提出的损失函数促进了
模型的学习效率;同时
VGG-BN,VGG-preVDC
的
NME
值都
低于文献
[
14
]
的
NME
值
,
并且
VGG-BN
的
NME
是最低的
,
表明对模型的改进是可行的。
NME值
图
5
在
AFLW2000-3D
的累积误差分布
(
CED
)
曲线
(
来自
AFLW2000-3D
数据集的
1496
张图像)
从表
2
中可以看岀,
在测试数据集上
,
改进模型
VGG-
BN
的平均
NME
值最低
,
比
VGG-preVDC
的平均
NME
值低
0.
12,
比文献
[
14
]
的平均
NME
值低
0.
15,
重建的效果明显
改善
。
通过实验和比较分析
,
可以看出
,
相对于原来的
VGG-16
网络
,
改进后的
VGG-BN
网络对单幅图像的图像特
征学习能力更强
,
泛化能力更好。
表
2
在
AFLW2000-3D
上的平均NME
模型
VGG-BN
VGG-preVDC
文献
[
14
]VGG-prePDC
VGG-PDCNME/%
2.08
2.20
2.233.67
6.84
4结束语
本文介绍了一种基于
CNN
的单幅图像三维人脸重建
方法,改进网络模型
VGG-BN
以
VGG-16
为基础
,
在每个卷
积之后添加批归一化层设计
,
预训练模型引入迁移学习技
术
,
直接从二维图像中回归
3
DMM
形状和表情参数,进行三
维人脸重建
。
通过在
AFLW2000-3D
数据集上进行实验和
比较
,
验证了改进方法进行三维人脸重建的有效性。
下一
步将结合纹理
、
形状
、
表情重建出逼真的
3D
人脸。
参考文献:
[1]
杨振
,
董洪伟,杜星悦•基于单张图像的三维人脸重建
[J].
传
感器与微系统
,2018,37(8)=140
-142,146.
[2]
胡阳明
,
周大可
,
鹿乐
,
等•基于形变模型的三维人脸快速重
建改进算法
[
J]
•
吉林大学学报(信息科学版
)
,2012,30(6)
:
604
—60&
[3
]
JACKSON
A
S
,
BULAT
A
,
ARGYR1OU
V
,
et
al.
Large
po
3D
face
reconstruction
from
a
single
image
via
direct
volumetric
CNN
regression
[
C
]//
Proceedings
of
the
IEEE
International
Conference
on
Computer
Vision
,2017
:
1031
—1039.
[4]
FENG
Y
,
WU
F,SHAO
X,et
al.
Joint
3D
face
reconstruction
and
den
alignment
with
position
map
regression
network
_C~/
Pro摩羯和天秤
ceedings
of
the
European
Conference
on
Computer
Vision
(
EC-
CV)
,2018
:
534
-551.
[5]
CHANG
F
J,TRAN
A
T,HASSNER
T,et
al.
ExpNel
:
Landmark
・
free
,
deep
,
3
D
facial
expressions
[C~
//
2018
13th
【
EEE
Inter
national
Conference
on
Automatic
Face
&
Gesture
Recognition
,
IEEE,
2018
:
122
-129.
[6]
TU
X,ZHAO
J
,
JIANG
Z
,
et
al.
Joint
3D
face
reconstruction
and
den
face
alignment
from
a
single
image
with
2D-assisted
lf
supervid
leamingf
J
」
.
arXiv
preprint
arXiv
:
1903.
09359
,2019.
[7]
刘成攀
,
吴斌
,
杨壮•基于自监督深度学习的人脸表征及三维
重建
[
J]
•传感器与微系统
,2019,38(9)
:
126
-128
,133.
[8]
SIMONYAN
K,ZISSERMAN
A.
Very
deep
convolutional
networks
for
large-scale
image
recognition
[
J
]
・
arXiv
preprint
arXiv
:
1409.
1556,2014.
I
9
]
BLANZ
V
,
VETTER
T.
A
morphable
model
for
the
synthesis
of
3D
faces
[
C
]//
Proceedings
of
the
26th
Annual
Conference
on
Com
・
puter
Graphics
and
Interactive
Techniques,
1999
:
187
—194.
[10]
CAO
C,WENG
Y,ZHOU
S,et
al.
Facewarehou:
A
3
D
facial
ex
pression
databa
for
visual
compuling[
J
].
IEEE
Tr目标职业分析 ansactions
on
Visualization
and
Computer
Graphics
,2013
,20(3)
:
413
—425.
[11]
PAYSAN
P,KNOTHE
R,AMBERG
B,et
al.
A
3D
face
model
for
po
and
illumination
invariant
face
recognition
[
C
]
//2009
the
Sixth
IEEE
International
Conference
on
Advanced
Video
and
Signal
Bad
Surveillance
,
IEEE
,2009
:
296
—301.
[12]
DOU
P
F,SHAH
S
K,KAKAD1ARIS
I
A.
End-to-end
3D
face
re
・
construction
with
deep
neural
networks
[
C
]
//
Proceedings
of
the
IEEE
Conference
on
Computer
Vision
and
Pattern
Recognition
,
2017
:
5908
-5917・
[13]
TUAN
TRAN
A,HASSNER
T,
MASI
I,et
singrobust
and
discriminative
3
D
moiphable
models
with
a
very
deep
neural
network
[
C
]
//
Proceedings
of
the
IEEE
Conference
on
Computer
Vision
and
Pattern
Recognition,
2017
:
5163
—5172.
_
14]
ZHU
X
,LEI
Z
,
LIU
X,et
al.
Face
alignment
across
large
pos:
A
3
D
solution
[
C
]
//
Proceedings
of
the
IEEE
Conference
on
Com
puter
Vision
and
Pattern
Recognition
,2016
:
146
—155.
作者简介:
王育坚
(1963-)
,
男
,
教授
,
研究领域为图像处理
、
三维可视化
。
李深圳
(1991
-),
男
,
通讯作者
,硕士研究生
,
研究方向为图像
处理。
本文发布于:2023-04-15 08:54:31,感谢您对本站的认可!
本文链接:https://www.wtabcd.cn/fanwen/fan/89/831705.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |