设为首页|加入收藏
你的当前位置为:首页 >> 学术研究 >
改进的多尺度局部二值模式的表情识别方法
发布日期:2017-10-18 新闻来源: 正文字号
中北大学计算机与控制工程学院  芦敏 周海英
引言
  面部是情感交流的重要区域,人们可以通过面部表情的变化有效表达思想情感,也可以辨识情感状态,属于一种有效的非语言信息交流方式。表情识别研究具有重要的学术价值和应用前景,是人机交互、机器视觉、行为科学研究的重要方面,逐渐成为热点之一。
  人脸表情识别(facial expression recognition,FER)系统包括预处理、人脸检测与区域分割、特征提取和分类四个部分。其中的特征提取是人脸表情识别系统的一个重要环节,可以对图像进行多尺度、多方向的纹理信息检测的Gabor小波变换所需时间长,产生的特征维数巨大,选择不同的降维方法会影响准确性。相比于Gabor小波变换,LBP算法可以快速对特征进行提取,不仅计算简单,而且纹理识别力强[1]。传统LBP算子存在不足之处,对灰度变化敏感,受噪声影响较大,这是由于它是通过比较中心像素与邻域像素的灰度值的大小获取特征,因此导致识别效果并不理想。
本文中提出了一种改进的多尺度局部二值模式的人脸面部表情识别方法。基于多尺度局部二值模式,引入一个可调参数α于编码中,针对每个人脸表情图像分别拆分形成上下两个区域图像,对每个区域中的像素计算它的顺时针编码值和逆时针编码值,并分别形成各自的两个灰度直方图,最后将上述四个直方图合并连接以得到一个统一的直方图表达,作为图像的整体特征。此方法可以更好地表示人脸表情的纹理特征,并减少噪声和光照的影响。在JAFFE数据集、TFELD数据集以及CK+数据集上的实验结果均表明,改进的多尺度局部二值模式用于人脸表情识别具有更高的识别准确率。 
1 LBP算子理论
1.1传统的局部二值模式
  传统局部二值模式(Local Binary Pattern,LBP)用来描述图像局部的纹理特征,具有灰度不变性和旋转不变性等优点。传统LBP算子定义在3×3窗口内[1],当中心像素值小于邻域像素值时,就编码为1,否则编码为0。从左上角开始沿着顺时针方向读取数值,得到的8位二进制数,就是LBP编码值。将LBP编码值转换为十进制数,则得到该编码对应的LBP值。一个简单的传统局部二值模式编码过程如图1所示。 
  给定一个像素点(xc,yc),LBP编码如公式(1):
  LBPP=■s(gp-gc)2p,s(x)=1,x≥00,x<0(1)
  其中,P为邻域像素的个数,gc是中心像素的灰度值,gp是该像素每个邻域像素的灰度值。 
1.2多尺度局部二值模式
  传统LBP算子的参考区域和参考点数局限于3×3的区域内,Ojala等人对传统LBP进行扩展[1],用于表达不同尺度的图像特征分布信息。此方法可以对邻域半径和参考点数进行改变,将邻域由矩形变为圆形。由于圆形邻域的取样方式不能保证像素点每次都落在整数点上,通常使用双线性插值的方法对这些没有完全落在整数点的像素点进行灰度值计算。给定一个像素点(xc,yc),LBP编码如公式(2):