10月27, 2020

滴滴的防疫口罩识别技术和视觉比赛进展

1. 口罩识别技术

2020年新春伊始,新冠疫情席卷全国。为有效预防感染,防止疫情持续扩散,滴滴投入了多种AI视觉抗疫措施,督促司机进行积极防疫,保障司机自身和乘客的健康安全,包括口罩佩戴识别、视频消毒喷洒识别、消毒贴纸识别、图片消毒壶识别等,解决了出行运输行业面临车辆地域分布广泛、活动频率较高、活动时间跨度较长、司机数量庞大等现实问题,其中口罩佩戴识别最为典型。

口罩佩戴识别技术方案基于特征融合和分割监督相结合的人脸检测(DFS–Detection with Feature Fusion and Segmentation Supervision)和口罩属性识别两大模块组成,前者实现在图像中准确定位人脸区域的功能,后者在单个人脸区域的基础上利用注意力学习进一步分析人脸属性,从而判断人脸是否佩戴口罩。测试结果表明,上述技术方案在人脸佩戴口罩识别任务中,图像级准确率超过99.50%,可快速定位未按要求佩戴口罩的重点人员,有效解决了24小时复杂光照、多种类型遮挡、人脸姿态变化、不同距离人脸尺度、口罩款式类型多样化等实际应用中的难题,灵活适应不同场景环境。

口罩佩戴识别是一种人脸属性识别,它包括人脸检测技术和口罩属性分类技术两部分。由于人脸的特殊性,在目标检测技术的基础上发展了一系列的人脸检测算法。而口罩佩戴识别可通过目标分类技术来实现。因此人脸佩戴口罩识别涉及目标检测技术和分类技术。

目标检测技术是指从一幅场景中找出所有感兴趣的目标,确定它们的位置和类别,包括了检测和分类两个过程。近几年来深度学习技术飞速发展,目前基于深度学习技术的目标检测算法分为两类:一类是双阶段目标检测算法,另外一类是单阶段目标检测算法。常见的双阶段目标检测算法包括Faster R-CNN[1]、R-FCN[2]和FPN[3]等。该类算法在基于特征提取的基础上,有独立的网络分支生成大量的候选区域,然后对这些候选区域进行分类和回归,确定目标的准确位置框和类别。对于单阶段目标检测算法,常见的有包括YOLO V3[4]、SSD[5]和RetinaNet[6]等。该类算法直接生成候选区域的同时进行分类和回归。通常情况下,双阶段目标检测算法精度更高,而单阶段的目标检测算法速度更快。人脸检测是目标检测的一种特例。对于任意一幅输入的图像,采用一定的算法或策略对其进行搜索以确定其中是否含有人脸,如果存在人脸,则返回所有人脸的位置等信息。目标检测一般会检测多个类别,而人脸检测是二类问题,只检测人脸和背景两类。针对人脸类别的单一性、以及人脸的五官特殊性,在目标检测算法的基础上,发展出了大量的人脸检测算法,包括MTCNN[7]以三个级联网络实现快速人脸检测,并利用图像金字塔实现不同尺度人脸的检测、Face R-CNN[8]基于Faster R-CNN框架进行人脸检测、SSH[9]提出了对不同深度的卷积层分别进行检测以实现多尺度、FAN[10]提出了基于锚点级的注意力机制、PyramidBox[11]利用人脸的上下文信息提高遮挡人脸检测,即结合人头、身体等信息。上述算法主要解决不同于其他领域的人脸多尺度、遮挡等问题[12][13]。

目标分类技术按照目标的性质、用途等进行归类。基于深度学习的分类技术包括骨干网络和损失函数两部分。骨干网络有AlexNet[14]使用层叠的卷积层以及Dropout、Relu等;VGG-Net[15]使用更深的网络结构,探索了深度与性能的关系;GoogLeNet[16]在增加网络深度和宽度的同时减少参数,在多个尺寸上同时进行卷积再聚合,并使用1×1的卷积来进行升降维;ResNet[17]设计了一种短连接的结构,解决了神经网络加深后的退化问题。

点击查看原文>

本文链接:https://blog.jnliok.com/post/Nj8Nbb3IZPGWBaOe5lAJ.html

-- EOF --

Comments