如何用labelme快速制作人脸关键点数据集

释放双眼,带上耳机,听听看~!
本文介绍如何使用labelme软件快速制作高质量的人脸关键点数据集,以支持人脸关键点检测模型的训练与优化。了解如何利用labelme快速标注人脸关键点,以及相关的json文件格式。

关键词: 人脸关键点 、 labelme 、 数据集 、 快速制作 、 批量制作

前言

  人脸关键点检测是计算机视觉中的重要任务,它在人脸识别、表情识别、人脸美化等应用中发挥着关键作用。然而,为了训练高效准确的人脸关键点检测模型,我们需要大量的标注数据集。在本篇博客中,我们将介绍如何快速制作高质量的人脸关键点数据集,以支持后续模型的训练与优化。

关键点标注信息展示

  在这里向大家介绍一款简单常见的关键点标注程序:labelme,大家可以通过这款软件进行关键点标注。在这里我以帅气的郭富城为例子进行标注五官关键点以及相应的json文件:

如何用labelme快速制作人脸关键点数据集

{
  "version": "5.2.1",
  "flags": {},
  "shapes": [
    {
      "label": "0",
      "points": [
        [
          74.02476780185759,
          130.80495356037153
        ]
      ],
      "group_id": null,
      "description": "",
      "shape_type": "point",
      "flags": {}
    },
    {
      "label": "1",
      "points": [
        [
          126.656346749226,
          136.687306501548
        ]
      ],
      "group_id": null,
      "description": "",
      "shape_type": "point",
      "flags": {}
    },
    {
      "label": "2",
      "points": [
        [
          101.26934984520125,
          169.1950464396285
        ]
      ],
      "group_id": null,
      "description": "",
      "shape_type": "point",
      "flags": {}
    },
    {
      "label": "3",
      "points": [
        [
          101.57894736842104,
          194.89164086687308
        ]
      ],
      "group_id": null,
      "description": "",
      "shape_type": "point",
      "flags": {}
    },
    {
      "label": "4",
      "points": [
        [
          45.8513931888545,
          134.82972136222912
        ]
      ],
      "group_id": null,
      "description": "",
      "shape_type": "point",
      "flags": {}
    },
    {
      "label": "5",
      "points": [
        [
          162.26006191950466,
          143.49845201238392
        ]
      ],
      "group_id": null,
      "description": "",
      "shape_type": "point",
      "flags": {}
    }
  ],
  "imagePath": "300.jpg",
  "imageData": "",
  "imageHeight": 300,
  "imageWidth": 240

标注信息获取

  分析【关键点标注信息展示】的信息,我们可以得到其组成为version 、 flags 、 shapes 、 imagePath 、 imageData 、 imageHeight 、 imageWidth 。 其中的【version 、 flags】 为固定信息,【shapes】中的信息为标注的关键点信息 , 【imagePath 、 imageData 、 imageHeight 、imageWidth】分别为图像名称 、 图像Base64编码字符串 、 图像的高 、 图像的宽。而在【shapes】中的信息仅label和points是变动的,分布代表类别和坐标点。

关键点检测

  既然需要制作人脸关键点数据集,所以人脸关键点的检测是必不可少的,我们仍然是通过开源项目进行人脸关键点检测。在这里我们选择的是人脸关键点较少的开源项目检测:【mediapipe】在这里大家可以翻阅我往期关于【mediapipe】介绍。例如:

  1. 【特效】对实时动态人脸进行马赛克及贴图马赛克处理及一些拓展
  2. 【姿态估计】从理论到实践逐步分析讲解传统姿态估计算法
  3. 【实操:人脸矫正】两次定位操作解决人脸矫正问题
  4. 一起来学MediaPipe(二)人脸面网格
  5. 一起来学MediaPipe(二)人脸面网格

在这一步骤中我们核心目的是为了使用mediapipe包对人脸关键点检测后输出:

import cv2
import mediapipe as mp

mp_face_detection = mp.solutions.face_detection
mp_drawing = mp.solutions.drawing_utils


def get_face_info(image):
    image.flags.writeable = False
    image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
    results = face_detection.process(image)
    facial_axis = None
    if results.detections:
        for detection in results.detections:
            facial_axis = detection.location_data.relative_keypoints
    return facial_axis


def AxisTransformation(w, h, img_fa):
    # 左眼
    left_eye = [img_fa[0].x * h, img_fa[0].y * w]
    # 右眼
    right_eye = [img_fa[1].x * h, img_fa[1].y * w]
    # 鼻子
    nose = [img_fa[2].x * h, img_fa[2].y * w]
    # 嘴巴
    mouth = [img_fa[3].x * h, img_fa[3].y * w]
    # 左耳
    left_ear = [img_fa[4].x * h, img_fa[4].y * w]
    # 右耳
    right_ear = [img_fa[5].x * h, img_fa[5].y * w]

    points = [[left_eye], [right_eye], [nose], [mouth], [left_ear], [right_ear]]
    labels = ["left_eye", "right_eye", "nose", "mouth", "left_ear", "right_ear"]

    return points, labels

image信息获取

  通过关键点标注分析我们可以获得在image信息中需要填入的信息,其中图像的尺寸和名称较为轻易获取,我们在批量读取图像的时候通过for循环可以解决,在这里我们着重解决BASE64编码字符串的获取问题:

def get_imageData(img):
    # 将图像数据转换为Base64编码字符串
    image_data_binary = cv2.imencode(".jpg", img)[1].tobytes()
    image_data_base64 = base64.b64encode(image_data_binary).decode()
    return image_data_base64

shapes信息获取

  由于一张图内的关键点往往不是一个,是需要多个关键点组合而成的,我们从上述的分析中也可以得到shapes信息中改变的也仅仅为lebel和points信息,而group_id、description、shape_type和flags参数爆出不变。同时每个关键点的信息也都是有如下关键信息所示,我们可以这样定义一个函数进行获取shapes信息:

def get_shapes_data(points, label):
    info = {
      "label": label,
      "points": points,
      "group_id": None,
      "description": "",
      "shape_type": "point",
      "flags": {}
    }
    return info

生成标注文件

在批量生成标注数据时,我们假定是通过文件夹中的图像进行处理,基础逻辑流程为:

graph TD
开始 --> 加载人脸检测模块
开始 --> 设定人脸数据集路径
加载人脸检测模块 --> 对数据集路径for循环处理
设定人脸数据集路径 --> 对数据集路径for循环处理
对数据集路径for循环处理 --> cv2读取数据集下的图像
cv2读取数据集下的图像 --> 获取图像的关键点坐标
获取图像的关键点坐标 --> 判定是否存在五官信息
判定是否存在五官信息 --> 不存在五官信息
不存在五官信息 --> 结束此轮循环
结束此轮循环 --> 结束

判定是否存在五官信息 --> 存在五官信息
存在五官信息 --> 获取原始图像的尺寸信息
存在五官信息 --> 获取五官关键点坐标以及对应的名称
存在五官信息 --> 获取图像的BASE64信息
获取原始图像的尺寸信息 --> 组成JSON信息填写图像基础信息以及固定信息json_base
获取图像的BASE64信息 -->  组成JSON信息填写图像基础信息以及固定信息json_base

获取五官关键点坐标以及对应的名称 -->  五官个数将五官关键点信息组成list:shapes_infos

五官个数将五官关键点信息组成list:shapes_infos --> 组成JSON信息填写图像基础信息以及固定信息json_base
组成JSON信息填写图像基础信息以及固定信息json_base --> 结束此轮循环

可以通过下面这段代码实现上述逻辑,我们使用四大天王的照片进行测试实验:

if __name__ == "__main__":
    img_path = "./img/"
    with mp_face_detection.FaceDetection(model_selection=0,
                                         min_detection_confidence=0.5) as face_detection:
        for name in os.listdir(img_path):
            src_img = cv2.imread(img_path + name)  # 读取原始图像
            facial_axis = get_face_info(src_img)  # 五官坐标集

            if facial_axis is not None:  # 判定关键点坐标是否存在
                Height, Width, _ = src_img.shape
                imageData = get_imageData(src_img)  # 获取图像的imageData信息
                # 标签的基础信息
                json_base = {
                    "version": "5.2.1",
                    "flags": {},
                    "shapes": None,
                    "imagePath": name,
                    "imageData": imageData,
                    "imageHeight": Height,
                    "imageWidth": Width
                }
                points, labels = AxisTransformation(Height, Width, facial_axis)  # 获取关键点坐标, 类别名称
                # 获取关键点信息
                shape_infos = []
                for epoch in range(len(points)):
                    shape_info = get_shapes_data(points[epoch], labels[epoch])
                    shape_infos.append(shape_info)
                # 对基础款进行修改
                json_base["shapes"] = shape_infos
                json.dump(json_base, open('./img/%s.json' % name[:-4], 'w'), indent=2)

生成后观察文件夹下图像及标注文件:

如何用labelme快速制作人脸关键点数据集

使用labelme检验标注结果:

如何用labelme快速制作人脸关键点数据集
如何用labelme快速制作人脸关键点数据集
如何用labelme快速制作人脸关键点数据集
如何用labelme快速制作人脸关键点数据集

结语

  周五了,匆忙中实现了一个人脸关键点数据集的快速制作脚本,仅以此篇以飨读者!这样大家可以快速制作自己的关键点数据集了,大家也可以使用Dlib包制作自己的人脸关键点或者其他开源项目制作自己的关键点数据集。

本网站的内容主要来自互联网上的各种资源,仅供参考和信息分享之用,不代表本网站拥有相关版权或知识产权。如您认为内容侵犯您的权益,请联系我们,我们将尽快采取行动,包括删除或更正。
AI教程

Improved Denoising Diffusion Probabilistic Models (DDPM) and Its Application in Image Generation

2023-12-20 18:59:14

AI教程

如何使用stable diffusion 1.4制作真人动漫头像

2023-12-20 19:08:14

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索