python+mediapipe+opencv实现手部关键点检测功能(手势识别)

2023年5月25日下午4:10 • 人工智能概览

实现手部关键点检测功能和手势识别，可以使用Python、MediaPipe和OpenCV这三个工具。下面是实现的具体步骤：

1. 确定环境

首先需要安装OpenCV和Mediapipe的库，可以使用pip命令进行安装：

# 安装OpenCV
pip install opencv-python

# 安装MediaPipe
pip install mediapipe

2. 导入依赖库

在Python脚本中导入所需的库：

import cv2
import mediapipe as mp

3. 定义MediaPipe的关键点检测类

MediaPipe提供了一个通过姿势解析器的类，可以使用这个类来检测人体姿态的关键点。在这里，我们定义了一个HandDetector类，它使用MediaPipe的手部解析器和方向解析器来检测手部关键点。

class HandDetector:
    def __init__(self, static_image_mode=False, max_num_hands=2, min_detection_confidence=0.5, min_tracking_confidence=0.5):
        self.static_image_mode = static_image_mode
        self.max_num_hands = max_num_hands
        self.min_detection_confidence = min_detection_confidence
        self.min_tracking_confidence = min_tracking_confidence

        self.mp_drawing = mp.solutions.drawing_utils
        self.mp_hands = mp.solutions.hands

        self.hands = self.mp_hands.Hands(self.static_image_mode, self.max_num_hands, self.min_detection_confidence, self.min_tracking_confidence)

    def find_hands(self, image, draw=True):
        imageRGB = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
        self.results = self.hands.process(imageRGB)

        if self.results.multi_hand_landmarks:
            for handLms in self.results.multi_hand_landmarks:
                if draw:
                    self.mp_drawing.draw_landmarks(image, handLms, self.mp_hands.HAND_CONNECTIONS)
        return image

    def find_position(self, image, hand_no=0, draw=True):
        landmarks = []
        if self.results.multi_hand_landmarks:
            hand = self.results.multi_hand_landmarks[hand_no]
            for id, lm in enumerate(hand.landmark):
                h, w, c = image.shape
                cx, cy = int(lm.x * w), int(lm.y * h)
                landmarks.append((id, cx, cy))
                if draw:
                    cv2.circle(image, (cx, cy), 5, (255, 0, 0), cv2.FILLED)
        return landmarks

在这里我们定义了手掌检测的一些参数，包括是否检测静态图像、可以检测的最大手数、最小检测置信度、最小跟踪置信度，同时也定义了一些必要的变量、函数来处理图像获取手内各点位置。

4. 创建手势识别函数

我们可以使用定义的HandDetector类和OpenCV来创建一个函数，该函数将图像中检测到的手势标识以及每个手的关键点位置输出。

def gesture_recognition(frame):
    detector = HandDetector()
    img = detector.find_hands(frame)
    landmarks = detector.find_position(img)

    if len(landmarks)!=0:
        """
        在这里输出手势动作
        """
        pass

    for i in range(len(landmarks)):
        """
        在这里输出每个关键点的位置
        """
        pass

    return img

示例1：手势分类

在示例1中，我们可以通过判断关键点的位置和数量，来判断手势的类别。具体实现是：检测名为“Rock”、“Scissors”和“Paper”的三种手势，若五个手指同时张开或同时闭合，则为“Rock”手势；若四个手指张开且留出空隙，则为“Scissors”手势；若四个手指合在一起，则为“Paper”手势。

def gesture_classification(frame):
    detector = HandDetector()
    img = detector.find_hands(frame)
    landmarks = detector.find_position(img, draw=False)

    if len(landmarks)!=0:
        fingers = []

        # 拇指
        if landmarks[finger_tip_indexes['thumb']][1] < landmarks[mcp_indexes['thumb']][1]:
            fingers.append(1)
        else:
            fingers.append(0)

        # 其他手指
        for finger in range(1, 5):
            if landmarks[finger_tip_indexes[finger]][2] < landmarks[tip_indexes[finger-1]][2]:
                fingers.append(1)
            else:
                fingers.append(0)

        if fingers == [1, 1, 1, 1, 1]:
            # 手势为Rock
            pass
        elif fingers == [0, 0, 0, 0, 0]:
            # 手势为Rock
            pass
        elif fingers == [1, 1, 1, 0, 0]:
            # 手势为Scissors
            pass
        elif fingers == [0, 0, 0, 1, 1]:
            # 手势为Scissors
            pass
        elif fingers == [0, 1, 1, 1, 1]:
            # 手势为Paper
            pass

示例2：手势追踪

在示例2中，我们可以在图像中检测手势，并跟踪手指的位置和移动轨迹。具体实现是：在视频中跟踪手指的移动，并通过判断每个手指的位置创建相应的轨迹。

def track_finger(frame):
    detector = HandDetector()
    img = detector.find_hands(frame)
    landmarks = detector.find_position(img, draw=False)

    if len(landmarks)!=0:
        fingertips = [landmarks[4], landmarks[8], landmarks[12], landmarks[16], landmarks[20]]

        for id, finger in enumerate(fingertips):
            if id == 0:
                cv2.circle(img, finger[1:], 15, (255, 0, 0), cv2.FILLED)
            else:
                cv2.circle(img, finger[1:], 5, (255, 0, 0), cv2.FILLED)
                cv2.line(img, fingertips[id-1][1:], finger[1:], (255, 0, 0), 2)

以上就是实现“Python+MediaPipe+OpenCV实现手部关键点检测功能(手势识别)”的完整攻略，其中包含且不限于两个示例来说明。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：python+mediapipe+opencv实现手部关键点检测功能(手势识别) - Python技术站