当前位置：首页 > news >正文

MediaPipe骨骼关键点可视化技巧：自定义颜色与连线样式教程

news 2026/3/27 4:25:48

MediaPipe骨骼关键点可视化技巧：自定义颜色与连线样式教程

1. 引言：AI 人体骨骼关键点检测的实用价值

随着计算机视觉技术的发展，人体姿态估计在健身指导、动作捕捉、虚拟试衣、人机交互等场景中展现出巨大潜力。Google 开源的MediaPipe Pose模型凭借其高精度、低延迟和轻量化特性，成为当前最受欢迎的姿态识别工具之一。

本项目基于 MediaPipe 构建，支持在 CPU 上实现毫秒级推理，精准定位33 个 3D 骨骼关键点，并提供 WebUI 可视化界面，无需联网或依赖外部 API，真正实现“开箱即用”。然而，默认的可视化效果（红点+白线）虽然清晰，但在实际应用中可能无法满足个性化展示需求。

本文将深入讲解如何自定义关键点颜色、连线样式与绘制逻辑，帮助你打造更具辨识度和专业感的骨骼可视化系统。

2. MediaPipe Pose 核心机制解析

2.1 关键点定义与拓扑结构

MediaPipe Pose 模型输出的 33 个关键点涵盖了人体主要关节，包括：

面部：鼻尖、左/右眼、耳等
上肢：肩、肘、腕
躯干：脊柱、髋部
下肢：膝、踝、脚尖

这些关键点通过预定义的连接关系（connections）构成骨架图。例如： -LEFT_SHOULDER → LEFT_ELBOW → LEFT_WRIST-RIGHT_HIP → RIGHT_KNEE → RIGHT_ANKLE

该连接关系由mp_pose.POSE_CONNECTIONS提供，本质是一个包含(start_idx, end_idx)元组的元组集合。

2.2 默认可视化流程分析

MediaPipe 使用mp.solutions.drawing_utils模块进行绘图，核心函数为：

mp.solutions.drawing_utils.draw_landmarks( image, landmarks, connections=mp_pose.POSE_CONNECTIONS, landmark_drawing_spec=DrawingSpec(color=(0, 0, 255), thickness=2, circle_radius=2), connection_drawing_spec=DrawingSpec(color=(255, 255, 255), thickness=2) )

其中： -landmark_drawing_spec控制关键点样式（颜色、大小） -connection_drawing_spec控制连线样式（颜色、粗细）

⚠️ 注意：默认设置下所有关键点统一为红色，所有连线统一为白色，缺乏区分度。

3. 自定义可视化实战指南

3.1 环境准备与基础代码框架

确保已安装 MediaPipe：

pip install mediapipe opencv-python flask numpy

创建主程序文件pose_visualizer.py：

import cv2 import mediapipe as mp import numpy as np from dataclasses import dataclass # 初始化模型 mp_pose = mp.solutions.pose mp_drawing = mp.solutions.drawing_utils mp_drawing_styles = mp.solutions.drawing_styles # 启动 Pose 检测器 pose = mp_pose.Pose( static_image_mode=False, model_complexity=1, enable_segmentation=False, min_detection_confidence=0.5 )

3.2 定义个性化绘图样式

我们可以使用DrawingSpec类分别控制不同部位的颜色与样式。

自定义颜色方案（按身体区域划分）

# BGR 颜色定义（OpenCV 使用 BGR 色彩空间） COLOR_LEFT = (255, 100, 0) # 蓝色调 - 左侧肢体 COLOR_RIGHT = (0, 100, 255) # 红色调 - 右侧肢体 COLOR_CENTER = (0, 255, 0) # 绿色 - 中轴线（脊柱、头部） # 分类连接关系 def get_custom_connection_style(): left_connections = [] right_connections = [] center_connections = [] for conn in mp_pose.POSE_CONNECTIONS: start_idx, end_idx = conn start_name = mp_pose.PoseLandmark(start_idx).name end_name = mp_pose.PoseLandmark(end_idx).name if 'LEFT_' in start_name or 'LEFT_' in end_name: left_connections.append(conn) elif 'RIGHT_' in start_name or 'RIGHT_' in end_name: right_connections.append(conn) else: center_connections.append(conn) return { 'left': (left_connections, mp_drawing.DrawingSpec(color=COLOR_LEFT, thickness=3, circle_radius=3)), 'right': (right_connections, mp_drawing.DrawingSpec(color=COLOR_RIGHT, thickness=3, circle_radius=3)), 'center': (center_connections, mp_drawing.DrawingSpec(color=COLOR_CENTER, thickness=4, circle_radius=4)) }

3.3 实现分区域绘制逻辑

不再使用draw_landmarks的全局参数，而是手动遍历连接关系并分类绘制：

def draw_custom_landmarks(image, results): if not results.pose_landmarks: return image h, w, _ = image.shape landmarks = results.pose_landmarks.landmark # 获取自定义样式 styles = get_custom_connection_style() # 绘制关键点（统一小圆点） for landmark in landmarks: cx, cy = int(landmark.x * w), int(landmark.y * h) cv2.circle(image, (cx, cy), 3, (255, 255, 255), -1) # 白色小点 # 按类别绘制连线 for key, (connections, spec) in styles.items(): for start_idx, end_idx in connections: start_lm = landmarks[start_idx] end_lm = landmarks[end_idx] # 屏幕坐标转换 x1, y1 = int(start_lm.x * w), int(start_lm.y * h) x2, y2 = int(end_lm.x * w), int(end_lm.y * h) # 绘制连线 cv2.line(image, (x1, y1), (x2, y2), spec.color, spec.thickness) return image

3.4 添加置信度过滤与动态样式增强

进一步提升可视化质量，可加入置信度过滤和动态线宽调整：

def draw_with_confidence(image, results, min_confidence=0.6): if not results.pose_landmarks: return image h, w, _ = image.shape landmarks = results.pose_landmarks.landmark for conn in mp_pose.POSE_CONNECTIONS: start_idx, end_idx = conn start_lm = landmarks[start_idx] end_lm = landmarks[end_idx] # 置信度过滤 if start_lm.visibility < min_confidence or end_lm.visibility < min_confidence: continue x1, y1 = int(start_lm.x * w), int(start_lm.y * h) x2, y2 = int(end_lm.x * w), int(end_lm.y * h) # 根据可见性动态调整颜色透明度（模拟半透明效果） alpha = int(255 * max(start_lm.visibility, end_lm.visibility)) color = (0, 255, 255) # 黄色高亮 overlay = image.copy() cv2.line(overlay, (x1, y1), (x2, y2), color, 3) cv2.addWeighted(overlay, alpha / 255.0, image, 1 - alpha / 255.0, 0, image) return image

3.5 WebUI 集成建议（Flask 示例片段）

若需集成到 WebUI，可在 Flask 路由中处理上传图像：

@app.route('/predict', methods=['POST']) def predict(): file = request.files['image'] img_bytes = np.frombuffer(file.read(), np.uint8) image = cv2.imdecode(img_bytes, cv2.IMREAD_COLOR) # 姿态检测 rgb_image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB) results = pose.process(rgb_image) # 自定义绘制 annotated_image = draw_custom_landmarks(image.copy(), results) # 编码返回 _, buffer = cv2.imencode('.jpg', annotated_image) return send_file(io.BytesIO(buffer), mimetype='image/jpeg')

4. 进阶优化与最佳实践

4.1 性能优化建议

降低模型复杂度：设置model_complexity=0可显著提升 CPU 推理速度（适用于实时视频流）
跳帧处理：在视频场景中每 2~3 帧执行一次检测，减少计算负载
图像缩放：输入图像分辨率控制在 640×480 以内即可满足大多数场景需求

4.2 视觉设计建议

区域	推荐颜色	使用场景
左侧肢体	蓝色系	动作对称性分析
右侧肢体	红色系	动作对称性分析
躯干中轴	绿色/黄色	平衡性评估
高置信度连线	加粗+亮色	强调可靠检测结果