1. PA-100K
包含10万张街头行人图像,标26个关键属性(如性别、年龄段、服饰风格、携带物品等),覆盖复杂背景与姿态变化,支持多标签分类任务。
2. RAP (Richly Annotated Pedestrian)
数据集规模达41,585张图像,标维度拓展至45个属性,包括细粒度特征(如发型、上衣长度、是否戴眼镜),数据来源于真实监控场景,标精度达95%以上。
3. LIP (Look into Person)
融合50,462张图像的人体属性与语义分割标,涵盖19个部位属性(如头部、上肢、下肢)及10个场景属性,支持属性识别与姿态估计联合任务。
二、手势识别数据集
1. Jester
包含148,092段短视频,聚焦27个日常手势类别(如"点赞""挥手""OK手势"),采用第一视角拍摄,数据源于YouTube,适合动态手势时序建模。
2. MPII Hand Action
由11,000张静态图像构成,标14个手部动作类别及21个关节点坐标,涵盖不同光照、背景和手部姿态,支持手势分类与关键点检测。
3. ChaLearn LAP Gesture
多模态数据集含RGB、深度图及骨架数据,覆盖200个手势类别,包含动态序列与静态图像,标信息包括边界框、三维关节点,适用于跨模态手势分析。
这些数据集为算法训练提供了丰富的标资源,推动人体属性理与手势交互技术在智能监控、人机交互等领域的落地应用。
3. LIP (Look into Person)
融合50,462张图像的人体属性与语义分割标,涵盖19个部位属性(如头部、上肢、下肢)及10个场景属性,支持属性识别与姿态估计联合任务。
二、手势识别数据集
1. Jester
包含148,092段短视频,聚焦27个日常手势类别(如"点赞""挥手""OK手势"),采用第一视角拍摄,数据源于YouTube,适合动态手势时序建模。
2. MPII Hand Action
由11,000张静态图像构成,标14个手部动作类别及21个关节点坐标,涵盖不同光照、背景和手部姿态,支持手势分类与关键点检测。
3. ChaLearn LAP Gesture
多模态数据集含RGB、深度图及骨架数据,覆盖200个手势类别,包含动态序列与静态图像,标信息包括边界框、三维关节点,适用于跨模态手势分析。
这些数据集为算法训练提供了丰富的标资源,推动人体属性理与手势交互技术在智能监控、人机交互等领域的落地应用。
2. MPII Hand Action
由11,000张静态图像构成,标14个手部动作类别及21个关节点坐标,涵盖不同光照、背景和手部姿态,支持手势分类与关键点检测。
3. ChaLearn LAP Gesture
多模态数据集含RGB、深度图及骨架数据,覆盖200个手势类别,包含动态序列与静态图像,标信息包括边界框、三维关节点,适用于跨模态手势分析。
这些数据集为算法训练提供了丰富的标资源,推动人体属性理与手势交互技术在智能监控、人机交互等领域的落地应用。
这些数据集为算法训练提供了丰富的标资源,推动人体属性理与手势交互技术在智能监控、人机交互等领域的落地应用。
