MPII Human Pose Descriptions是由德国凯撒斯劳滕大学、德国人工智能研究中心等机构创建的一个人体姿态描述数据集。该数据集在MPII人体姿态数据集的基础上,增加了丰富的文本注释,这些注释由多个最新进的大模型生成,涵盖了活动细节、人物数量及其具体姿态的描述。数据集包含与MMPose相同的图像划分,其中训练样本14644个,验证样本2723个,每幅图像均配有由不同大模型生成的姿态描述,且每个描述都附有额外的注释信息,包括活动类型、人数以及姿态关键点,这些信息均源自原始MPII人体姿态数据集的注释。此数据集旨在支持多模态学习中的多种任务,对结合视觉和文本数据的研究尤为珍贵,并已在CLIP-3模型的开发中得到应用。
详情请参见五号雷达:https://www.5radar.com/
数据集地址:https://huggingface.co/datasets/saifkhichi96/mpii-human-pose-captions
领取专属 10元无门槛券
私享最新 技术干货