覆盖中国国家手语的大型数据集,用于双视图孤立手语识别
快速阅读: 据《Nature.com》称,新发布的双视角中文手语数据集包含6707个CNSL手语符号,由十名使用者多角度录制,填补了现有数据集的不足,促进手语识别研究与无障碍交流发展。
手语识别(手语翻译)旨在自动将手语视频与对应的词汇进行对齐,近期引发了人工智能领域的广泛关注。这项技术有望缩小听觉健全者与聋人社区之间的沟通障碍。然而,手语识别的发展由于手语数据集匮乏而受到限制。此外,现有的手语识别数据集仅提供单一视角,导致手部手势容易被遮挡。同时,现有的中文手语识别数据集,例如DEVISIGN和NMFs-CSL,未能涵盖完整的中国国家手语(CNSL)词汇,这极大地限制了手语识别的实际应用。
为了解决上述挑战,我们推出了一套全新的面向手语识别的词级手语数据集,该数据集涵盖了完整的CNSL词汇,包含6,707个独特的手语符号。此外,它提供了两位手语使用者的两个视角:正面和左侧。共有十名手语使用者参与录制手语视频,整个录制、标注及质量管控过程均经过严格把控。据我们所知,这是首个面向手语识别的双视角中文手语数据集,全面囊括了CNSL的所有手语词汇。
这套数据集的发布,不仅为手语识别的研究提供了强有力的支持,也为进一步推动听障人士与健听人士之间的无障碍交流奠定了坚实的基础。
(以上内容均由Ai生成)