HUST-OBS 甲骨文识别数据集

诚信评分:100
水平:普通
HUST-OBS 数据集由研究人员于 2024 年构建,相关论文成果为「An open dataset for oracle bone script recognition and decipherment」

该数据集包含 1,588 个已解密脚本的 77,064 幅图像,和 9,411 个未解密字符的 62,989 幅图像,总计 140,053 幅图像,这些图像来自三个不同的来源,包括书籍、网站和现有数据库,是迄今为止最大的 OBS 识别和解密数据集之一。此外,所有图片和标签均已由甲骨文研究专家审阅和更正。研究团队希望该数据集能够启发和帮助未来研究破译那些未知的 OBS (oracle bone script) 。