CCTSDB2021交通标志数据集,源于长沙理工大学的专家团队之手,包含近20000张交通标志图片,涉及近40000个交通标志实例。数据集还按尺寸、场景进行了细致分类,并融入丰富的道路背景信息。所有图片均来源于国内真实道路行驶场景,拍摄角度多为车内视角,如街拍和行车记录仪等,为研究者提供了宝贵的交通场景数据资源。
该数据集结构完整,涵盖训练集、测试集、分类测试集及负样本等多个部分。训练集与测试集共包含17856张图片及其标注信息,其中部分训练图片经过特殊处理,如调整尺寸、添加噪声、调节亮度等。标注信息则详细划分为以下三类:
负样本部分则包含500张与上述三类无关的道路行驶图片,可根据实际需求在训练中灵活添加,也可用于模型性能测试。
分类测试集提供了两种分类方式:根据交通标志大小分为XS、S、M、L、XL五类;根据天气和光照条件分为cloud、foggy、night、rain、snow、sunny六类。每类文件夹均包含相应的xml格式标注文件,便于研究者使用。
test - 包含测试集图片及标注信息,格式为yolo训练所需格式,图片存放在images子文件夹中,标注则位于labels子文件夹。
train - 包含训练集图片及标注信息,同样采用yolo训练格式,图片和标注的存放位置与测试集相同。
XML - 存放训练集和测试集图片的原始标注文件,格式为VOC,可通过labelimg软件打开查看。
voc_label.py - 一个用于将xml格式标注文件转换为yolo训练所需标注文件的脚本工具。