零基础入门CV赛事-街景字符编码识别 Task01

Task01 赛题理解

前言

本次跟随Datawhale组队学习零基础入门CV赛事-街景字符编码识别,希望能有所收获。Datawhale是一个很好的开源组织,会组织很多免费的知识学习。

附上本次组队学习的计划和教程资料,即使没有当时加入组队学习,有兴趣的话从现在开始学习也不晚哦~

正文

一、赛题背景

该数据来自真实场景的门牌号。训练集数据包括3W张照片,验证集数据包括1W张照片,每张照片包括颜色图像和对应的编码类别和具体位置;为了保证比赛的公平性,测试集A包括4W张照片,测试集B包括4W张照片。需要注意的是本赛题需要选手识别图片中所有的字符,为了降低比赛难度,我们提供了训练集、验证集和测试集中字符的位置框。
零基础入门CV赛事-街景字符编码识别 Task01

二、赛题数据

最终下载得到的数据:
零基础入门CV赛事-街景字符编码识别 Task01
字段表

所有的数据(训练集、验证集和测试集)的标注使用JSON格式,并使用文件名进行索引。如果一个文件中包括多个字符,则使用列表将字段进行组合。

Field Description
top 左上角坐标X
height 字符高度
left 左上角最表Y
width 字符宽度
label 字符编码

三、评测标准

评价标准为准确率,选手提交结果与实际图片的编码进行对比,以编码整体识别准确率为评价指标,结果越大越好,具体计算公式如下:
零基础入门CV赛事-街景字符编码识别 Task01

四、结果提交

提交前请确保预测结果的格式与sample_submit.csv中的格式一致,以及提交文件后缀名为csv。

file_name, file_code
0010000.jpg,451
0010001.jpg,232
0010002.jpg,45
0010003.jpg,67
0010004.jpg,191
0010005.jpg,892

结语

作为零基础的小白来说,baseline有点难懂,而且自己跑的话训练很慢,继续跟进吧,加油ヾ(◍°∇°◍)ノ゙