天池--Task1 赛题理解

赛题:零基础⼊入⻔门CV赛事- 街景字符编码识别

地址:https://tianchi.aliyun.com/competition/entrance/531795/information

 

本章内容将会对街景字符识别赛题进行赛题背景讲解,对赛题数据的读取进行说明,并给出集中解题思路。

 

赛题名称:零基础入门CV之街道字符识别

 

赛题目标:通过这道赛题可以引导大家走入计算机视觉的世界,主要针对竞赛选手上手视觉赛题,提高对数据建模能力。

 

赛题任务:赛题以计算机视觉中字符识别为背景,要求选手预测街道字符编码,这是一个典型的字符识别问题。

1.1 学习⽬目标

  1. 理解赛题背景和赛题数据
  2. 完成赛题报名和数据下载,理解赛题的解题思路

​​​​​​​1.2 赛题数据

     赛题以街道字符为为赛题数据,数据集报名后可见并可下载,该数据来自收集的SVHN街道字符,并进行了匿名采样处理。

 

                                天池--Task1 赛题理解

        注意:按照比赛规则,所有的参赛选手只能使用比赛给定的数据集完成训练,不能使用SVHN原始数据集进行训练。比赛结束后将会对Top选手进行代码审核,违规的选手将清除排行榜成绩。

       训练集数据包括3W张照片,验证集数据包括1W张照片,每张照片包括颜色图像和对应的编码类别和具体位置;为   了保证比赛的公平性,测试集A包括4W张照片,测试集B包括4W张照片。

       需要注意的是本赛题需要选手识别图片中所有的字符,为了降低比赛难度,我们提供了训练集、验证集和测试集中   所有字符的位置框。

​​​​​​2.1数据标签

对千训练数据每张图片将给出对千的编码标签,和具体的字符框的位置(训练集、测试集和验证集都给出字符位   置),可用千模型训练:

天池--Task1 赛题理解

字符的坐标具体如下所示:

                                                       天池--Task1 赛题理解

        在比赛数据(训练集、测试集和验证集)中,同一张图片中可能包括一个或者多个字符,因此在比赛数据的JSON 标注中,会有两个字符的边框信息:

天池--Task1 赛题理解