项目issue-1

数据集格式存在的问题

项目issue-1项目issue-1

   如图所示,在对数据集进行处理时,发现有的xml标注文件拥有size节点而有的没有,在获取标注数据集时需要获取size信息,因此导致程序这部分图片读取问题。

解决方案

   其实这是一个比较简单的问题,我们可以选择跳过这部分信息(size不是最关键的信息),还可以选择为所有文件补填上size信息。

   简单地来说这是一个小问题,只需要读取所有图片的高、宽和深度即可,python的opencv库可以很简单地做到,然后将读取到的内容写入xml文件,这方面我没有做过,不过网上有许多资料可以查询,写代码的问题不大。

   具体代码可见getSize.py文件,比较简单,但是是项目开始写的第一个代码文件,记录一下。