项目issue-1
数据集格式存在的问题
如图所示,在对数据集进行处理时,发现有的xml标注文件拥有size节点而有的没有,在获取标注数据集时需要获取size信息,因此导致程序这部分图片读取问题。
解决方案
其实这是一个比较简单的问题,我们可以选择跳过这部分信息(size不是最关键的信息),还可以选择为所有文件补填上size信息。
简单地来说这是一个小问题,只需要读取所有图片的高、宽和深度即可,python的opencv库可以很简单地做到,然后将读取到的内容写入xml文件,这方面我没有做过,不过网上有许多资料可以查询,写代码的问题不大。
具体代码可见getSize.py文件,比较简单,但是是项目开始写的第一个代码文件,记录一下。