Biopython可以解析Derwent GENESEQ格式吗?

问题描述:

我试图解析来自Derwent GENESEQ数据库的文件。Biopython可以解析Derwent GENESEQ格式吗?

这些文件应该是EMBL格式的,但是有一些细小的差异可以打破SeqIO.parse('foo.dat', 'embl')。有没有人用Biopython或其他Python库成功解析这些文件?

我最终创建了Biopython EMBL解析器的子类,并破解了我自己的GENESEQ解析器。