使用Apache Tika进行HDF解析

问题描述:

如何使用Apache Tika解析HDF文件(.h5)。使用Apache Tika进行HDF解析

Apache Tika为.h5文件提供解析器,但使用该解析器无法解析数据。

Parser parser=new HDFParser(); 
Metadata metadata=new Metadata(); 
ContentHandler handler=new BodyContentHandler(); 
FileInputStream fileInputStream=new FileInputStream(path+h5File); 

parser.parse(fileInputStream,handler,metadata,new ParseContext()); 

我可以看到文件的元数据,但使用handler我不能得到内容。

如果有人已经这样做,请帮助我解决这个问题。

+0

我有一种感觉,HDF解析器仅元数据,但它应该被拉出大部分文件都是元数据。你期望看到什么,但没有在元数据中找到? – Gagravarr

+0

我想解析该文件的内容。 –

+1

但是,您希望哪些内容不在元数据中? – Gagravarr

只是你不能为HDF格式文件的性质。

你必须使用metadata.get(field-name-in-string-format);来检索你想要的信息。

或者你可以直接试试这个Java库:创建NetCDF(使用它的引擎盖下,由提卡)