使用Apache Tika进行HDF解析

问题描述：

如何使用Apache Tika解析HDF文件（.h5）。使用Apache Tika进行HDF解析

Apache Tika为.h5文件提供解析器，但使用该解析器无法解析数据。

Parser parser=new HDFParser(); 
Metadata metadata=new Metadata(); 
ContentHandler handler=new BodyContentHandler(); 
FileInputStream fileInputStream=new FileInputStream(path+h5File); 

parser.parse(fileInputStream,handler,metadata,new ParseContext());

我可以看到文件的元数据，但使用handler我不能得到内容。

如果有人已经这样做，请帮助我解决这个问题。

我有一种感觉，HDF解析器仅元数据，但它应该被拉出大部分文件都是元数据。你期望看到什么，但没有在元数据中找到？ – Gagravarr

我想解析该文件的内容。 –

但是，您希望哪些内容不在元数据中？ – Gagravarr

答

只是你不能为HDF格式文件的性质。

你必须使用metadata.get(field-name-in-string-format);来检索你想要的信息。

或者你可以直接试试这个Java库：创建NetCDF（使用它的引擎盖下，由提卡）

使用Apache Tika进行HDF解析

相关推荐