使用Apache Tika进行HDF解析
问题描述:
如何使用Apache Tika解析HDF文件(.h5
)。使用Apache Tika进行HDF解析
Apache Tika为.h5
文件提供解析器,但使用该解析器无法解析数据。
Parser parser=new HDFParser();
Metadata metadata=new Metadata();
ContentHandler handler=new BodyContentHandler();
FileInputStream fileInputStream=new FileInputStream(path+h5File);
parser.parse(fileInputStream,handler,metadata,new ParseContext());
我可以看到文件的元数据,但使用handler
我不能得到内容。
如果有人已经这样做,请帮助我解决这个问题。
答
只是你不能为HDF格式文件的性质。
你必须使用metadata.get(field-name-in-string-format);
来检索你想要的信息。
或者你可以直接试试这个Java库:创建NetCDF(使用它的引擎盖下,由提卡)
我有一种感觉,HDF解析器仅元数据,但它应该被拉出大部分文件都是元数据。你期望看到什么,但没有在元数据中找到? – Gagravarr
我想解析该文件的内容。 –
但是,您希望哪些内容不在元数据中? – Gagravarr