解析(使用Tika)远程玻璃鱼

问题描述:

我正在使用Tika解析器将我的文件编入索引。我创建了我自己的解析器(它扩展了XMLParser)。它使用我自己的mimetype。 我创建了一个jar文件,其中内部看起来是这样的:解析(使用Tika)远程玻璃鱼

src 
|-main 
    |-some_packages 
     |-MyParser.java 
    |resources 
     |-META-INF 
      |-services 
       |-org.apache.tika.parser.Parser (which contains a line:some_packages.MyParser.java) 
     |_org 
      |-apache 
       |-tika 
        |-mime 
         |-custom-mimetypes.xml 

在自定义MIME类型,我把新的MIME类型定义becouse我的XML文件中有一些特殊的标记。

现在问题在哪里:我一直在使用我的本地机器上安装的glassfish上的Solr测试解析和索引。它工作得很好。然后我想将它安装在某个远程服务器上。安装了相同版本的glassfish(3.1.1)。我复制粘贴的Solr应用程序,它是所有库的主目录(包括tika jar和我的自定义分析器的jar)。不幸的是它不起作用。将文件发布到Solr后,我可以在内容类型字段中看到它检测到我的自定义MIME类型。但是,如果MyParser类从未运行过,那么就没有假设存在的字段。唯一的领域是都柏林核心的。我检查了(通过简单地添加一些printlines),Tika只使用XMLParser。 有没有人有类似的问题?如何处理这个?

+1

解决:)原来,这个问题是使用Java 7 ... – lotk 2012-02-23 13:58:23

+0

你可能想补充说,作为答案 – Gagravarr 2012-02-25 10:39:13

问题是,我是使用Java 7编译我的解析器但是Apache提卡与Java 5的编译...