Hive源码导入eclipse——细读Hive源码(一)

一,首先有一些准备工作需要我们完成:

  1. 配置正确的伪分布式hadoop,具体详见:http://www.linuxidc.com/Linux/2015-02/113487.htm

  2. 配置正确的Hive,具体详见:http://blog.****.net/gamer_gyt/article/details/47150621

  3. 安装maven工具,具体详见:http://blog.****.net/zackzhaoyang/article/details/49636921

二,在将hive导入eclipse时,会遇到很多问题,我在此会将我的方法给大家分享一下

  1. 保证hadoop,hive,maven都可以正确使用

  2. 下载 apache-hive-1.2.1-src.zip,具体地址:
    http://download.****.net/detail/wotkk/9890362

  3. 解压后进入相应的目录,依次输入如下三条指令,输入正确的前提是你的maven配置正确,并且/home/.m2/repository这个目录可以正常打开,如果没有的话,需要自己创建一个;输入指令时可以参考:http://blog.****.net/fansy1990/article/details/49339199

    (1) mvn clean install -DskipTests -Phadoop-2
    (2) mvn eclipse:clean
    (3) mvn eclipse:eclipse -DdownloadSources -DdownloadJavadocs -Phadoop-2

  4. 这时候你可以进入刚才下载的源码中看一下,其中多了很多jar文件等等,你也可以进入/home/.m2/repository中查看有无文件,提示一下ctrl+h可以打开隐藏文件;
    如果以上的任务你都完成了的话,那么就可以向eclipse中导入工程了

  5. 在导入工程之前需要配置Build Path,具体路径如下:
    Window->Preferences->Java->Build Path->User Libraries
    Hive源码导入eclipse——细读Hive源码(一)
    在这个里面新建HADOOP_LIB和HIVE_LIB,在其中分别加入hadoop的所有jar包和hive的所有jar包,以便工程调用;

  6. 在User Libraries 的上面有一个ClassPath Variables也需要配置:

    Hive源码导入eclipse——细读Hive源码(一)

    在这个里面需要增加两个项目HADOOP_CONF_DIRHIVE_CONF_DIR,具体的路径可以参考我的参数。我的hadoop安装在/opt下,hive安装在/opt/hadoop下。

  7. 现在就可以将hive源码的工程导入eclipse, File->Import->Project Form Folder or Archive,导入以后的结果如下:
    Hive源码导入eclipse——细读Hive源码(一)

  8. 现在就可以进行debug,首先在终端中输入 hive –debug

    Hive源码导入eclipse——细读Hive源码(一)

  9. 在eclipse中对debug进行设置
    Hive源码导入eclipse——细读Hive源码(一)

  10. 最后点击debug就可以进行调试了,这样也方便我们下一步读代码,效果如图:
    Hive源码导入eclipse——细读Hive源码(一)