logo头像
Snippet 博客主题

Hadoop学习之路(八)在eclispe上搭建Hadoop开发环境

** Hadoop学习之路(八)在eclispe上搭建Hadoop开发环境:** <Excerpt in index | 首页摘要>

​ Hadoop学习之路(八)在eclispe上搭建Hadoop开发环境

<The rest of contents | 余下全文>

一、添加插件

将hadoop-eclipse-plugin-2.7.5.jar放入eclipse的plugins文件夹中

img

二、在Windows上安装Hadoop2.7.5

版本最好与Linux集群中的hadoop版本保持一致

1、将hadoop-2.7.5-centos-6.7.tar.gz解压到Windows上的C盘software目录中

img

2、配置hadoop的环境变量

HADOOP_HOME=C:\software\hadoop-2.7.5

Path=C:\software\hadoop-2.7.5\bin

img

img

3、修改Hadoop安装目录C:\software\hadoop-2.7.5\etc\hadoop中hadoop-env.cmd

img

4、查看Hadoop版本

img

5、添加Windows支持文件

因为安装的Hadoop编译的版本是CentOS6.7的版本,在Windows上运行需要添加文件

1)winutils.exe 放在windows平台中你安装的hadoop的bin目录下

2) hadoop.dll 放在windows操作系统的 c:/windows/system32目录下

img

img

6、重新启动eclipse

三、eclipse中的配置

1、重新启动eclipse,打开windows->Preferences的Hadoop Map/Reduce中设置安装目录

img

2、打开Windows->Open Perspective中的Map/Reduce,在此perspective下进行hadoop程序开发

img

3、打开Windows->Show View中的Map/Reduce Locations,如下图右键选择New Hadoop location…新建hadoop连接。

img

4、配置相关信息

img

5、配置成功之后再右侧显示如下

img

四、创建HDFS项目

1、创建一个java project

img

2、添加jar包这里使用第二种

有三种方式可以往项目中添加jar依赖:

  1)直接创建一个lib文件夹,然后放入对应的依赖包,最后add build path

    优点:移植方便
    缺点:项目臃肿

  2)在eclipse中创建user libarary, 然后引入

    优点:解决了不同项目中的相同jar的重复依赖问题, 不是直接放入,是引入的方式
    缺点:移植不方便

  3)最后直接使用maven管理jar依赖

    完美解决方案:使用maven 我们在项目中只需要编写好:pom.xml文件即可

目前只是操作HDFS,所以只需要引入common和HDFS相关的jar包即可。

img

img

img

img

img

img

img

img

Hadoop的common、hdfs、MapReduce、yarn的相关jar包的位置在安装目录的C:\software\hadoop-2.7.5\share\hadoop文件夹中,各自文件夹下的jar包是核心jar包,lib下的jar包是核心jar包的依赖jar包,都需要引入

img

img

hdfs的jar包用相同的方法引入

img

这样项目就成功引入了common和hdfs相关的jar包

img

3、创建测试类

img View Code

测试之前

img

测试之后

img