本文档主要记录了Hadoop+Hive+Spark集群安装过程，并且对NameNode与ResourceManager进行了HA高可用配置，以及对NameNode的横向扩展（Federation联邦）

1 VM网络配置

将子网IP设置为192.168.1.0：

将网关设置为192.168.1.2：

并禁止DHCP

当经过上面配置后，虚拟网卡8的IP会变成192.168.1.1：

（虚拟机与物理机不在一个网段是没有关系的）

2 CentOS配置

2.1 下载地址

IT虾米网

下载不带桌面的最小安装版本

2.2 激活网卡

激活网卡，并设置相关IP：

网关与DNS设置为上面虚拟网卡8中设置的网关即可

2.3 SecureCRT

当网卡激活后，就可以使用SecureCRT终端远程连接Linux，这样方便后续操作。如何连接这里省略，

这里连接上后简单的进行下面设置：

2.4 修改主机名

/etc/sysconfig/network

/etc/hostname

/etc/hosts

192.168.1.11 node1

192.168.1.12 node2

192.168.1.13 node3

192.168.1.14 node4

2.5 yum代理上网

由于公司内部是代理上网，所以yum无法连网搜索软件包

yum代理的设置：vi /etc/yum.conf

再次运行yum，发现可以连网搜索软件包了：

2.6 安装ifconfig

2.7 wget安装与代理

安装好wget后，在/etc目录下就会产生wget配置文件wgetrc，在这里面可以配置wget代理：

[[email protected] ~]# vi /etc/wgetrc

http_proxy = IT虾米网

https_proxy = IT虾米网

ftp_proxy = IT虾米网

2.8 安装VMware Tools

为了虚拟机与主机时间同步，所以需要安装VMWare Tools

[[email protected] opt]# yum -y install perl

[[email protected] ~]# mount /dev/cdrom /mnt

[[email protected] ~]# tar -zxvf /mnt/VMwareTools-9.6.1-1378637.tar.gz -C /root

[[email protected] ~]# umount /dev/cdrom

[[email protected] ~]# /root/vmware-tools-distrib/vmware-install.pl

[[email protected] ~]# rm -rf /root/vmware-tools-distrib

注：下面文件共享与鼠标拖放功能不要安装，否则安装过程会出问题：

[[email protected] ~]# chkconfig –list | grep vmware

vmware-tools 0:关 1:关 2:开 3:开 4:开 5:开 6:关

vmware-tools-thinprint 0:关 1:关 2:开 3:开 4:开 5:开 6:关

[[email protected] ~]# chkconfig vmware-tools-thinprint off

[[email protected] ~]# find / -name *vmware-tools-thinprint* | xargs rm -rf

2.9 其他

2.9.1 问题

刚启动时会出以下错误提示：

修改虚拟机配置文件node1.vmx可以解决：

vcpu.hotadd = “FALSE”

mem.hotadd = “FALSE”

2.9.2 设置

2.9.2.1去掉开机等待时间

[[email protected] ~]# vim /etc/default/grub

GRUB_TIMEOUT=0 #默认为5秒

[[email protected] ~]# grub2-mkconfig -o /boot/grub2/grub.cfg

2.9.2.2VM调整

（注：小内存禁用）

修改node1.vmx文件：

mainMem.useNamedFile = “FALSE”

为了全屏显示，方便命令行输入，做以下调整：

并去掉状态栏显示：

2.9.3 命令

2.9.3.1关机与重启

[[email protected] ~]# reboot

[[email protected] ~]# shutdown -h now

2.9.3.2服务停止与禁用

#查看开机自启动服务

[[email protected] ~]# systemctl list-unit-files | grep enabled | sort

auditd.service enabled

crond.service enabled

dbus-org.freedesktop.NetworkManager.service enabled

dbus-org.freedesktop.nm-dispatcher.service enabled

default.target enabled

dm-event.socket enabled

getty@.service enabled

irqbalance.service enabled

lvm2-lvmetad.socket enabled

lvm2-lvmpolld.socket enabled

lvm2-monitor.service enabled

microcode.service enabled

multi-user.target enabled

NetworkManager-dispatcher.service enabled

NetworkManager.service enabled

postfix.service enabled

remote-fs.target enabled

rsyslog.service enabled

sshd.service enabled

systemd-readahead-collect.service enabled

systemd-readahead-drop.service enabled

systemd-readahead-replay.service enabled

tuned.service enabled

[[email protected] ~]# systemctl | grep running | sort

crond.service loaded active running Command Scheduler

dbus.service loaded active running D-Bus System Message Bus

dbus.socket loaded active running D-Bus System Message Bus Socket

[email protected] loaded active running Getty on tty1

irqbalance.service loaded active running irqbalance daemon

lvm2-lvmetad.service loaded active running LVM2 metadata daemon

lvm2-lvmetad.socket loaded active running LVM2 metadata daemon socket

NetworkManager.service loaded active running Network Manager

polkit.service loaded active running Authorization Manager

postfix.service loaded active running Postfix Mail Transport Agent

rsyslog.service loaded active running System Logging Service

session-1.scope loaded active running Session 1 of user root

session-2.scope loaded active running Session 2 of user root

session-3.scope loaded active running Session 3 of user root

sshd.service loaded active running OpenSSH server daemon

systemd-journald.service loaded active running Journal Service

systemd-journald.socket loaded active running Journal Socket

systemd-logind.service loaded active running Login Service

systemd-udevd-control.socket loaded active running udev Control Socket

systemd-udevd-kernel.socket loaded active running udev Kernel Socket

systemd-udevd.service loaded active running udev Kernel Device Manager

tuned.service loaded active running Dynamic System Tuning Daemon

vmware-tools.service loaded active running SYSV: Manages the services needed to run VMware software

wpa_supplicant.service loaded active running WPA Supplicant daemon

#查看一个服务的状态

systemctl status auditd.service

#开机时启用一个服务

systemctl enable auditd.service

#开机时关闭一个服务

systemctl disable auditd.service

systemctl disable postfix.service

systemctl disable rsyslog.service

systemctl disable wpa_supplicant.service

#查看服务是否开机启动

systemctl is-enabled auditd.service

2.9.3.3查大文件目录

find . -type f -size +10M -print0 | xargs -0 du -h | sort -nr

将前最大的前20目录列出来，–max-depth表示目录深度，如果去掉，则遍历所有子目录：

du -hm –max-depth=5 / | sort -nr | head -20

find /etc -name ‘*srm*’　　#表示在/etc目录下查找文件名中含有字符

2.9.3.4查看磁盘使用情况

[[email protected] dev]# df -h

文件系统容量已用可用已用% 挂载点

/dev/mapper/centos-root 50G 1.5G 49G 3% /

devtmpfs 721M 0 721M 0% /dev

tmpfs 731M 0 731M 0% /dev/shm

tmpfs 731M 8.5M 723M 2% /run

tmpfs 731M 0 731M 0% /sys/fs/cgroup

/dev/mapper/centos-home 47G 33M 47G 1% /home

/dev/sda1 497M 106M 391M 22% /boot

tmpfs 147M 0 147M 0% /run/user/0

2.9.3.5查看内存使用情况

[[email protected] dev]# top

3 安装JDK

JDK所有旧版本在官网中的下载地址:IT虾米网

在线下载jdk-8u72-linux-x64.tar.gz，并存放在/root下：

wget -O /root/jdk-8u92-linux-x64.tar.gz IT虾米网

[[email protected] ~]# tar -zxvf /root/jdk-8u92-linux-x64.tar.gz -C /root

[[email protected] ~]# vi /etc/profile

在/etc/profile文件的最末加上如下内容：

export JAVA_HOME=/root/jdk1.8.0_92
export PATH=.:$PATH:$JAVA_HOME/bin

export CLASSPATH=.:$JAVA_HOME/jre/lib/rt.jar:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

[[email protected] ~]# source /etc/profile

[[email protected] ~]# java -version

java version “1.8.0_92”

Java(TM) SE Runtime Environment (build 1.8.0_92-b14)

Java HotSpot(TM) 64-Bit Server VM (build 25.92-b14, mixed mode)

使用env命令查看当前设置的环境变量是否正确：

[[email protected] ~]# env | grep CLASSPATH

CLASSPATH=.:/root/jdk1.8.0_92/jre/lib/rt.jar:/root/jdk1.8.0_92/lib/dt.jar:/root/jdk1.8.0_92/lib/tools.jar

4 复制虚拟机

前面只安装一台node1的物理机，现从node1复制出node2/node3/node3

node1	192.168.1.11
node2	192.168.1.12
node3	192.168.1.13
node4	192.168.1.14

修改相应虚拟机显示名：

开机时选择复制：

修改主机名：

[[email protected] ~]# vi /etc/sysconfig/network

[[email protected] ~]# vi /etc/hostname

5 SSH 免密码登录

RSA加密算法是一种典型的非对称加密算法

RSA算法可以用于数据加密（公钥加密，私钥解密）和数字签名或认证（私钥加密，公钥解密）

5.1 一般的ssh原理（需要密码）

 客户端向服务器端发出连接请求

 服务器端向客户端发出自己的公钥

 客户端使用服务器端的公钥加密通讯登录密码然后发给服务器端

 如果通讯过程被截获，由于窃听者即使获知公钥和经过公钥加密的内容，但不拥有私钥依然无法解密（RSA算法）

 服务器端接收到密文后，用私钥解密，获知通讯密码

5.2 免密码原理

先在客户端创建一对密匙，并把公用密匙放在需要访问的服务器上

客户端向服务器发出请求，请求用你的密匙进行安全验证

 服务器收到请求之后，先在该服务器上你的主目录下寻找你的公用密匙，然后把它和你发送过来的公用密匙进行比较。如果两个密匙一致，服务器就用公用密匙加密“质询”（challenge）并把它发送给客户端

 客户端收到“质询”之后就可以用自己的私人密匙解密再把它发送给服务器

 服务器比较发来的“质询”和原先的是否一致，如果一致则进行授权，完成建立会话的操作

5.3 SSH免密码

先删除以前生成的：

rm -rf /root/.ssh

生成密钥：

[[email protected] ~]# ssh-keygen -t rsa

命令“ssh-keygen -t rsa”表示使用 rsa 加密方式生成密钥，回车后，会提示三次输入信息，我们直接回车即可。

查看生成的密钥：

其中id_rsa.pub为公钥，id_rsa为私钥

服务器之间公钥拷贝：

ssh-copy-id -i /root/.ssh/id_rsa.pub <主机名>

表示将本机的公钥拷贝到hadoop-slave1主机上去，并自动追加到authorized_keys文件中去，如果不存在则会自动创建一个。如果是自己远程自己时，主机就填自己

[[email protected] ~]# ssh-copy-id -i /root/.ssh/id_rsa.pub node1

[[email protected] ~]# ssh-copy-id -i /root/.ssh/id_rsa.pub node2

[[email protected] ~]# ssh-copy-id -i /root/.ssh/id_rsa.pub node3

[[email protected] ~]# ssh-copy-id -i /root/.ssh/id_rsa.pub node4