SPARK standlone安装配置

2021年11月15日 11:08 • 大数据, 开源, 研发管理, 编程笔记

集群一共有3台机器,集群使用hadoop用户运行,3台机器如下:

1	DEV-HADOOP-01	192.168.9.110
2	DEV-HADOOP-02	192.168.9.111
3	DEV-HADOOP-03	192.168.9.112

配置集群间hadoop用户的无密码登录
配置每台机器的/etc/hosts
安装JDK1.8.0_60
安装scala
1. 下载scala-2.11.7.tar
2. 把scala-2.11.7.tar解压到/data/server目录
3. 设置环境变量 /etc/profile
  1. export SCALA_HOME=/usr/scala/scala-2.11.7
  2. 使配置生效 source /etc/profile
安装spark
1. 下载spark-1.5.0.tar
2. 把spark-1.5.0.tar解压到/data/server目录
3. 配置环境变量 /etc/profile
  1. export SPARK_HOME=/data/server/spark-1.5.0-bin-hadoop2.6
  2. export PATH=$PATH:$SPARK_HOME/bin:$SPARK_HOME/sbin
  3. 使配置生效 source /etc/profile
4. 修改spark配置文件
  1. spark-env.sh配置文件
    1. export SCALA_HOME=/data/server/scala-2.11.7
    2. export JAVA_HOME=/usr/java/jdk1.8.0_60/
    3. export SPARK_MASTER_IP=DEV-HADOOP-01
    4. export SPARK_WORKER_MEMORY=2048m
  2. slaves配置文件
    1. DEV-HADOOP-02
    2. DEV-HADOOP-03
启动spark集群
1. sbin/start-all.sh
集群启动验证
1. 执行jps命令,master节点可以看到Master进程,slave可以看到Worker进程
查看Spark UI
1. http://192.168.9.110:8080/
关闭集群
1. sbin/stop-all.sh

原创文章，作者：carmelaweatherly，如若转载，请注明出处：https://blog.ytso.com/tech/opensource/193639.html

赞 (0)

0 0

jenkins集成jmeter—–性能自动化

上一篇 2021年11月15日 11:08

spark基础-rdd特性

下一篇 2021年11月15日 11:08

发表回复

登录后才能评论