当前位置: 首页 > news >正文

hadoop集成spark(spark on yarn)

文章目录

  • hadoop集成spark(spark on yarn)
    • 下载spark软件包
    • spark文件设置
      • spark-env.sh
      • workers
    • 环境变量设置
    • 发送spark到其余机器
    • 启动spark

hadoop集成spark(spark on yarn)

在hadoop搭建完成的前提下,集成spark:hadoop搭建请参考hadoop集群搭建

下载spark软件包

有很多种类spark的包,因为我是要集成到hadoop里面所以我选择spark-3.4.3-bin-hadoop3-scala2.13.tgz (集成hadoop自带scala)

# 在master节点下载
wget https://downloads.apache.org/spark/spark-3.4.3/spark-3.4.3-bin-hadoop3-scala2.13.tgz 
# 解压
tar -zxvf spark-3.4.3-bin-hadoop3-scala2.13.tgz 
# 重命名 (原始包名太长了)
mv spark-3.4.3-bin-hadoop3-scala2.13 spark

在这里插入图片描述

spark文件设置

#spark配置文件的路径
cd /home/ldsx/down_load/spark_data/spark/conf

spark-env.sh

配置spark自用环境变量

可以自己创建也可以copy,因为template就是空的

cp spark-env.sh.template spark-env.sh
vim spark-env.sh
#添加一下内容 换成自己的部署的实际信息即可
export JAVA_HOME=/home/ldsx/down_load/jdk_data_new/jdk1.8.0_411
export SPARK_MASTER_IP=192.168.0.76
export HADOOP_HOME=/home/ldsx/down_load/hadoop_data/hadoop-3.2.4
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop

workers

低版本叫slaves,高版本为workers

配置工作机器

cp workers.template  workers
vim workers
# 添加需要作为spark计算的机器
master
hadoop01

环境变量设置

sudo vim /etc/profile.d/my_env.sh
#配置spark路径方便使用
#spark_home
export SPARK_HOME=/home/ldsx/down_load/spark_data/spark
export PATH=$PATH:$SPARK_HOME/binsource  /etc/profile.d/my_env.sh

在这里插入图片描述

发送spark到其余机器

#因为做了免密直接传送
scp -r spark包 节点机器:相同路径
#我的matser 跟节点的目录结构都是完全一致的
scp -r spark_data hadoop01:/home/ldsx/down_load

启动spark

#因为hadoop里面也有start-all.sh,防止冲突直接进入spark目录下启动
cd /home/ldsx/down_load/spark_data/spark/sbin
./start-all.sh

8080:master默认Web端口

7077:master通信端口
在这里插入图片描述

master下进程,因为master配置成了worker机所以会同时存在Master,Worker进程

在这里插入图片描述

在这里插入图片描述

使用spark-submit启动一个test.py的任务后查看yarn与spark的UI

yarn界面

在这里插入图片描述

spark界面

在这里插入图片描述


http://www.mrgr.cn/news/5297.html

相关文章:

  • 【MAUI】Splat
  • 基于Kotlin Multiplatform的鸿蒙跨平台开发实践
  • Cesium 视频纹理
  • 鸿蒙(API 12 Beta3版)【使用ImagePacker完成图片编码】图片开发指导
  • JVM、JRE、JDK
  • 掌握电子邮件的艺术:使用 Mailbird 统一管理您的数字生活
  • AppenTalk | 不止于赛场,巴黎奥运会上的中国AI科技
  • Unity3D 模型碰撞检测问题详解
  • 使用预训练的 ONNX 格式的 YOLOv8n 模型进行目标检测,并在图像上绘制检测结果
  • Linux离线安装fontconfig
  • 数据可视化大屏模板-美化图表
  • 数据库系统 第22节 事务隔离级别
  • 信刻光盘摆渡系统安全合规实现跨网数据单向导入/导出
  • 2024音频剪辑指南:探索四大高效工具!
  • 虚幻反射-
  • JavaSocket 网络编程之 UDP
  • 图像处理之:Video Processing Subsystem(三)
  • 身份证识别、护照OCR、python身份证四要素实名认证API
  • gpt-2语言模型训练
  • 物联网设备心跳源码-SAAS本地化及未来之窗行业应用跨平台架构