HDFS的Shell操作及客户端配置方法

news/2024/5/21 0:08:42

HDFS进程启停命令

Hadoop HDFS组件内置了HDFS集群的一键启停脚本。

  • $HADOOP_HOME/sbin/start-dfs.sh,一键启动HDFS集群
  • $HADOOP_HOME/sbin/stop-dfs.sh,一键关闭HDFS集群
    执行原理:
  1. 在执行此脚本的机器上,启动(关闭)SecondaryNameNode
  2. 读取core-site.xml内容(fs.defaultFS项),确认NameNode所在机器,启动(关闭)NameNode
  3. 读取workers内容,确认DataNode所在机器,启动(关闭)全部DataNode

除了一键启停外,也可以单独控制进程的启停

  • $HADOOP_HOME/sbin/hadoop-daemon.sh,此脚本可以单独控制所在机器的进程的启停
    用法:hadoop-daemon.sh (start|status|stop) (namenode|secondarynamenode|datanode)
  • $HADOOP_HOME/bin/hdfs,此程序也可以用以单独控制所在机器的进程的启停
    用法:hdfs --daemon (start|status|stop) (namenode|secondarynamenode|datanode)

HDFS文件系统基本命令(跟Linux命令基本一样)

  • hadoop命令(老版本用法),用法:hadoop fs [generic options]
  • hdfs命令(新版本用法),用法:hdfs dfs [generic options]
  1. 创建文件夹 (mkdir)
    hadoop fs -mkdir [-p] <path>
    hdfs dfs -mkdir [-p] <path>
hadoop fs -mkdir -p /itest
hdfs dfs -mkdir -p /itest
  1. 上传文件到HDFS指定目录下(上传put,下载 get)
    hadoop fs -put [-f] [-p] <localsrc> ... <dst>
    hdfs dfs -put [-f] [-p] <localsrc> ... <dst>
hadoop fs -put test.txt /itest
hdfs dfs -put test.txt /itest
  1. 追加数据到HDFS文件中(appendToFile)
    hadoop fs -appendToFile <localsrc> ... <dst>
    hdfs dfs -appendToFile <localsrc> ... <dst>
hadoop fs -appendToFile 2.txt 3.txt /itest/1.txt
hdfs dfs -appendToFile 2.txt 3.txt /itest/1.txt
  1. HDFS数据删除操作(rm,skipTrash跳过回收站)
    hadoop fs -rm -r [-skipTrash] URI [URI ...]
    hdfs dfs -rm -r [-skipTrash] URI [URI ...]
hadoop fs -rm  -r -skipTrash /itest
hdfs dfs -rm  -r -skipTrash /itest
  1. HDFS shell其它命令(点此参照官方文档
    在这里插入图片描述
  2. HDFS WEB浏览
    在这里插入图片描述
    使用WEB浏览操作文件系统,一般会遇到权限问题
    在这里插入图片描述
    这是因为WEB浏览器中是以匿名用户(dr.who)登陆的,其只有只读权限,多数操作是做不了的。
    如果需要以特权用户在浏览器中进行操作,需要配置如下内容到core-site.xml并重启集群
  <property><name>hadoop.http.staticuser.user</name><value>hadoop</value></property>

== 注意:不推荐这样做 ==
HDFS WEBUI,只读权限挺好的,简单浏览即可
如果给与高权限,会有很大的安全问题,造成数据泄露或丢失

Big Data Tools插件

1、插件安装

在Jetbrains的产品中,均可以安装插件,其中:Big Data Tools插件可以帮助我们方便的操作HDFS,以下均支持Bigdata Tool插件,如

  • IntelliJ IDEA(Java IDE)
  • PyCharm(Python IDE)
  • DataGrip(SQL IDE)
    如图,在设置->Plugins(插件)-> Marketplace(市场),搜索Big Data Tools,点击Install安装即可
    在这里插入图片描述
    在这里插入图片描述

2、配置Windows

需要对Windows系统做一些基础设置,配合插件使用

  • 解压Hadoop安装包到Windows系统,如解压到:E:\hadoop-3.3.4
  • 设置$HADOOP_HOME环境变量指向:E:\hadoop-3.3.4
  • 下载 hadoop.dll 点此官网下载 和 winutils.exe 点此官网下载
    将hadoop.dll和winutils.exe放入$HADOOP_HOME/bin中
  • 然后打开插件,如下图
    在这里插入图片描述
    在这里插入图片描述
    至此,HDFS的Shell操作及客户端配置方法结束!!

http://www.mrgr.cn/p/15181544

相关文章

处理登录失效后提示多个错误

问题: 我的场景是后端规定&#xff0c;即使登录失效返回的code仍是200&#xff0c;然后data的code是999什么的&#xff1b; 原本代码&#xff1a; 修改版代码&#xff1a; 通过节 const NotLoginEvent () > {router.replace("/login");localStorage.clear();M…

炒股技术整理系列:金针探底 雪迪龙 2024-02-06

特征: 1、大幅度下跌,大幅度是什么程度? 3个月最高点到最低点 跌了48%,,从确认趋势一个月内,跌了30%。 2、长下影线。涨幅不超过1%。 3、第二天或第三天收大幅阳线,已站上5日线 4、第四天可以买入。不跌破最后一根大阴线的中间段,可一直拿着。翻译 搜索 复制

自定义的基于System.Net.Http.HttpClient的WebClient,可以作为微信支付宝的发起请求时的基础请求类

个人编写的,自己用于自己的微信api的请求的实现当中,源码公开,大家可以查看反编译源码。以下是使用方法: 第一步 搜索和安装zmjtool第二步 发起请求1 /**引入命名空间*/2 using ZmjTool;3 4 /**发起Get请求*/5 using (var cl = new ZmjTool.WebClient())6 {7 cl.Handle…

mysql80-DBA数据库学习1-数据库安装

掌握能力 核心技能 核心技能 mysql部署 官网地址www.mysql.com 或者www.oracle.com https://dev.mysql.com/downloads/repo/yum/ Install the RPM you downloaded for your system, for example: yum install mysql80-community-release-{platform}-{version-number}.noarch…

地铁查询app 结对作业三

经过今天一下午的奋斗 安卓app 只剩下最难的部分了 最短路径问题 我们考虑用迪杰斯特拉算法 不过 没有做出来 还要继续去学习一下这个代码 并寻求网上代码的帮助

解决跨域问题

代码量:100 博客:1 我们使用的是niginx 解决跨域问题,其实我上网搜索了很多niginx跨域的代码,但是不知道怎么使用放在哪里,刚才经过同学的帮助成功知道啦,下面展示一下路径的图片 这里的nginx.exe是启动,shutdown是自己写的可以快速关闭程序

数据库管理开发工具Navicat for MySQL Mac版下载

Navicat for MySQL&#xff08;Mac版&#xff09;是一款强大的数据库管理开发工具&#xff0c;专为MySQL设计。它提供直观的用户界面&#xff0c;支持数据建模、查询构建、数据传输等功能&#xff0c;帮助用户轻松管理数据库。其特点包括高效的数据处理能力、安全的数据传输机制…

文本数据处理

文本数据处理 情无论巨细,往往存在一个准备阶段。比如做饭炒菜,需要择菜、洗菜、切菜、热锅等准备工作;出远门需要整理好身份证、手机、钱包等随身物品。类似地,在处理文本的任务中,也存在预处理这么一个重要阶段,包括诸如统一数据格式、去噪、词形还原、分词之类的基本操…

UG NX二次开发(C#)-通过曲线组生成NURBS曲面

文章目录 1、前言2、UG NX中通过曲线组生成NURBS曲面的操作3、采用NXOpen C#方法的源代码1、前言 在UG NX中,曲线、曲面的操作使用比较多,对于创建NURBS曲面,可以通过曲线组来生成,本文以NXOpen C#的方法实现通过曲线组生成NURBS曲面的功能。对于UG NX二次开发感兴趣或者有…

linux之zabbix自定义监控

zabbix基本配置见&#xff1a;写文章-CSDN创作中心https://mp.csdn.net/mp_blog/creation/editor/136783672 自定义监控规则 命令为who | wc -l 显示为2&#xff0c;主机一个&#xff0c;mobaxterm一个&#xff0c;思路是开启3个终端&#xff0c;让主机的zabbix服务自动检测1…

7.Python Spark安装

7.1Scla安装 下载:wget https://scala-lang.org/files/archive/scala-2.13.0.tgz 解压:tar xvf scala-2.13.0.tgz 移动到/usr/local 目录 :sudo mv scala-2.13.0 /usr/local/scala 设置Scala环境变量: sudo gedit ~/.bashrc source ~/.bashrc 启动scala :q退出 7.2安装Spar…

CommandBuffer使用 - 分屏

原理 先抓取整个屏幕画面到RenderTexture1上,然后把左边一半复制到RenderTexture2,右边一半复制到RenderTexture3效果 c#代码using UnityEngine; using UnityEngine.Rendering;[RequireComponent(typeof(Camera))] public class SplitScreenEff : MonoBehaviour {public Ren…

2024年3月28号java学习

面向对象 一个对象的内存图 Student s = new Studen();加载new类的.class文件(只需要加载到方法区一次) 声明局部变量(s) 在堆中开辟一个空间 默认初始化 显示初始化 构造方法初始化 将堆内存中的地址值赋值给左边的局部变量this关键字 是一个指向方法调用者的内存地址的引用…

C++堆详细讲解

介绍 二叉堆是一种基础数据结构&#xff0c;主要应用于求出一组数据中的最大最小值。C 的STL中的优先队列就是使用二叉堆。 堆的性质 : 1 . 堆是一颗完全二叉树 ; 2 . 堆分为大根堆 和 小根堆(这里不讨论那些更高级的如:二叉堆&#xff0c;二叉堆&#xff0c;左偏树等等) …

论文笔记 SimpleNet A Simple Network for Image Anomaly Detection and Localization

背景 对于工业场景上的异常检测和定位任务, 由于零件的异常情况具有多样性和随机性, 所以很难用有监督的方式来解决; 目前用的最多的是用无监督的方式, 在训练过程中只使用正常样本进行训练, 目前无监督解决异常检测任务的三个趋势是基于重建的方法, 基于合成的方法以及基于嵌入…

【MySQL】3.2MySQL事务和存储引擎

MySQL事务 一、MySQL事物的概念 事务是一种机制&#xff0c;包含了一件事的完整的一个过程 ●事务是一种机制、一个操作序列&#xff0c;包含了一组数据库操作命令&#xff0c;并且把所有的命令作为一个整体一起向系统提交或撤销操作请求&#xff0c;即这一组数据库命令要么…

量化交易软件开发定制的步骤

量化交易软件的定制开发是一个复杂而精细的过程&#xff0c;需要经过一系列步骤来确保最终交付的软件符合客户的需求并具有高度的可靠性和效率。以下是量化交易软件开发定制的主要步骤&#xff1a; 1. 需求分析与规划 在开始开发之前&#xff0c;首先需要与客户深入沟通&…

Meta 推出SceneScript,一种全新的3D场景重建方式

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗&#xff1f;订阅我们的简报&#xff0c;深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同&#xff0c;从行业内部的深度分析和实用指南中受益。不要错过这个机会&#xff0c;成为AI领…

Java作业练习_第五周子类与继承作业(小白记录,仅供参考)

@目录第一题第二题第三题第四题第五题第六题第七题第八题第九题第十题 第一题 1在Person类中定义的是 Teacher和Manager类的共性内容, 姓名 属性,年龄属性, String name ; int age;方法say(); 2定义Person类的子类Teacher类。可以使用父类Person的姓名和年龄属性,说话的方…