当前位置: 首页 > news >正文

【Hadoop|MapReduce篇】Hadoop序列化概述

1. 什么是序列化

序列化就是把内存中的对象,转换成字节序列(或其他数据传输协议)以便于存储到磁盘(持久化)和网络传输。

反序列化就是将收到的字节序列(或其他数据传输协议)或者磁盘的持久化数据,转换成内存中的对象。

2. 为什么要序列化

一般来说,“活的”对象只生存在内存中,关机断电就没有了。而且活的对象只能由本地的进程使用,不能被发送到网络上的另外一台计算机。然后序列化可以存储“活的”对象,可以将“活的”对象发送到远程计算机。

3. 为什么不用java序列化

java序列化是一个重量级序列化框架(Serializable),一个对象被序列化后,会附带很多额外的信息(各种校验信息,Header,继承体系等),不便于在网络中高效传输。而hadoop的序列化只是会附带简单的校验,紧凑存储空间少,快速传输速度块。互操作性好。


http://www.mrgr.cn/news/21755.html

相关文章:

  • Qt: 详细理解delete与deleteLater (避免访问悬空指针导致程序异常终止)
  • 儿童心理学在ChatGPT提示词设计中的应用:分析与案例
  • 【Linux】Linux 共享内存:高效的进程间通信
  • springboot组件使用-mybatis组件使用
  • python科学计算:NumPy 数组的高级操作
  • 分享一个基于uniapp科技馆服务微信小程序 博物馆管理小程序(源码、调试、LW、开题、PPT)
  • springboot启动时替换配置参数
  • JVM、JRE和 JDK:理解Java开发的三大核心组件
  • SAP学习笔记 - 开发03 - CDSView开发环境搭建,Eclipse中连接SAP,CDSView创建
  • 初识Linux · 有关gdb
  • 算法学习:滑动窗口
  • 文法—语法推导树例题
  • 探索Invoke:Python自动化任务的瑞士军刀
  • 一文搞定Nginx配置RTMP!
  • vue3 为组件的 emits 标注类型,defineEmits基于类型的定义的简单理解
  • 关于ddddocr运行错误的解决
  • Uniapp基础学习(四)——常见API
  • 从零开始的机器学习之旅
  • 伽罗华域GF的简单计算
  • Web2和Web3笔记