当前位置: 首页 > news >正文

理解Flink算子链

前言

对于flink初学者,如果我们观察WebUi中任务执行情况,可能会有一个疑惑,为什么节点和代码中的算子对不上?
在这里插入图片描述
从WebUi上看起来像是一个节点,会把转换处理的很多个任务都连接在一起,合并成了一个“大任务”。这又是怎么回事呢?

算子间的数据传输

我们先来考察一下算子任务之间数据传输的方式。
在这里插入图片描述
如上图所示,一个数据流在算子之间传输数据的形式可以是一对一(one-to-one)的直通 (forwarding)模式,也可以是打乱的重分区(redistributing)模式,具体是哪一种形式,取决于算子的种类。

  1. 一对一(One-to-one,forwarding)
    这种模式下,数据流维护着分区以及元素的顺序。比如图中的 source 和 map 算子,source算子读取数据之后,可以直接发送给 map 算子做处理,它们之间不需要重新分区,也不需要调整数据的顺序。这就意味着 map 算子的子任务,看到的元素个数和顺序跟 source 算子的子任务产生的完全一样,保证着“一对一”的关系。map、filter、flatMap 等算子都是这种 one-to-one的对应关系。


http://www.mrgr.cn/news/7450.html

相关文章:

  • Selenium工具使用Python实现下拉框定位操作
  • 定制属于你自己的 Stable Diffusion
  • 5G毫米波测试助力突破高频段设备局限,实现高效外场测试
  • 京东-接口php
  • TMC2209模块开启无限位归零
  • kafka 消费组 分区分配策略
  • oracle备份策略
  • 调试理解 NodeJS 模块机制
  • RabbitMQ高级用法
  • 【Linux修行路】文件系统之缓冲区
  • Bootstrap 面板(Panels)
  • 主机安全-网络攻击监测
  • AI绘图:艺术与科技的未来交响
  • 使用密钥文件 SSH 登录服务器:Windows、macOS使用终端或连接工具
  • Linux开发:通过readlink读取软连接指向的文件
  • UnQLite:多语言支持的嵌入式NoSQL数据库深入解析
  • C++前向声明简介
  • 数据库系统 第23节 并发控制
  • 技术文档索引
  • MySQL连接类型