栈的磁盘优化:降低存取成本的算法与实现

news/2024/5/19 23:10:32

栈的磁盘优化:降低存取成本的算法与实现

  • 问题背景
  • 简单实现方法的分析
    • 实现方法
    • PUSH操作
    • POP操作
    • 成本分析
    • 渐近分析
  • 优化实现方法
    • 实现方法
    • 成本分析
    • 渐近分析
  • 进一步优化:双页管理策略
    • 实现方法
    • 管理策略
    • 成本分析
  • 伪代码示例
  • C代码示例
  • 结论

问题背景

在具有有限快速主存和较大慢速磁盘存储空间的计算机系统中,实现一个可以增长到非常大,以至于无法全部装入主存中的栈,是一个具有挑战性的问题。栈的操作包括PUSH(入栈)和POP(出栈),操作的对象是单字数据。

在这里插入图片描述

简单实现方法的分析

实现方法

将整个栈存放在磁盘上,仅在主存中保持一个指向栈顶元素磁盘地址的指针。栈顶元素位于磁盘页的特定位置,该位置由栈指针的值和每页字数共同决定。

PUSH操作

  1. 增加栈指针。
  2. 从磁盘读取适当的页到主存。
  3. 将新元素复制到页上的适当位置。
  4. 将该页写回磁盘。

POP操作

  1. 减少栈指针。
  2. 从磁盘读取所需的页到主存。
  3. 返回栈顶元素。
  4. 不需要写回,因为页未被修改。

成本分析

  • 磁盘存取次数:每次PUSH或POP操作都需要至少一次磁盘存取(读取或写入)。
  • CPU时间:每次磁盘存取都需要θ(m)的CPU时间,其中m是每页的字数。

渐近分析

  • 对于n个栈操作,简单实现需要n次磁盘存取,因此总磁盘存取次数为n。
  • CPU时间是磁盘存取次数乘以每页的字数处理时间,即n * θ(m)。

优化实现方法

实现方法

在主存中保持栈的一页或多页,使用少量额外主存记录当前哪些页在主存中。只有当相关的磁盘页在主存中时,才能执行栈操作。如果需要,可以写回当前页到磁盘,并从磁盘读入新的一页。

成本分析

  • 对于n个PUSH操作,如果使用单页主存策略,磁盘存取次数为n,因为每个PUSH都需要从磁盘读取和写入一次。
  • 对于n个POP操作,如果栈顶元素已经在主存中,则不需要磁盘存取。如果需要从磁盘读取,则每个POP操作最多需要一次磁盘存取。

渐近分析

  • 对于n个PUSH操作,磁盘存取次数为n,CPU时间为n * θ(m)。
  • 对于n个POP操作,如果栈顶元素已经在主存中,则磁盘存取次数为0;否则,最多为n,CPU时间类似。

进一步优化:双页管理策略

实现方法

在主存中保持栈的两页,使用额外的少量主存记录哪些页在主存中。通过有效的页管理策略,减少磁盘存取次数。

管理策略

  1. 当执行PUSH操作时,如果当前页未满,直接在该页上操作;如果已满,则写回该页到磁盘,并从磁盘读取下一页到主存。
  2. 当执行POP操作时,如果当前页不为空,直接在该页上操作;如果为空,则从磁盘读取上一页到主存,并写回当前页到磁盘。

成本分析

  • 对于每个栈操作,摊还磁盘存取次数为O(1/m),因为每页可以进行m个操作后才需要磁盘存取。
  • 摊还CPU时间为O(1),因为每次操作后,都只有常数级别的CPU工作量。

伪代码示例

PUSH(S, x)if S.full thenWrite S to diskLoad next page from disk into Send ifS.top <- xS.size <- S.size + 1POP(S)if S.empty thenLoad previous page from disk into SWrite S to diskend ifx <- S.topS.size <- S.size - 1return x

C代码示例

#define PAGE_SIZE 1024  // 假设每页可以存储1024个单字
typedef struct {int data[PAGE_SIZE];int size;int page_number;
} StackPage;void push(StackPage *S, int x) {if (S->size == PAGE_SIZE) {// 写入当前页到磁盘// 加载下一页到主存}S->data[S->size] = x;S->size++;
}int pop(StackPage *S) {if (S->size == 0) {// 从磁盘加载上一页到主存// 写入当前页到磁盘}S->size--;return S->data[S->size];
}

结论

通过优化栈的磁盘和主存管理策略,可以显著减少磁盘存取次数和CPU时间,从而提高栈操作的效率。双页管理策略通过在主存中保持两个栈页,进一步优化了磁盘存取次数和CPU时间,使得任何单个栈操作的摊还成本降低。


http://www.mrgr.cn/p/03865725

相关文章

28.leetcode---前K个高频单词(Java版)

题目链接: https://leetcode.cn/problems/top-k-frequent-words/description/ 题解: 代码: 测试:

windows系统远程执行脚本部署项目操作手册

windows系统远程执行脚本部署项目操作手册 windows系统远程执行脚本部署项目 如果频繁的需要部署项目到远程的服务器上,每次要手动上传项目,然后停止项目,启动项目,很麻烦,像Linux天生支持远程执行脚本 Windows借助工具也可以做到. 安装WinSCP软件 自行下载软件或关注我的公…

Material Studio 计算分子静电力、电荷密度以及差分电荷密度

1.先打开Material Studio导入要计算的分子cif文件或者mol文件&#xff0c;直接Flie-Import 2.高斯几何优化一下结构&#xff0c;参数按照我的设置就行&#xff0c;一般通用&#xff0c;后面出问题再调整 3.点完Run后会跳出很多计算过程&#xff0c;不用管&#xff0c;等他计算完…

新能源汽车动力电池热管理-液冷方案应用原理与应用前景简介

前言 动力电池是新能源汽车的核心部件之一&#xff0c;其性能和寿命直接影响着车辆的续航里程和使用成本。液冷方案作为一种常见的动力电池温控解决方案&#xff0c;被广泛应用于新能源汽车领域。本文将详细介绍液冷方案的原理、发展方向以及市场前景。 一、液冷方案的原理 …

C++笔记-makefile添加第三方.h和.cpp及添加.h和lib库模板

目文件结构如下所示时&#xff1a; project/├── main.cpp├── test.cpp├── DIRA/│ ├── A.cpp│ └── A.h├── DIRBLIB/│ └── libB.so└── include/└── B.h Makefile如下所示&#xff1a; # 编译器设置 CXX g CXXFLAGS -stdc11 -Wall# 目录…

Java_方法引用

方法引用就是把已经有的方法拿过来用&#xff0c;当作函数式接口中抽象方法的方法体。 条件&#xff1a; 1.引用处需要是函数式接口 2.被引用的方法需要已经存在 3.被引用的方法的形参和返回值需要跟抽象方法的形参和返回值保持一致 4.被引用方法的功能需要满足当前的要求 简…

【工作记录】openjdk-22基础镜像的构建

背景 近期使用到的框架底层都用的是springboot3.0&#xff0c;要求jdk版本在17甚至更高。 于是决定制作一个基于openjdk22的基础镜像&#xff0c;本文对这一过程进行记录。 作为记录的同时也希望能够帮助到需要的朋友。 期望效果 容器内可以正常使用java相关命令且版本是2…

尊享面试100题(314.二叉树的垂直遍历python)

题目关键词&#xff0c;从左到右&#xff0c;从上到下&#xff0c;那么使用bfs宽度优先算法。 使用字典v保存每一列的值。 class Solution:def verticalOrder(self, root: Optional[TreeNode]) -> List[List[int]]:if not root: return []v defaultdict(list)qu deque()…

SparkSql介绍

概述 SparkSQL&#xff0c;顾名思义&#xff0c;就是Spark生态体系中的构建在SparkCore基础之上的一个基于SQL的计算模块。SparkSQL的前身不叫SparkSQL&#xff0c;而叫Shark&#xff0c;最开始的时候底层代码优化&#xff0c;sql的解析、执行引擎等等完全基于Hive&#xff0c…

FreeBSD RISCV 在QEME中实践-网络配置

在前一篇文章中&#xff0c;我们一起进行了FreeBSD RISCV 在QEME中实践 现在&#xff0c;让我们配置好网络吧&#xff01; 先上结论&#xff1a;用默认配置启动即可&#xff0c;网络就加载好了&#xff0c;只是不能ping罢了。因为不能ping&#xff0c;以为网络没通&#xff0…

excel如何将多列数据转换为一列?

这个数据整理借用数据透视表也可以做到&#xff1a; 1.先将数据源的表头补齐&#xff0c;“姓名” 2.点击插入选项卡&#xff0c;数据透视表&#xff0c;在弹出对话框中&#xff0c;数据透视位置选择 现有工作表&#xff0c;&#xff08;实际使用时新建也没有问题&#xff09;…

学习笔记480—Obsidian中如何实现思维导图功能-mindmap插件

Obsidian中如何实现思维导图功能-mindmap插件 思维导图插件 思维导图是大家耳熟能详的一类软件,以xmind为代表。那么在obsidian中如何实现思维导图效果呢,本文介绍思维导图插件Enhancing mindmap的安装与使用过程。 效果图插件下载 Github地址: https://github.com/MarkMind…

初识Fink

概述 Fink用于处理计算的,如下图所示,将交易、日志、物联网、点击流的数据输入到Flink中进行处理计算,处理完成之后输出到应用、日志、数据库中。Flink是以流的方式对数据进行处理的,所谓流就是源源不断,每时每刻都在有序的产生,例如设备仪器运行数据就属于数据流,因为设…

三角函数之和差化积公式

知识点1:三角函数奇偶性: \(\sin(-\theta)=-\sin\theta, \quad \cos(-\theta)=\cos\theta\)如上图: 单位半圆的半径为1,\(\triangle AOB\)为等腰三角形。 点\(C\)为线段\(AB\)之中点,连接\(CO\)。 根据等腰三角形的性质,\(OC\) 是 \(△AOB\) 的角平分线和垂直平分线。 \(…

每日一题 礼物的最大价值

题目描述 礼物的最大价值_牛客题霸_牛客网 解题思路 这是一个典型的动态规划问题。我们可以使用一个二维数组 dp[][] 来存储到达每个格子时可以获得的最大价值。状态转移方程为 dp[i][j] max(dp[i-1][j], dp[i][j-1]) grid[i][j]&#xff0c;表示到达当前格子的最大价值是从…

android init进程启动流程

一,Android系统完整的启动流程 二,android 系统架构图 三,init进程的启动流程 四,init进程启动服务的顺序 五,android系统启动架构图 六,Android系统运行时架构图 bool Service::Start() {// Starting a service removes it from the disabled or reset state and// imme…

buuctf-pwn-get_started_3dsctf_2016

题目地址:https://buuoj.cn/challenges#get_started_3dsctf_2016 检查一下保护情况拖进ida分析主函数有个很明显的栈溢出漏洞 没有找到system函数,但是发现了这个函数后面有两种解题思路 0x01 调用get_flag函数 这个函数读取了flag.txt,并输出内容,那么我们就想办法溢出到这…

再议大模型微调之Zero策略

1. 引言 尽管关于使用Deepspeed的Zero策略的博客已经满天飞了&#xff0c;特别是有许多经典的结论都已经阐述了&#xff0c;今天仍然被问到说&#xff0c;如果我只有4块40G的A100&#xff0c;能否进行全量的7B的大模型微调呢&#xff1f; 正所谓“纸上得来终觉浅&#xff0c;…

《Video Mamba Suite》论文笔记(1)Mamba在时序建模中的作用

原文链接 https://arxiv.org/abs/2403.09626https://arxiv.org/abs/2403.09626 原文代码 https://github.com/OpenGVLab/video-mamba-suitehttps://github.com/OpenGVLab/video-mamba-suite 原文笔记 What 《Video Mamba Suite: State Space Model as a Versatile Altern…

群晖存储池损毁,加上错误操作删除

如何联系本人? 储存池被我误删除了,导致无法正常通过,格式化群晖第一、第二分区进行恢复。系统损毁了,先导出群晖设置,进入pe使用DiskGenius格式化你所有硬盘的第一个和第二个分区(大约是1-2个G大小的分区)切记不是删除分区, 第三个分区千万不要动,那是数据分区,然后…