x86 64位的ubuntu环境下汇编(无优化)及函数调用栈的详解

news/2024/5/13 9:38:11

1. 引言

为了深入理解c++,决定学习一些简单的汇编语言。使用ubuntu系统下g++很容易将一个c++的文件编译成汇编语言。本文使用此方法,对一个简单的c++文件编译成汇编语言进行理解。

2.示例

文件名:reorder_demo.cpp

#include<stdio.h>typedef unsigned char uint8;uint8 a = 0U;
uint8 b = 0U;int main(int argn, char* argv[])
{a = b + 1;b = 1;return 0;
}

转化成汇编语言的编译命令如下

g++ -S reorder_demo.cpp

转化后生成reorder_demo.s,汇编语言内容如下:

	.file	"reorder_demo.cpp".text.globl	a.bss.type	a, @object.size	a, 1
a:.zero	1.globl	b.type	b, @object.size	b, 1
b:.zero	1.text.globl	main.type	main, @function
main:
.LFB0:.cfi_startprocendbr64pushq	%rbp.cfi_def_cfa_offset 16.cfi_offset 6, -16movq	%rsp, %rbp.cfi_def_cfa_register 6movl	%edi, -4(%rbp)movq	%rsi, -16(%rbp)movzbl	b(%rip), %eaxaddl	$1, %eaxmovb	%al, a(%rip)movb	$1, b(%rip)movl	$0, %eaxpopq	%rbp.cfi_def_cfa 7, 8ret.cfi_endproc
.LFE0:.size	main, .-main.ident	"GCC: (Ubuntu 9.4.0-1ubuntu1~20.04.2) 9.4.0".section	.note.GNU-stack,"",@progbits.section	.note.gnu.property,"a".align 8.long	 1f - 0f.long	 4f - 1f.long	 5
0:.string	 "GNU"
1:.align 8.long	 0xc0000002.long	 3f - 2f
2:.long	 0x3
3:.align 8
4:

以上汇编代码的格式是AT&T 格式的汇编,如果想生成intel格式的汇编可以使用以下命令:

g++ -S -masm=intel  reorder_demo.cpp

3.内存分区

为了更容易理解,从别处找了张内存分区的图供参考,如下

4.汇编分析(包括函数栈帧变化)

.file    "reorder_demo.cpp"

标识汇编文件的源文件为reorder_demo.cpp

.text

标识代码存放段开始。上面汇编中2个.text都是如此,第一个是存放全局变量的代码开始,第二个是存放main函数代码段的开始。

.zero    1

这是一条伪汇编指令,就是把CPU中通用寄存器R0的值设置为0.

伪指令的作用在汇编过程中起作用,一旦汇编结束,就没有实际的作用。

.globl    a                   

标识全局符号a
.bss                             

bss段一般标识未手动初始化的数据,并不给该段的数据分配实际的内存空间,只是记录数据所需空间的大小。
.type    a, @object

定义全局符号a的类型为object,意思就是全局符号a是一个变量。
.size    a, 1

全局变量a的尺寸为1个字节

a:

给全局变量a分配地址

globl b和a类似,不在赘述

.LFB0:  

局部函数开始 Local Function Bigin

.LFE0:

局部函数结束 Local Function END

.cfi_startproc

汇编语言中的一条伪指令,用于声明起始过程,为调试生成调试信息。

endbr64

汇编伪指令,空操作,主要由处理器流水线用作标记指令,以检测控制流违规。

pushq    %rbp

把寄存器%rbp的值压入调用栈中。%rbp标识函数栈帧的基地址。

模型如下(此处约定灰色表示命令执行前状态,红色表示当前块引用内汇编指令执行后的状态)

  补充x86-64 指令架构要求 64Bit 通用寄存器如下:

寄存器全称用途
%raxregister a extended存储过程调用返回值(return value)
%rbxregister b extended/
%rcxregister c extended存储过程调用的第四个参数
%rdxregister d extended存储过程调用的第三个参数
%rbpregister base pointer存储当前栈帧的基地址
%rspregister stack pointer存储栈顶地址
%rsiregister source index存储过程调用的第二个参数
%rdiregister destination index存储过程调用的第一个参数
%r8register 8存储过程调用的第五个参数
%r9register 9存储过程调用的第六个参数
%r10-%r11register 10 ~ register 11/
%r12-%r15register 12 ~ register 15/
%rip永远指向下一条即将执行的地址

可以看出一条规律:r打头的寄存器表示的是64bit的寄存器。 

其中,rbp和rsp模型表示

movq    %rsp, %rbp

直译:把rsp寄存器的值(函数基地址)移动到rbp寄存器(当前栈顶)中。

PS: movq表示移动的是64位寄存器,需要注意的是,和大多数所知的不同,此处移动的方向从第一参数移动到第二参数,以下也是如此。

理解:此条汇编指令代表调用新函数(main函数)前,函数栈帧基地址指向当前栈顶指针。

模型如下:

.cfi_def_cfa_offset 16

cfi_offset 6, -16

.cfi主要用于添加调试信息,功能意义可忽略。

movl    %edi, -4(%rbp)    
movq    %rsi, -16(%rbp)

函数把edi和rsi寄存器中值放入%rbp-4和%rbp-16的栈中,如上通用寄存器表格,rsi存放着函数第二参数edi除了是32bit的通用寄存器,其他方面的作用和rdi类似,存放函数第一参数。其中movl是表示移动的是long类型的数,而movq移动的是64位的数。对应于c++源码中的main函数参数,int argn(可知int占用32bit)和char* argv(因为是64位操作系统编译的,指针占用64bit)。模型如下(其中rsb寄存器的内容隐式地发生变化)

 movzbl    b(%rip), %eax

eax寄存器称为x86架构下32位(解析这段汇编调查中发现一个规律e打头的寄存器是32位寄存器)累加寄存器,主要用于算术运算,逻辑操作,其分布模型如下

AH占高8位,AL占低8位,AX占低16位。

movzbl 是把8bit的数填充0后移动到32位寄存器。

直译:把b的值放入到eax寄存器中,其中rip寄存器里放的是全局变量b的地址。模型如下

addl    $1, %eax

直译:把数字1和eax里面的值相加后放入到eax寄存器中。其中addl表示操作的数据类型是long类型的(32bit)
movb    %al, a(%rip)

直译:把寄存器AL(是EAX寄存器的低8bit)的值放入到全局变量a的地址里面。模型可以参考之前的图形。其中movb表示操作的对象是byte大小的数据(8bit)。

汇总起来,这里3条汇编指令对应的源代码为:

a = b +  1;

movb    $1, b(%rip)

直译:把1移动给全局变量b,其中rip寄存器里存放的是全局变量b的内存地址。
movl    $0, %eax

直译:把0移动给寄存器eax

popq    %rbp

直译:把寄存器rbp指向的地址从栈中弹出去。模型如下:

.cfi_def_cfa 7, 8  -> 伪指令,不讲解
ret

函数退出
.cfi_endproc 
-> 伪指令,不讲解

.size    main, .-main  

此处.size指令提示汇编器在目标文件中记录某种size的信息,此处是记录main函数的尺寸。

.-main 标识main函数的尺寸。理解这句话,就得先理解“.”的含义。

“.”标识内存中当前地址,main标识main开头地址,所以,尾地址“.” - 头地址“main”,表示main函数在内存中占用的空间尺寸。

.ident    "GCC: (Ubuntu 9.4.0-1ubuntu1~20.04.2) 9.4.0"

GCC编译器记录的追踪信息,目标文件结束时常常伴随记录,在链接时此信息会被去除。


http://www.mrgr.cn/p/61672036

相关文章

aspnetcore插件开发dll热加载

该项目比较简单,只是单纯的把业务的dll模块和controller的dll做了一个动态的添加删除处理,目的就是插件开发。由于该项目过于简单,请勿吐槽。复杂的后续可以通过泛型的实体、dto等做业务和接口的动态区分。 项目结构如下: 上面的两个模块是独立通过dll加载道项目中的 rep…

Python浅谈清朝秋海棠叶版图

1、清朝疆域概述&#xff1a; 清朝是我国最后一个封建王朝&#xff0c;其始于1616年建州女真部努尔哈赤建立后金&#xff0c;此后统一女真各部、东北地区。后又降服漠南蒙古&#xff0c;1644年入关打败农民起义军、灭南明&#xff0c;削三藩&#xff0c;复台湾。后又收外蒙&am…

day07 51单片机-18B20温度检测

18B20温度检测 1.1 需求描述 本案例讲解如何从18B20传感器获取温度信息并显示在LCD上。 1.2 硬件设计 1.2.1 硬件原理图 1.2.3 18B20工作原理 可以看到18B20有两根引脚负责供电&#xff0c;一根引脚负责数据交换。18B20就是通过数据线和单片机进行数据交换的。 1&#xf…

zabbix监控安装文档

Zabbix安装部署文档https://blog.csdn.net/m0_56055257/article/details/131260948以上文档可以直接复制内容部署,写的非常好用在本教程中,展示如何在 CentOS 8 / RHEL 8 / Oracle Linux 8 / Alma Linux 8/ Rocky Linux 8 上安装最新的 Zabbix 6.4 版本。1、基本配置1.0关闭防…

ansible作业

ansible作业 0.ansible了解 roles:多个角色的集合目录, 可以将多个的role,分别放至roles目录下的独立子目录中,如下示例 roles/mysql/nginx/tomcat/redis/默认roles存放路径/root/.ansible/roles /usr/share/ansible/roles /etc/ansible/rolesroles目录结构: playbook1.yml…

使用composer开发自己的扩展包

前言 日常的开发中我们经常用到composer去安装其他人封装好的扩展包&#xff0c;如果你有好的功能代码想分享给其他人使用&#xff0c;就可以使用composer打包成扩展包。其他人用composer安装后就可以使用你的扩展包了。这篇文章教你如何打包自己的composer扩展包。 1.新建仓…

【JAVA】PO、VO、DAO、BO、DTO、POJO你分得清吗?

在Java开发中&#xff0c;PO、VO、DAO、BO、DTO、POJO这些词汇是比较常见的&#xff0c;每个术语都有其特定的含义和用途。下面是它们的具体区别&#xff1a; 名称简要概况用途和特定PO (Persistence Object) 持…

【汇编语言】直接定址表

【汇编语言】直接定址表 文章目录 【汇编语言】直接定址表前言一、移位指令移位指令过程逻辑移位指令shl 和 shr 二、操作显存数据显示的原理显示缓冲区的结构显示信息的一种“直接”方式 三、描述内存单元的标号关于标号去了冒号的数据标号数据标号同时描述内存地址和单元长度…

实验一———美团APP

墨刀、Axure、Mockplus等原型设计工具优缺点分析: 一、墨刀 优点:在轻量级的移动端原型制作更加迅速,展示更加方便。 缺点:价格较贵,不能画流程图,相对于其他两款功能还不是很全面;应用局限性,专注于app原型设计,在后台和网页稍有乏力;归档能力不足,更倾向于链接、二…

LLM学习(5)——系统评估与优化

5.1 如何评估 LLM 应用 5.1.1 验证评估的一般思路 通过不断寻找Bad Case并进行针对性优化,将这些案例逐步加入验证集,形成一个具有一定样本数量的验证集。针对这种验证集,逐个进行评估变得不切实际,需要一种自动评估方法来对整体性能进行评估。验证迭代是构建以LLM为核心的…

1张图片+3090显卡微调Qwen-VL视觉语言大模型(仅做演示、效果还需加大数据量)

原项目地址&#xff1a;https://github.com/QwenLM/Qwen-VL/blob/master/README_CN.md 环境本地部署&#xff08;见之前博文&#xff09; 【本地部署 】23.08 阿里Qwen-VL&#xff1a;能对图片理解、定位物体、读取文字的视觉语言模型 (推理最低12G显存) 一、数据集格式说明 …

ESLlint重大更新后,使用旧版ESLint搭配Prettier的配置方式

概要 就在前几天&#xff0c;ESLint迎来了一次重大更新&#xff0c;9.0.0版本&#xff0c;根据官方文档介绍&#xff0c;使用新版的先决条件是Node.js版本必须是18.18.0、20.9.0&#xff0c;或者是>21.1.0的版本&#xff0c;新版ESLint将不再直接支持以下旧版配置(非扁平化…

Modbus转Profinet网关连接LED大屏与PLC通讯

Modbus转Profinet网关(XD-MDPN100)的主要功能是实现Modbus协议和Profinet协议之间的转换和通信。Modbus转Profinet网关集成了Modbus和Profinet两种协议,支持Modbus RTU主站/从站,并可以与RS485接口的设备,如变频器、智能高低压电器、电量测量装置等进行连接。通过Modbus转…

【Go语言】接口类型(一)接口类型与接口的值

本文是介绍golang接口类型的第一篇&#xff0c;主要介绍接口类型与接口类型的值的相关概念。 1. 静态类型、动态类型、动态值 所谓的静态类型&#xff08;即 static type&#xff09;&#xff0c;就是变量声明的时候的类型。 var age int // int 是静态类型 var name strin…

2024年最好用的10款ER图神器!

分享10款ER图工具,详细分析他们的功能特点、价格和适用场景,可以根据你的需求进行选择。ER图(Entity-Relationship Diagram)是数据库设计中常用的一种模型,用于描述实体之间的关系。这种图形化的表示方法旨在帮助人们理解和设计数据库结构,它们在数据库开发和设计中非常有…

【Network Automation系列】-- 第二章

继续上文,【Network Automation系列】-- 第一章 在第1章,对TCP/IP协议套件和Python的回顾中,我们研究了网络通信协议背后的理论和规范。 我们还快速浏览了一下Python语言。在本章中,我们将开始深入研究使用Python对网络设备的管理。 特别是,我们将研究使用Python以编程方式…

初中中考阅读理解难题一网打尽!句子结构深度解析+答案揭秘,助你轻松冲刺高分!-012

PDF格式公众号回复关键字:ZKYDT012原文1 Richard found the bird in the forest, didn’t he? 解析 1 Richard ,found 发现了, the bird 这只鸟, in the forest 在森林里, didn’t he? 不是吗 理查德在森林里发现了这只鸟,不是吗? 2 He saw a strange bird in a bush. 他…

【51单片机项目】基于51单片机自制多功能小键盘/模拟USB键盘【附源码】(STC89C52RC+CH9328)

目录 一、效果展示 二、创作灵感 三、硬件电路 注意事项 工作原理 四、源码 main.c 五、附录 CH9328工作原理 CH9328的模式选择 ​编辑 全键盘键码值表 参考链接 一、效果展示 该小键盘具有三种功能&#xff1a; 1、自动输入开机密码 2、每隔一段时间自动按下ct…

【Qt 专栏】DateTime日期时间组件

本文转载自:https://cloud.tencent.com.cn/developer/article/2371799 本章将重点介绍QDateTime日期与时间组件的常用方法及灵活运用。在Qt中,日期和时间的处理通常使用 QDateTime 类。QDateTime 是一个用于表示日期和时间的类,而与之相关的组件还包括 QDate 、 QTime以及QD…

【threejs教程7】threejs聚光灯、摄影机灯和汽车运动效果

【图片完整效果代码位于文章末】 在上一篇文章中我们实现了汽车模型的加载&#xff0c;这篇文章主要讲如何让汽车看起来像在运动。同时列出聚光灯和摄像机灯光的加载方法。 查看上一篇&#x1f449;【threejs教程6】threejs加载glb模型文件&#xff08;小米su7&#xff09;&…