含大量图文解析及例程 | Linux下的ELF文件、链接、加载与库(中)

可执行文件的装载进程和装载的基本概念的介绍

程序(可执行文件)和进程的区别

程序是静态的概念,它就是躺在磁盘里的一个文件。进程是动态的概念,是动态运行起来的程序。

现代操作系统如何装载可执行文件

给进程分配独立的虚拟地址空间将可执行文件映射到进程的虚拟地址空间(mmap)将CPU指令寄存器设置到程序的入口地址,开始执行

可执行文件在装载的过程中实际上如我们所说的那样是映射的虚拟地址空间,所以可执行文件通常被叫做映像文件(或者Image文件)。

可执行ELF文件的两种视角

可执行ELF格式具有不寻常的双重特性,编译器、汇编器和链接器将这个文件看作是被区段(section)头部表描述的一系列逻辑区段的集合,而系统加载器将文件看成是由程序头部表描述的一系列段(segment)的集合。一个段(segment)通常会由多个区段(section)组成。例如,一个“可加载只读”段可以由可执行代码区段、只读数据区段和动态链接器需要的符号区段组成。

区段(section)是从链接器的视角来看ELF文件,对应段表 Section Headers,而段(segment)是从执行的视角来看ELF文件,也就是它会被映射到内存中,对应程序头表 Program Headers。

含大量图文解析及例程 | Linux下的ELF文件、链接、加载与库(中)

我们用命令readelf -a [fileName] 中的Section to Segment mapping部分来看一下可执行文件中段的映射关系。

可执行文件的程序头表

我们用readelf -h [fileName]命令查看一个可执行ELF文件的ELF头时,会发现与可重定位ELF文件的ELF头有一个重大不同:可重定位文件ELF头中 Start of program headers 为0,因为它是没有程序头表,Program Headers,Elf64_Phdr的;而在可执行ELF文件中,Start of program headers 是有值的,为64,也就是说,在可执行ELF文件中程序头表会紧接着ELF头(因为ELF头的大小即为64字节)。

我们通过readelf -l [fileName]可以直接查看到程序头表。

可执行ELF文件个进程虚拟地址空间的映射关系

我们可以通过 cat /proc/[pid]/maps 来查看某个进程的虚拟地址空间。

该虚拟文件有6列,分别为:

含大量图文解析及例程 | Linux下的ELF文件、链接、加载与库(中)

vdso的全称是虚拟动态共享库(virtual dynamic shared library),而vsyscall的全称是虚拟系统调用(virtual system call),关于这部分内容有兴趣的读者可以看看https://0xax.gitbooks.io/linux-insides/content/SysCall/syscall-3.html。

总体来说,在程序加载过程中,磁盘上的可执行文件,进程的虚拟地址空间,还有机器的物理内存的映射关系如下:

含大量图文解析及例程 | Linux下的ELF文件、链接、加载与库(中)

Linux下的装载过程

接下来我们进一步探究一下Linux是怎么识别和装载ELF文件的,我们需要深入Linux内核去寻找答案 (内核实际处理过程涉及更多的过程,我们这里主要关注和ELF文件处理相关的代码)。

当我们在bash下输入命令执行某一个ELF文件的时候,首先bash进程调用fork()系统调用创建一个新的进程,然后新的进程调用execve()系统调用执行指定的ELF文件 ,内核开始真正的装载工作。

下图是Linux内核代码中与ELF文件的装载相关的一些代码:

含大量图文解析及例程 | Linux下的ELF文件、链接、加载与库(中)

/fs/binfmt_elf.c中 Load_elf_binary的代码走读:

检查ELF文件头部信息(一致性检查)加载程序头表(可以看到一个可执行程序必须至少有一个段(segment),而所有段的大小之和不能超过64K(65536u))寻找和处理解释器段(动态链接部分会介绍)装入目标程序的段(elf_map)填写目标程序的入口地址填写目标程序的参数,环境变量等信息(create_elf_tables)start_thread会将 eip 和 esp 改成新的地址,就使得CPU在返回用户空间时就进入新的程序入口…例子:静态ELF加载器,加载 a.out 执行

我们同样以刚才介绍静态链接时的a.c、b.c、main.c的例子来看一下静态链接的可执行文件的加载。

静态ELF文件的加载:将磁盘上静态链接的可执行文件按照ELF program header,正确地搬运到内存中执行。

操作系统在execve时完成:

操作系统在内核态调用mmap进程还未准备好时,由内核直接执行 ”系统调用“映射好 a.out 的代码、数据、堆区、堆栈、vvar、vdso、vsyscall更简单的实现:直接读入进程的地址空间

加载完成之后,静态链接的程序就开始从ELF entry开始执行,之后就变成我们熟悉的状态机,唯一的行为就是取指执行。

我们通过readelf来查看a.out文件的信息:

输出:

含大量图文解析及例程 | Linux下的ELF文件、链接、加载与库(中)

我们这里看到,程序的入口地址是:Entry point address: 0x400a80。我们接着用gdb来调试:

含大量图文解析及例程 | Linux下的ELF文件、链接、加载与库(中)

上图是笔者在gdb中调试的一些内容:

我们用starti来使得程序在第一条指令就停下,可以看到,程序确实是从0x400180开始的,与我们上面查到的入口地址一致。而我们用cat /proc/[PID]/maps 来查看这个程序中内存的内容,看到我们之前提到的代码、数据、堆区、堆栈、vvar、vdso、vsyscall都已经被映射进了内存中。

调试的结果符合我们对静态程序加载时操作系统的行为的预期。

动态链接什么是动态链接以及为什么需要动态链接

实际上,链接程序在链接时一般是优先链接动态库的,除非我们显式地使用-static参数指定链接静态库,像这样:

静态链接和动态链接的可执行文件的大小差距还是很显著的, 因为静态库被链接后库就直接嵌入可执行文件中了。

这样就带来了两个弊端:

首先就是系统空间被浪费了。这是显而易见的,想象一下,如果多个程序链接了同一个库,则每一个生成的可执行文件就都会有一个库的副本,必然会浪费系统空间。再者,一旦发现了库中有bug或者是需要升级,必须把链接该库的程序找出来,然后全部需要重新编译。

libc.so中有300K 条指令,2 MiB 大小,每个程序如果都静态链接,浪费的空间很大,最好是整个系统里只有一个 libc 的副本,而每个用到 libc 的程序在运行时都可以用到 libc 中的代码。

下图中的 hello-dy 和 hello-st 是同一个hello源文件hello.c分别动态 / 静态链接后生成的可执行文件的大小,大家可以感受一下,查了一百倍。而且这只是链接了libc标准库,在大型项目中,我们要链接各种各样的第三方库,而静态链接会把全部在链接时就链接到同一个可执行文件,那么其大小是很难接受的。

含大量图文解析及例程 | Linux下的ELF文件、链接、加载与库(中)

动态库的出现正是为了弥补静态库的弊端。因为动态库是在程序运行时被链接的,所以磁盘上和内存中只要保留一份副本,因此节约了磁盘空间。如果发现了bug或要升级也很简单,只要用新的库把原来的替换掉就行了。

Linux环境下的动态链接对象都是以.so为扩展名的共享对象(Shared Object)。

真的是动态链接的吗?

我们常说gcc默认的链接类型就是动态链接,而且我们及其中运行的大部分进程也都是动态链接的,真的是这样的吗?我们不妨来做个实验验证一下。

我们通过创建一个动态链接库 libhuge.so, 然后创建1000个进程去调用这个库中的foo函数,该函数是128M 个 nop。如果程序不是动态链接的话,1000 * 128MB的内存占用足以撑爆大多数个人电脑的内存。而如果程序确实是动态链接的,即内存中只有一份代码,那么只会有很小的内存占用。我们是这样做的:

首先我们有huge.S:

文心大模型 文心大模型

百度飞桨-文心大模型 ERNIE 3.0 文本理解与创作

文心大模型 56 查看详情 文心大模型 代码语言:javascript代码运行次数:0运行复制

.global foofoo:        # 128MiB of nop        .fill 1024 * 1024 * 128, 1, 0x90        ret

这就是我们刚才说的一个动态链接库的源代码。我们一会儿会把他编译成 libhuge.so供我们的huge.c调用,我们的huge.c是这样的:

代码语言:javascript代码运行次数:0运行复制

#include #include int main(){ foo(); // huge code, dynamic linked printf("pid = %dn", getpid()); while (1) sleep(1);}

它会调用foo函数,并在结束后打印自己的PID,然后睡眠。Makefile如下:

代码语言:javascript代码运行次数:0运行复制

LIB := /tmp/libhuge.soall: $(LIB) a.out$(LIB): huge.S gcc -fPIC -shared huge.S -o $@a.out: huge.c $(LIB) gcc -o $@ huge.c -L/tmp -lhugeclean: rm -f *.so *.out $(LIB)

正如我们刚才所介绍的,我们会先将huge.S编译成动态链接库libhuge.so放在/tmp下,然后我们的huge.c回去动态链接这个库,并完成自己的代码。这还不够,我们要创建1000个进程来执行上述行为。这样才能验证我们的动态链接是不是在内存中真的只有一份代码,我们用下面的脚本来完成:

代码语言:javascript代码运行次数:0运行复制

#!/bin/bash# for i in {1...1000}for i in `seq 1 100`do LD_LIBRARY_PATH=/tmp ./a.out &donewait# ps | grep "a.out" | grep -Po "^(d)*" | xargs kill -9  用于清空生成的进程

实验证明,我们的操作系统能够很好地运行这1000个进程,并且内存只多占用了 400MB。也就是说,库中的foo函数确实是动态链接的,内存中只有一份foo的副本。

这在操作系统内核不难实现:所有以只读方式映射同一个文件的部分(如代码部分)时,都指向同一个副本,这个过程中会创建引用计数。

动态链接的例子

假如我们要制作一个关于向量的动态链接库libvector.so,它包含两个源代码addvec.c和multvec.c如下:我们只需要这样来进行编译:

其中-fpic选项告诉编译器生成位置无关代码(PIC),而-shared选项告诉编译器生成共享库。

我们现在拿一个使用到这个共享库的可执行文件来看一下,其源代码main.c:

代码语言:javascript代码运行次数:0运行复制

// main.c#includeint addvec(int*, int*, int*, int);int x[2] = {1, 2};int y[2] = {3, 4};int z[2];int main(){        addvec(x, y, z, 2);        printf("z = [%d %d]n", z[0], z[1]);        while(1);        return 0;}

注意我们在最后加了一个死循环是为了让进程保持运行,然后去查看进程的虚拟地址空间。

我们先编译源码,注意在同目录下可以直接按以下命令编译,之后我们会介绍将动态链接库放到环境目录后的编译命令。

然后先用file命令查看生成的可执行文件a.out的文件信息,再用ldd命令查看其需要的动态库,最后查看其虚拟地址空间。

输出:

含大量图文解析及例程 | Linux下的ELF文件、链接、加载与库(中)

我们看到,该可执行文件是共享对象,并且是动态链接的。

输出:

含大量图文解析及例程 | Linux下的ELF文件、链接、加载与库(中)

ldd命令就是用来查看该文件所依赖的动态链接库。

输出:

含大量图文解析及例程 | Linux下的ELF文件、链接、加载与库(中)

我们看到,除了像静态链接时,进程地址空间中的堆、栈、vvar、vdso、vsyscall等之外,还有了许多动态链接库.so。

动态链接的实现机制程序头表

我们同样用readelf -l [fileName]来查看动态链接的可执行ELF文件的程序头表:

含大量图文解析及例程 | Linux下的ELF文件、链接、加载与库(中)

可以看到编译完成之后地址是从 0x00000000 开始的,即编译完成之后最终的装载地址是不确定的。

关键技术

之前在静态链接的过程中我们提到过重定位的过程,那个时候其实属于链接时的重定位,现在我们需要装载时的重定位 ,主要使用了以下关键技术:

PIC位置无关代码GOT全局偏移表GOT配合PLT实现的延迟绑定技术

引入动态链接之后,实际上在操作系统开始运行我们的应用程序之前,首先会把控制权交给动态链接器,它完成了动态链接的工作之后再把控制权交给应用程序。

可以看到动态链接器的路径在.interp这个段中体现,并且通常它是个软链接,最终链接在像ld-2.27.so这样的共享库上。

.dynamic段

我们来看一下和动态链接相关的.dynamic段和它的结构,.dynamic段其实就是全局偏移表的第一项,即GOT[0]。

可以通过readelf -d [fileName]来查看。

它对应的是elf.h中的Elf64_Dyn这个结构体。

动态链接器ld

对于动态链接的可执行文件,内核会分析它的动态链接器地址,把动态链接器映射到进程的地址空间,把控制权交给动态链接器。动态链接器本身也是.so文件,但是它比较特殊,它是静态链接的。本身不依赖任何其他的共享对象也不能使用全局和静态变量。这是合理的,试想,如果动态链接器都是动态链接的话,那么由谁来完成它的动态链接呢?

含大量图文解析及例程 | Linux下的ELF文件、链接、加载与库(中)

Linux的动态链接器是glibc的一部分,入口地址是sysdeps/x86_64/dl-machine.h中的_start,然后调用 elf/rtld.c 的_dl_start函数,最终调用 dl_main(动态链接器的主函数)。

动态链接过程图示

含大量图文解析及例程 | Linux下的ELF文件、链接、加载与库(中)

动态链接库的构建与使用创建自己的动态链接库

创建号一个动态链接库(如我们的libvector.so)之后,我们肯定不可能只在当前目录下使用它,那样他就不能被叫做 ”库“了。

为了在全局使用动态链接库,我们可以将我们自己的动态链接库移动到/usr/lib下:

之后我们只要在需要使用到相关库时加上-l[linName]选项即可,如:

大家也注意到了,上面的命令要用到管理员权限sudo。适应为/usr/lib和/lib是系统级的动态链接目录,我们要创建自己的第三方库最好不要直接放在这个目录中,而是创建一个自己的动态链接库目录,并将这个目录添加到环境变量 LD_LIBRARY_PATH 中:

命名规范

动态链接库要命名为:lib[libName].so 的形式。

含大量图文解析及例程 | Linux下的ELF文件、链接、加载与库(中)

5T技术资源大放送!包括但不限于:C/C++,Arm, Linux,Android,人工智能,单片机,树莓派,等等。在上面的【人人都是极客】公众号内回复「peter」,即可免费获取!!

含大量图文解析及例程 | Linux下的ELF文件、链接、加载与库(中)

记得点击分享、赞和在看,给我充点儿电吧

以上就是含大量图文解析及例程 | Linux下的ELF文件、链接、加载与库(中)的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/461140.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月8日 03:34:53
下一篇 2025年11月8日 03:36:02

相关推荐

  • 维持保证金率和初始保证金率是什么关系?通俗解释

    在币圈合约交易中,初始保证金率和维持保证金率是两个紧密相连的核心风控概念,它们共同决定了您能否开仓以及能否持续持有仓位。简单来说,可以把它们想象成一次跳伞体验的“起跳高度”和“最低开伞高度”。初始保证金率决定了您需要具备多厚的“资本”才能从飞机上起跳(开仓),而维持保证金率则是您在空中必须打开降落伞…

    2025年12月11日
    000
  • 冰山委托和时间加权委托分别适用于什么建仓场景?

    在币圈进行大额交易时,直接将一笔大单投入市场可能会瞬间拉高或砸低价格,造成不必要的交易成本和市场冲击。为了解决这个问题,交易所提供了高级委托策略,其中冰山委托(Iceberg Order)和时间加权平均价格委托(TWAP, Time-Weighted Average Price)是两种最常用的建仓工…

    2025年12月11日
    000
  • 什么是Tether USAT(USAT)币?它如何运作?USAT运作方式、代币经济及路线图介绍

    目录 什么是 tether usat(usat)? Tether USAT(USAT)亮点 1:1美元稳定性 网速交易 无中介的自由 美国监管合规 透明的储备管理 全球影响力 创新应用领域 Tether USAT(USAT)如何运作? Tether USAT(USAT)对利益相关者的益处 Tethe…

    2025年12月11日 好文分享
    000
  • 实际爆仓价与平台显示为什么会有细微差别?

    在加密货币合约交易中,很多用户会发现,自己仓位被强制平仓的实际价格,与交易平台界面上预先显示的预估爆仓价存在微小的出入。这并非是平台计算错误,而是因为预估爆仓价是一个静态的参考值,它在仓位建立时根据开仓价、杠杆和初始保证金计算得出。然而,在持仓过程中,有多种动态因素会持续影响保证金的实际水平,从而导…

    2025年12月11日
    000
  • u永续合约怎么解除 一文讲解u永续合约解除步骤

    有效管理U本位永续合约的持仓是控制风险和锁定收益的关键。本文将详细介绍几种主流的平仓(即解除合约)操作方式,包括市价、限价以及止盈止损,帮助您根据不同市场情况和交易策略,灵活选择最合适的操作方法。 一、市价平仓:追求速度与成交率 1、市价平仓指的是不预设价格,立即以当前市场最优对手方价格成交的指令。…

    2025年12月11日
    000
  • 币安binance网址官网直接进入 币安binance官网入口

    币安binance是全球领先的数字货币交易平台之一,提供比特币、以太坊等多种加密货币的交易服务。本文旨在为您提供币安binance官方应用的下载和安装教程,用户可以通过本文提供的下载链接直接获取官方应用。 币安交易所官网入口地址: 下载币安Binance官方App 为了确保您的资产安全,强烈推荐从官…

    2025年12月11日
    000
  • 全仓和逐仓有啥区别?新手必看的仓位模式选择指南

    在充满机遇与风险的币圈合约交易中,理解并选择合适的仓位模式是控制风险、实现盈利的第一步。对于新手而言,常常会对“全仓”和“逐仓”这两个概念感到困惑。简单来说,它们是两种不同的保证金计算和风险管理方式,直接关系到你的账户资金安全和潜在亏损范围。选择错误的模式,可能会让你的盈利瞬间化为乌有,甚至导致整个…

    2025年12月11日
    000
  • 详细了解比特币日跌幅达到2%,在FOMC会议前出现BTC“经典”价格走势

    目录 关键点:BTC价格在FOMC前出现“经典”下行比特币情绪中性,股票攀升“忧虑之墙”‍ 比特币(BTC)在美联储FOMC降息决议前表现低迷,而股票和黄金在关键宏观交易周伊始表现优于比特币。 关键点: 比特币走势与股票和黄金背离,周初日内下跌2%。分析人士希望即将到来的美联储利率决议能为BTC价格…

    2025年12月11日 好文分享
    000
  • 止损策略:移动止损和普通止损哪个更好用?

    在风云变幻的交易世界里,控制风险是生存的第一法则。止损,作为风险管理的核心工具,帮助交易者在判断失误时及时“刹车”,避免更大的亏损。其中,最常见的两种策略便是普通止损和移动止损。那么,这两种策略究竟哪个更胜一筹?其实,它们就像是工具箱里的螺丝刀和扳手,各有其用武之地,关键在于你面对的是什么“螺丝”。…

    2025年12月11日
    000
  • 仓位管理:金字塔加码和倒金字塔加码有什么区别?

    在波动剧烈的币圈市场中,合理的仓位管理是决定投资者最终能否盈利的关键。它不仅关系到资金的利用效率,更是风险控制的核心。在众多加仓策略中,金字塔加码法和倒金字塔加码法是最为经典和常见的两种。它们的核心区别在于资金分配的逻辑和风险偏好,理解这两种方法的差异,能帮助投资者根据自身风格和市场行情做出更明智的…

    2025年12月11日
    000
  • 合约类型:永续合约和交割合约怎么选?

    在数字资产衍生品市场中,合约交易是核心玩法之一,主要分为永续合约和交割合约两大类。它们的核心区别在于是否存在到期日,这直接影响了交易者的策略、持仓成本和操作灵活性。对于新手和老手来说,理解二者的差异并根据自己的交易目标和风险偏好做出正确选择至关重要。错误的选择可能会导致不必要的成本增加或错失交易机会…

    2025年12月11日
    000
  • 现货网格和合约网格有什么不同?三分钟带你搞懂

    很多刚接触量化交易的朋友,常常对币圈的网格交易感到困惑,特别是现货网格和合约网格,总觉得它们看起来差不多,但又好像有本质区别。其实,只要抓住几个核心要点,三分钟就能让你彻底搞懂。简单来说,它们最大的不同在于交易标的、资金效率和风险等级。下面我们来详细拆解一下。 核心逻辑与操作方向 1、现货网格的本质…

    2025年12月11日
    000
  • DeAgentAI(AIA)币是什么?怎么样?AIA代币经济与空投领取指南

    目录 DeAgentAI(AIA)最新动态什么是DeAgentAI(AIA)DeAgentAI(AIA)亮点分散决策最小熵共识身份和一致性连续性灵活的工具安全透明的交易用途广泛DeAgentAI(AIA)如何工作DeAgentAI(AIA)对利益相关者的益处DeAgentAI (AIA) 代%ign…

    2025年12月11日 好文分享
    000
  • Hyperliquid竞标大战结束,新团队Native Markets为何拿下USDH?

    近日,去中心化衍生品平台 Hyperliquid 发起的原生稳定币 USDH 发行权竞标引发行业广泛关注。9 月 5 日,官方宣布将通过链上治理投票决定 USDH 的归属,迅速吸引了 Paxos、Ethena、Frax、Agora 以及 Native Markets 等多家机构参与角逐。作为永续合约…

    2025年12月11日
    000
  • 比特币交易员分析:“该关注 11.5 万美元的 BTC 价格了”

    目录 要点:“是时候关注”比特币价格走势市场坚定押注美联储即将降息 ‍ 随着关键宏观经济事件周临近,比特币(BTC)在本周收官之际未能展现强劲动能。一位资深交易员指出,在美联储利率决策公布前,当前正是“密切关注”比特币价格动向的关键时刻。 要点: 比特币价格在周末徘徊于115,000美元附近,面临方…

    2025年12月11日 好文分享
    000
  • 一文教你学会如何根据波动率调整仓位大小?

    在充满不确定性的交易世界里,许多投资者往往采用固定的手数或资金量进行交易,但这在不同的市场环境下会带来截然不同的风险。一个成熟的交易者懂得,真正的风险控制并非仅仅设置止损,更在于根据市场的“脉搏”——波动率,来动态调整自己的仓位大小。掌握这项技能,能让你的交易系统更具弹性和稳健性。其核心原则是:高波…

    2025年12月11日
    000
  • Avantis(AVNT)币是什么?AVNT币怎么买?AVNT币未来潜力如何?

    目录 AVNT币最新新闻和价格动态Avantis(AVNT)是什么?Avantis开发团队和融资Avantis是如何运作的?AVNT币是什么?AVNT代币经济学AVNT价格走势分析Avantis(AVNT)未来展望及价格预测AVNT币怎么买?常见问题FAQ总结 avantis 是基于base 网络构…

    2025年12月11日 好文分享
    000
  • 什么是Hyperliquid(USDH)币?如何运作?USDH市场影响及价格预测

    目录 摘要简介什么是 USDH 稳定币?发行竞争和 Native Market 的胜利为什么 Hyperliquid 要推出 USDH?USDH 如何运作?USDH 的市场影响USDH稳定币对Hyperliquid用户的好处USDH与其他稳定币的对比Hyperliquid价格预测Hyperliqui…

    2025年12月11日
    000
  • 兔子币 (XTZ) 币是什么?XTZ价格预测2025年、2026年、2027–2030年

    目录 要点兔子币 (XTZ) 币是什么XTZ 实时行情基于技术分析预测 2025 年的 XTZ 价格2025 年 XTZUSD 的长期交易计划分析师对 2025 年 XTZ 价格的预测CoinCodexDigitalCoinPriceNameCoinNews分析师对 2026 年 XTZ 价格的预测…

    2025年12月11日 好文分享
    000
  • Floki INU (FLOKI)币未来前景如何?FLOKI币2025年、2026年-2030年价格预测

    目录 Floki INU 是什么?Floki 价格预测:ChainPlay 专家如何分析?Floki基本面分析Floki Inu技术分析关键价格水平支持级别 阻力位值得密切关注的 Floki Inu 2025年价格预测Floki Inu 2026年价格预测Floki Inu 2027年价格预测Flo…

    2025年12月11日
    000

发表回复

登录后才能评论
关注微信