充分理解Linux GCC 链接生成的Map文件
简单来说,map文件就是器源通过编译器编译之后,生成的码分程序、数据及IO空间信息的接器一种映射文件,里面包含函数大小,链接d链入口地址等一些重要信息。器源猛虎王源码从map文件我们可以了解到:
生成map文件是码分链接器ld的功能,有两种方式可以生成map文件:
使用GNU binutils,接器必须通过设置正确的链接d链标志来显式地请求生成映Map文件。使用LD将Map打印到输出到output.map:
作为一个简单程序的器源例子,你可以使用以下命令链接编译单元:
为什么要了解Map文件:
在本文中,码分我想突出说明链接器Map文件是接器多么简单,以及它可以教给我们关于正在处理的链接d链程序的一些知识。
固件工程师很少在调试时使用构建过程生成的器源Map文件。然而,码分答案有时就在这个Map文件中。
Map文件提供了有价值的信息,可以帮助您理解和优化内存。我强烈建议为在生产环境中运行的任何固件保存该文件。
Map文件是整个程序的符号表。让我们深入研究它,看看它有多简单,以及如何有效地使用它。我将尝试用一些例子来说明,这些例子都是用GNU binutils来描述的。
LED闪烁程序:
还有什么比我们的老朋友LED闪烁程序示例解释一下Map文件的基础知识更好的呢?
为了了解Map文件,我们使用Nordic SDK中的LED闪烁程序来编译,并修改它以添加对atoi的调用。然后,我们将使用Map文件来分析这两个程序之间的差异。
下面就是示例的main.c文件:
编译:
生成的Map文件有多行 ,尽管它只是在闪烁发光二极管。这么多行不可能看不见,里面一定有一些重要的java ui源码信息……
现在让我们修改程序,添加对atoi的调用,我们不直接使用整数作为延迟函数的参数,而是将其编码为字符串并使用atoi解码,然后作为参数传给延时函数。
经过编译,整个程序从字节变成了字节。
我们能够想到调用atoi会带来更多的代码,但是%程序大小的增加是巨大的!
深入研究Map文件:
在下面的部分中,我将使用代码片段来解释Map文件的不同部分。
Archives linked:
下面是Map文件的第一行内容:
上述信息的格式如下:
上面内容的意思是crt0这个文件中会调用exit函数,exit函数在exit.o这个目标文件中,exit.o目标文件是被链接在libc_nano.a这个库文件里的。
为什么是这样,不在本文的讨论范围内,但是你的工具链(这里是GNU工具链)确实提供了一些标准库。它们可用于提供atoi等标准功能,在这个例子中,我指定链接器使用nano.spec文件,这就是为什么标准函数都来自libc_nano.a。
现在,比较两个生成的map文件,发现的第一个区别是程序中包含了一些其他的存档成员:atoi,它本身需要_strtol_r,_strtol_r本身又需要_ctype_:
现在,我们对实际包含在程序中的文件以及它们存在的原因有了更好的理解。让我们来看看这个文件里面还有什么!
Memory configuration:
Map文件中最直接的信息是实际的内存区域,这些区域具有位置、大小和访问权限:
Linker script and memory map:
内存配置之后是Linker script and memory map,这个很有趣,因为它给出了程序中符号的详细信息。在我们的例子中,它首先指示text区域的大小及其内容(text是我们编译的代码,而data是linux 源码打包程序数据)。
在这里,中断向量(在.isr_vector下)出现在可执行文件的开头,定义在gcc_startup_nrf.S中:
这些行给出了每个函数的地址和大小。在上面,你可以读取bsp_board_led_invert的地址,它来自boards.c.o(如你所猜测的,board.c的编译单元),在text区域中它的大小为0x字节。这样,我们就可以定位程序中使用的每个函数。
我的常量字符串_delay_ms_str在程序初始化时显然包含在程序中,只读数据作为rodata保存在链接器脚本中指定的FLASH区域中(存储在Flash中,而不是复制在RAM中,因为它是常量)。我可以在这行下面找到:
我还注意到_ctype_的包含在text区域中增加了0x字节的只读数据
标准库是开源的( 链接),我们很容易就能找出它占用那么多空间的原因。我深入到atoi的内部(可重入版本的atoi_r,见下文),它是直接调用的strtol_r:
对于strtol_r,它实际上比仅仅将字符转换为整数更复杂,因为还使用ctype来执行类型检查。ctype的工作方式是使用一个表,其中ASCII符号类型存储在一个数组中。下面是ctype的主要部分,并附上我的注释:
有趣的是,atoi的添加不仅增加了代码的大小(text区域),还增加了数据的大小(data区域)。分析两个Map文件,我可以很容易地发现之前被链接器丢弃的数据:
现在你可能已经注意到函数名以_r结尾,例如在调用strtol_r时,该后缀表示可重入性。有关可重入性的文档可以在 newlib源代码中找到。总而言之,python 源码解析即使同一函数已经在另一个进程中执行,也可以调用可重入函数,而不会干涉执行。从文档中可以看到如下描述:
Each function which uses the global reentrancy structure uses the global variable _impure_ptr, which points to a reentrancy structure.
在我们的例子中,我们需要新的全局变量来调用可重入函数:atoi_r。
最后要记住的一点信息是:初始化变量必须保存在Flash中,但它们在Map文件中会出现在RAM中,因为它们在进入主函数之前被复制到RAM中。在这里,符号__data_start__和__data_end__跟踪RAM中用于保存初始化变量的区域,这些值存储在Flash中,起始位置为0xd0:
Discarded sections:
如果链接器没有找到对函数和变量的任何引用,编译后包含在程序中的函数和变量并不总是最终二进制文件的一部分,它们将会被删除但是仍然会出现在Map文件的Discarded input sections 部分。例如,下面是一些定义在boards.c中的函数,它们永远不会被调用并因此被丢弃:
Common symbols:
这个部分没有出现在我们的Map文件中,但它值得一提。
Common symbols(通用符号)是可以在代码中的任何地方使用的非常量全局变量(non-constant global variables)。您可能知道,使用全局变量通常不是一个好的实践,因为它们使代码更难维护。确实如此,作用域是全局的,每个外部模块可以修改任何全局变量的值,访问时必须考虑到这一点。将变量隔离到一个模块中,使用static关键字,通常更好地确保创建变量的模块完全负责其状态。
现在,如果您希望使程序更安全并防止访问某些全局变量,请查看Map文件部分。如果某些变量不需要声明为全局变量,lol引流源码您可能希望将它们转换为静态变量。
Map文件有几种可能的用法:大多数时候,一个地址后面对应着一个函数,我们希望通过这个地址去了解一些问题。例如,它可以是硬故障处理程序(Hard Fault handler)中的程序计数器(Program Counter)。其他时候,你也会遇到调试一些不明确的行为,最终发现你的程序意外地写入了一个出界数组(数组越界)。当有了ELF文件时,arm-none-eabi-nm对于这些事情也非常有用,它提供了按大小排序符号的选项。
但有些时候,它甚至在你有可执行文件之前就很有用了……
Debugging a linking error:
Map文件是在构建代码(.o文件)链接在一起的时候生成的,这意味着它可以有助于解决链接过程中出现的错误。我记得在几个Flash页面中包含一个引导加载程序,在某些情况下,我想使用atoi,但引导加载程序不再编译,因为没有更多的可用空间。
使用前面的示例,假设我现在只有0x字节的Flash。编译第一个示例时,如果没有atoi,就不会出现问题,但是第二个例子会溢出我们的Flash:
是不是很讨厌?atoi只是一个很简单的函数而已,居然就出现这种问题。但正如我们前面所提到的,使用libc_nano.a需要比预期更多的Flash空间。
让我们来实现自己版本的atoi,其实也没那么难。以下是编译后的结果(config CUSTOM_ATOI):
这个方法是不是很好?现在可以将代码塞进0x字节的Flash,以满足我们的(假)需求。
分析Map文件可以让我们了解很多正在编写的代码,这是改进固件的第一步。
可以使用一些工具来解析Map文件并获得程序的汇总视图,后面有时间和大家好好聊聊。
如何用lde
在编程和软件开发中,`lde`并不是一个通用的术语或命令。可能你是指`ld`,它是GNU Binutils中的一个程序,用于链接程序。详细解释如下:
`ld`是GNU链接器的缩写,它是GNU Binutils软件包的一部分。链接器的主要作用是将多个对象文件和一些必要的库文件链接成一个可执行文件。在这个过程中,链接器会处理对象文件中的符号引用,确保所有的函数调用、变量访问等都正确地指向它们在可执行文件中的位置。
在编译和链接一个程序时,通常首先使用编译器将源代码文件编译成对象文件,然后使用`ld`将这些对象文件链接成一个可执行文件。链接器还可以用来创建共享库,这是多个程序可以共享的代码和数据的集合。
`ld`链接器具有许多选项和参数,可以用来控制链接过程的各种方面。例如,可以使用选项来指定要链接的对象文件和库文件,控制符号解析的方式,以及指定生成的可执行文件或共享库的各种属性。
总的来说,`ld`是GNU Binutils中的一个重要程序,用于将对象文件和库文件链接成可执行文件或共享库。在软件开发过程中,了解和使用`ld`链接器的功能和选项是非常重要的。
什么是ld
LD是指链接编辑过程。链接编辑过程是计算机程序编译过程中的一个重要环节。在源代码经过编译器编译成目标文件后,链接编辑器的任务是将这些目标文件以及可能需要的库文件结合在一起,形成一个可执行文件。这一过程涉及到符号解析、地址重定位等关键操作。具体来说:
1.链接编辑的基本概念:链接编辑是将多个目标文件或库文件组合成一个可执行文件的过程。这是编译过程的最后一步,也是将程序转换为可以在计算机上运行的形式的关键步骤。
2.符号解析和地址重定位:在链接编辑过程中,链接器会解析目标文件中引用的外部符号,并确定它们在内存中的位置。如果目标文件之间互有引用,链接器会处理这些引用,确保每个符号都能正确链接到其定义的位置。同时,链接器还会进行地址重定位,确保程序中的指令正确地指向内存地址。
3.生成可执行文件:通过链接编辑后,生成的可执行文件包含了程序的所有代码、数据以及程序的启动信息。这个文件可以直接在计算机上运行,执行程序所定义的任务。
因此,LD在编译过程中起到了至关重要的作用,确保程序能够正确、有效地从源代码转化为可执行形式。
ld是什么意思
ld的意思主要是“链接器(Linker)”或“动态链接库(Dynamic Link Library)”。
首先,ld在计算机科学中常被用作“链接器”的缩写。在软件开发过程中,链接器是一个至关重要的工具,它负责将编译器生成的多个目标文件(object files)合并成一个可执行文件或库文件。这个过程中,链接器会处理目标文件之间的符号引用,确保程序在运行时能够正确找到并调用各个部分。例如,在C或C++项目开发中,编译器会将源代码编译成目标文件,然后由链接器将这些目标文件链接成最终的可执行程序。
其次,ld也被用来指代“动态链接库”,尤其是在Unix和类Unix系统中。动态链接库是一种包含可执行代码和数据的文件,它可以在多个程序之间共享,从而节省内存空间并提高代码的可重用性。与静态链接库不同,动态链接库在程序运行时被加载到内存中,而不是在编译时。这意味着多个程序可以同时使用同一个动态链接库的副本,实现资源的高效利用。在Linux系统中,动态链接库通常具有.so(Shared Object)的扩展名,并由ld动态链接器在程序运行时进行加载和管理。
总的来说,ld这个缩写可以根据上下文的不同而具有不同的含义。在软件开发领域,它通常指的是链接器或动态链接库,这两个概念都是构建和运行复杂软件系统所不可或缺的组成部分。链接器确保程序的各个部分能够正确组装在一起,而动态链接库则提供了在多个程序之间共享代码和数据的机制。
无论是作为链接器还是动态链接库的简称,ld都体现了计算机科学中对于资源整合和高效利用的追求。通过理解和应用这些概念,开发者能够创建出更加健壮、灵活且高效的软件解决方案。例如,在开发一个大型项目时,合理利用链接器可以确保项目各个模块之间的紧密集成;而通过使用动态链接库,则可以实现代码的重用和更新,从而降低维护成本并提高软件质量。
GNU 工具链开发入门(一):工具链介绍
进入GNU工具链开发领域,首先需认识到GNU/Linux世界中,GNU工具链扮演着不可或缺的角色。尽管在代码耦合程度和可读性方面,GNU工具链可能不如使用Apache协议的LLVM广受欢迎,但只要GNU/Linux系统持续存在,GNU工具链的使用不会停止。作者自年开始深入探索GNU工具链开发,并通过系列文章整理知识体系,分享个人经验。
GNU工具链主要由三个部分构成:GCC、GAS和LD。GCC作为编译器集合,包含多种编译器,如用于C语言的GCC、用于C++的G++等,而GAS是汇编器,负责将汇编代码转换为机器代码。LD则是链接器,将生成的模块链接成可执行文件或共享库。
在GCC的使用中,编译过程可以被详细拆解。一个简单的示例为使用`gcc hello.c -o hello`命令编译hello.c文件并生成hello程序。这里实际涉及多个步骤:首先,GCC调用C语言编译器cc1将源代码编译为汇编代码;随后,GAS将汇编代码转换为对象文件;最后,LD链接库文件,生成最终的可执行文件。
在构建程序时,GCC通过调用AS和LD完成汇编和链接过程,具体参数的传递可能依据不同后端的设置。此外,BFD(Binary File Descriptor)是Binutils仓库中用于底层操作的工具集,包括as、ld等。
GLibc作为GNU C Library,在构建GNU/Linux和Linux内核时扮演关键角色。它包含几乎所有的UNIX标准,对构建过程至关重要。作者对GLibc的理解仍停留在浅层阶段,专注于RISC-V后端相关工作,对C库的具体实现不敢妄加评论。
构建GCC的过程通常基于上游最新代码进行,步骤包括配置、编译、链接和安装等。具体步骤可参考相关指南或教程。构建GCC时需要注意版本兼容性、依赖库以及构建环境的设置。
总结,GNU工具链作为GNU/Linux生态系统的核心组成部分,为用户提供强大的编译和链接功能。了解其构成、使用方法以及构建流程,对深入参与GNU/Linux生态系统的开发工作至关重要。
2024-12-28 23:05
2024-12-28 22:50
2024-12-28 22:42
2024-12-28 21:59
2024-12-28 21:33