定义
编译程序的整个编译过程大体分成五部分:词法分析、语法分析、代码优化、存储分配和代码生成。在代码生成之前还必须先确定程序、变量以及常数在内存中存放的地址,这些工作,统称为存储分配,也就是把程序或数据块分配到指定的存储单元的过程。1
数据区可以分为静态数据区(全局数据区)和动态数据区,后者又可分为堆区和栈区。之所以这样划分,是因为它们存放的数据和对应的管理方法不同。静态数据区、栈区和堆区的存储空间分别遵循3种不同的规则:静态存储分配、栈式存储分配和堆式存储分配。后两种分配方式皆称为“动态存储分配”,因为这两种方式中存储空间并不是在编译的时候静态分配好的,而是在运行时才进行的。2
某些编程语言,如早期的FORTRAN语言及COBOL语言等,其存储分配是完全静态的,程序的数据对象与其存储的绑定是在编译期间进行的,称为静态语言。而对于另一些语言,所有数据对象与其存储的绑定只能发生在运行期间,此类语言称为动态语言,如Lisp、ML、Perl等。多数语言(如C/C++、Java、Pascal等)采取的存储分配策略是介于二者之间的。2
静态存储分配所谓的静态存储分配,即在编译期间为数据对象分配存储空间。这要求在编译期间就可以确定数据对象的大小,同时还可以确定数据对象的数目。2
现状多数(现代)语言只实施部分静态存储分配。可静态分配的数据对象包括大小固定且在程序执行期间可全称访问的全局变量、静态变量、程序中的常量以及class的虚函数表等,如C语言中的static和extern变量,以及C++中的static变量,这些数据对象的存储将被分配在静态数据区。2
常见做法从道理上讲,或许可以将静态数据对象与某个绝对存储地址绑定,然而,通常的做法是将静态数据对象的存取地址对应到偶对(DataArerStart,Offset)。Offset是在编译时刻确定的固定偏移量,而DataArerStart则可以推迟到链接或运行时刻才确定。有时,DataArerStart的地址也可以装入某个基地址寄存器Register,此时数据对象的存取地址对应到偶对(DataArerStart,Offset),即所谓的寄存器偏址寻址方式。2
优点采用这种方式,存储分配极其简单。
缺点(1)采用这种方式会带来存储空间的浪费。为解决存储空间浪费问题,人们设计了变量的重叠布局机制,如FORTRAN语言的equivalence语句。重叠布局带来的问题是使得程序难写难读。
(2)完全静态分配的语言还有另外一个缺陷,就是无法支持递归过程或函数。
(3)对于一些动态的数据结构,例如动态数据(C++中使用new关键字来分配内存)以及递归函数的局部变量等最终空间大小必须在运行时才能确定的场合,静态存储分配就无能为力了。2
栈式存储分配栈区是作为“栈”这样的一种数据结构来使用的动态存储区,称为运行栈。运行栈数据空间的存储和管理方式称为栈式存储分配,它将数据对象的运行时存储按照栈的方式来管理,常用于实现可动态嵌套的程序结构,如过程、函数以及嵌套程序块(分程序)等。2
特点与静态存储分配方式不同,栈式存储分配是动态的,也就是说必须是在运行的时候才能确定数据对象的存储分配结果。例如,对如下的C代码片段:
int factorial (int n)
{
int tmp;
if (n