[科普中国]-源程序文件类型-

简介

源程序，是指未经编译的，按照一定的程序设计语言规范书写的，人类可读的文本文件。通常由高级语言编写。源程序可以是以书籍或者磁带或者其他载体的形式出现，但最常用的格式是文本文件，这种典型格式的目的是为了编译出计算机程序。源程序文件类型是指源程序存储时使用的殊编码方式，便于读取、识别。文本文件是最常用的一种文件类型，但很多高级语言和汇编语言都有自己的文件类型，一般习惯以高级语言或汇编语言的文件类型保存，主要是为了以后编译器编译方便。

文件类型文件类型（或文件格式）是指电脑为了存储信息而使用的对信息的特殊编码方式，是用于识别内部储存的资料。比如有的储存图片，有的储存程序，有的储存文字信息。每一类信息，都可以一种或多种文件格式保存在电脑存储中。每一种文件格式通常会有一种或多种扩展名可以用来识别，但也可能没有扩展名。扩展名可以帮助应用程序识别的文件格式。

对于硬盘机或任何电脑存储来说，有效的信息只有0和1两种。所以电脑必须设计有相应的方式进行信息-位元的转换。对于不同的信息有不同的存储格式。

有些文件格式被设计用于存储特殊的数据，例如：图像文件中的JPEG文件格式仅用于存储静态的图像，而GIF既可以存储静态图像，也可以存储简单动画；Quicktime格式则可以存储多种不同的媒体类型。文本类的文件有：text文件一般仅存储简单没有格式的ASCII或Unicode的文本；HTML文件则可以存储带有格式的文本；PDF格式则可以存储内容丰富的，图文并茂的文本。

同一个文件格式，用不同的程序处理可能产生截然不同的结果。例如Word 文件，用Microsoft Word观看的时候，可以看到文本的内容，而以无格式方式在音乐播放软件中播放，产生的则是噪声。一种文件格式对某些软件会产生有意义的结果，对另一些软件来看，就像是毫无用途的数字垃圾。1

源程序源程序（也称为源代码），是指一系列人类可读的计算机语言指令。在现代程序语言中，源代码可以是以书籍或者磁带的形式出现；但最常用的格式是文本文件，这种典型格式的目的是为了编译出计算机程序。计算机源代码的最终目的是将人类可读的文本翻译成为计算机可以执行的二进制指令，这种过程叫做编译，通过编译器完成。

作用源代码主要功用有如下2种作用：

生成目标代码，即计算机可以识别的代码。

对软件进行说明，即对软件的编写进行说明。为数不少的初学者，甚至少数有经验的程序员，都忽视软件说明的编写；因为这部分虽然不会在生成的程序中直接显示，也不参与编译。但是说明对软件的学习、分享、维护和软件复用都有巨大的好处。因此，书写软件说明在业界被认为是能创造优秀程序的良好习惯，一些公司也硬性规定必须书写。

需要指出的是，对于编译语言来说，例如C/C++/Java，源代码的修改不能改变已经生成的目标代码。如果需要目标代码做出相应的修改，必须重新编译。但是目前有许多流行的脚本语言，例如Perl/Python都不需要重新编译，修改完代码可以直接执行看到修改的结果。

代码组合源代码作为软件的特殊部分，可能被包含在一个或多个文件中。一个程序不必用同一种格式的源代码书写。例如，一个程序如果有C语言库的支持，那么就可以用C语言；而另一部分为了达到比较高的运行效率，则可以用汇编语言编写。就目前的情况而言，很少有需要直接用汇编语言来编写的软件了，因为很多时候编译器生成的优化程序的运行效率已经很好了，更多的时候是用C/C++这样的编译语言来写核心需要速度的部分，用Perl/Python/Lua等这样的动态语言来做核心的扩展，例如界面，管理配置等等。这样既不会损失效率，也增加了程序的灵活性。

较为复杂的软件，一般需要数十种甚至上百种的源代码的参与。为了降低种复杂度，必须引入一种可以描述各个源代码之间联系，并且如何正确编译的系统。在这样的背景下，版本控制系统（VCS）诞生了，并成为研发者对代码修订的必备工具之一。

还有另外一种组合：将为一种平台编写的软件移植到另外一种平台上，例如将Windows下的软件移植到Linux或者MacOS下，专业术语叫做软件移植。一般可以运行在多个平台下的软件叫做跨平台软件。

质量与效率对于计算机而言，并不存在真正意义上的“好”的源代码；好的源程序，首先要是正确的代码。然后是源程序的可维护性，好的程序风格将可以增强代码的可维护性。源代码是否具有可读性，成为代码质量/质量的标准之一。也有人将程序的效率放在可维护性之前。根据程序所要实现的功能和应用领域很多人对源代码质量/质量有着不同的看法。但是普遍达成一致的是质量/质量高的源程序就是正确的程序。

虽然我们可以通过不同的语言来实现计算机的同一功能，但在执行效率上则存在不同。普遍规律是：越高级的语言，其执行效率越低。这也是为什么汇编语言生成的文件比用VB语言生成文件普遍要小的原因。然而，使用低级语言虽可提高运行效率，却会大大降低程序的开发效率，可能导致开发工作变得非常困难，因此多数程序员并不在意高级语言带来的运行效率损失，最多只在关键处使用低级语言。

常见的源程序文件类型文本文件文本文件是一种计算机文件，它是一种典型的顺序文件，其文件的逻辑结构又属于流式文件。

特别的是，文本文件是指以ASCII码方式(也称文本方式)存储的文件，更确切地说，英文、数字等字符存储的是ASCII码，而汉字存储的是机内码。文本文件中除了存储文件有效字符信息（包括能用ASCII码字符表示的回车、换行等信息）外，不能存储其他任何信息。

格式

ASCII

ASCII标准使得只含有ASCII字符的文本文件可以在Unix、Macintosh、MicrosoftWindows、DOS和其它操作系统之间自由交互，而其它格式的文件是很难做到这一点的。但是，在这些操作系统中，换行符并不相同，处理非ASCII字符的方式也不一致。

MIME

文本文件在MIME标准中的类型为“text/plain”，此外，它通常还附加编码的信息。在Mac OS X出现前，当Resource fork指定某一个文件的类型为“TEXT”时，Mac OS就认为这个文件是文本文件。在Windows中，当一个文件的扩展名为“txt”时，系统就认为它是一个文本文件。此外，处于特殊的目的，有些文本文件使用其它的扩展名。例如，计算机的源代码也是文本文件，它们的后缀是用来指明它的程序语言的。

.txt

.txt是包含极少格式信息的文字文件的扩展名。.txt格式并没有明确的定义，它通常是指那些能够被系统终端或者简单的文本编辑器接受的格式。任何能读取文字的程序都能读取带有.txt扩展名的文件，因此，通常认为这种文件是通用的、跨平台的。

在英文文本文件中，ASCII字符集是最为常见的格式，而且在许多场合，它也是默认的格式。对于带重音符号的和其它的非ASCII字符，必须选择一种字符编码。在很多系统中，字符编码是由计算机的区域设置决定的。常见的字符编码包括支持许多欧洲语言的ISO 8859-1。

由于许多编码只能表达有限的字符，通常它们只能用于表达几种语言。Unicode制定了一种试图能够表达所有已知语言的标准，Unicode字符集非常大，它囊括了大多数已知的字符集。Unicode有多种字符编码，其中最常见的是UTF-8，这种编码能够向后兼容ASCII，相同内容的的ASCII文本文件和UTF-8文本文件完全一致。2

Objective-C源代码文件类型Objective-C是C语言的扩展，所以对于Objective-C编译器来说，C的源文件格式也是支持的，C的源文件格式有.h和.c。

对于Objective-C编译器来说，也对C语言的另一个扩展C++的源文件格式也是支持的，C++的源文件格式有.h和.cpp。

Objective-C也是有头文件和实现文件之分，头文件的扩展名也是.h，实现文件的扩展名是.m

Objective-C还支持与C++混写，混写的文件格式是.mm。

所以总结起来如下表：

|| ||

对于Objective-C的编译器来说，不仅认识Objective-C自己的语法，还认识C的语法，也认识C++的语法，所以为了兼容这些语法，难免会出现一些新的语法，学习Objective-C的语法的时候，能从写编译器的角度考虑问题，将有助于理解这些语法。