版权归原作者所有,如有侵权,请联系我们

[科普中国]-超文本表达语言

科学百科
原创
科学百科为用户提供权威科普内容,打造知识科普阵地
收藏

定义

超文本表达语言,即为超文本标记语言,简称为HTML。超级文本标记语言是标准通用标记语言下的一个应用,也是一种规范,一种标准,它通过标记符号来标记要显示的网页中的各个部分。网页文件本身是一种文本文件,通过在文本文件中添加标记符,可以告诉浏览器如何显示其中的内容(如:文字如何处理,画面如何安排,图片如何显示等)。浏览器按顺序阅读网页文件,然后根据标记符解释和显示其标记的内容,对书写出错的标记将不指出其错误,且不停止其解释执行过程,编制者只能通过显示效果来分析出错原因和出错部位。但需要注意的是,对于不同的浏览器,对同一标记符可能会有不完全相同的解释,因而可能会有不同的显示效果。

特点超文本表达语言文档制作不是很复杂,但功能强大,支持不同数据格式的文件镶入,这也是万维网盛行的原因之一,其主要特点如下:

简易性:超文本表达语言版本升级采用超集方式,从而更加灵活方便。

可扩展性:超文本表达语言的广泛应用带来了加强功能,增加标识符等要求,超文本表达语言采取子类元素的方式,为系统扩展带来保证。

平台无关性:虽然个人计算机大行其道,但使用MAC等其他机器的大有人在,超文本表达语言可以使用在广泛的平台上,这也是万维网盛行的另一个原因。

通用性:HTML是网络的通用语言。一种简单、通用的全置标记语言。它允许网页制作人建立文本与图片相结合的复杂页面,这些页面可以被网上任何其他人浏览到,无论使用的是什么类型的电脑或浏览器。

结构一个网页对应多个HTML文件,超文本标记语言文件以.html(磁盘操作系统DOS限制的外语缩写)为扩展名或.html(外语缩写)为扩展名。可以使用任何能够生成TXT类型源文件的文本编辑器来产生超文本标记语言文件,只用修改文件后缀即可。标准的超文本标记语言文件都具有一个基本的整体结构,标记一般都是成对出现(部分标记除外例如:
),即超文本标记语言文件的开头与结尾标志和超文本标记语言的头部与实体两大部分。有三个双标记符用于页面整体结构的确认。

标记符,说明该文件是用超文本标记语言(本标签的中文全称)来描述的,它是文件的开头;而,则表示该文件的结尾,它们是超文本标记语言文件的开始标记和结尾标记。

历史超文本表达语言(第一版)——在1993年6月作为互联网工程工作小组(IETF)工作草案发布(并非标准):

HTML 2.0——1995年11月作为RFC 1866发布,在RFC 2854于2000年6月发布之后被宣布已经过时

HTML 3.2——1997年1月14日,W3C推荐标准

HTML 4.0——1997年12月18日,W3C推荐标准

HTML 4.01(微小改进)——1999年12月24日,W3C推荐标准

HTML 5——2014年10月28日,W3C推荐标准[4] (详见本处参考资料)

ISO/IEC 15445:2000(“ISO HTML”)——2000年5月15日发布,基于严格的HTML 4.01语法,是国际标准化组织和国际电工委员会的标准。

Wijmo是基于HTML5、jQuery、CSS3和SVG的一个控件包,能够满足构建当今Web系统的需求。基于Wijmo,您的系统运行将更加快速和流畅,外观也会更加引人入胜。Wijmo中所有新的控件都是在符合最新的UI设计潮流的基础上,对新的以及改良后的主题进行封装。优美的、专业的控件外观会让您的应用程序引人注目。比如 ComponentOne Studio for ASP .NET Wijmo 控件包内置的6个主题,同时可以使用jQuery UI项目提供的 30 多个主题,甚至可以使用 ThemeRoller 创建属于您自己的系统主题。

HTML没有1.0版本是因为当时有很多不同的版本。有些人认为蒂姆·伯纳斯-李的版本应该算初版,这个版本没有IMG元素。当时被称为HTML+的后续版的开发工作于1993年开始,最初是被设计成为“HTML的一个超集”。第一个正式规范为了和当时的各种HTML标准区分开来,使用了2.0作为其版本号。HTML+的发展继续下去,但是它从未成为标准。

HTML3.0规范是由当时刚成立的W3C于1995年3月提出,提供了很多新的特性,例如表格、文字绕排和复杂数学元素的显示。虽然它是被设计用来兼容2.0版本的,但是实现这个标准的工作在当时过于复杂,在草案于1995年9月过期时,标准开发也因为缺乏浏览器支持而中止了。3.1版从未被正式提出,而下一个被提出的版本是开发代号为Wilbur的HTML 3.2,去掉了大部分3.0中的新特性,但是加入了很多特定浏览器,例如Netscape和Mosaic的元素和属性。HTML对数学公式的支持最后成为另外一个标准MathML。

HTML 4.0同样也加入了很多特定浏览器的元素和属性,但是同时也开始“清理”这个标准,把一些元素和属性标记为过时,建议不再使用它们。HTML的未来和CSS结合会更好。

HTML 5草案的前身名为Web Applications 1.0。于2004年被WHATWG提出,于2007年被W3C接纳,并成立了新的HTML工作团队。在2008年1月22日,第一份正式草案发布。

XHTML1.0——发布于2000年1月26日,是W3C推荐标准,后来经过修订于2002年8月1日重新发布。

XHTML 1.1,于2001年5月31日发布,W3C推荐标准。

XHTML 2.0,W3C工作草案。

XHTML 5,从XHTML 1.x的更新版,基于HTML 5草案。

HTML4.01 是常见的版本。

要求在编辑超文本表达语言文件和使用有关标记符时有一些约定或默认的要求。

文本表达语言源程序的文件扩展名默认使用htm(磁盘操作系统DOS限制的外语缩写为扩展名)或html(外语缩写为扩展名),以便于操作系统或程序辨认,除自定义的汉字扩展名。在使用文本编辑器时,注意修改扩展名。而常用的图像文件的扩展名为gif和jpg。

超文本表达语言源程序为文本文件,其列宽可不受限制,即多个标记可写成一行,甚至整个文件可写成一行;若写成多行,浏览器一般忽略文件中的回车符(标记指定除外);对文件中的空格通常也不按源程序中的效果显示。完整的空格可使用特殊符号(实体符)“&nbsp(注意此字母必须小写,方可空格)”表示非换行空格;表示文件路径时使用符号“/”分隔,文件名及路径描述可用双引号也可不用引号括起。

标记符中的标记元素用尖括号括起来,带斜杠的元素表示该标记说明结束;大多数标记符必须成对使用,以表示作用的起始和结束;标记元素忽略大小写,即其作用相同,但完整的空格可使用特殊符号“&nbsp(注意此字母必须小写,方可空格)”;许多标记元素具有属性说明,可用参数对元素作进一步的限定,多个参数或属性项说明次序不限,其间用空格分隔即可;一个标记元素的内容可以写成多行。

标记符号,包括尖括号、标记元素、属性项等必须使用半角的西文字符,而不能使用全角字符。

HTML注释由"“结束结束,例如。注释内容可插入文本中任何位置。任何标记若在其最前插入惊叹号,即被标识为注释,不予显示。

加密根据超文本表达文件的结构便知道,在超文本表达文件中信息加密主要有两种策略,即在数据元素中信息加密和在标签中信息加密。在数据元素中信息加密的方法依赖于数据的类型是文字、图像、声音、脚本语言程序等而不同。如果元素类型是文本的话,则可应用基于普通纯文本的加密方法,如替换法。标签虽然是纯文本,但由于是程序指令,有固定的诸多语法规则和约束,不能随便照搬基于普通纯文本的加密方法,而是需要特殊考虑。标签只是控制数据在浏览器上的表现形式,而不会显示出来。如果能够基于标签信息加密,其隐蔽性将会比较好。目前已提出的基于超文本文件的加密方法有:

1、在网页结束标记或者在每行的行尾插入空格或Tab键信息加密,插入一个空格代表0,插入一个Tab代表1。像著名的水印软件 Wbstego、Stegano、Invisible Secret 等都是利用这种方法。之所以可以这样信息加密,是因为浏览器会对超文本标记语言文件中多余的空格忽略掉,从而插入空格或 Tab后不改变显示的结果。可以通过连续插入任意多个符号使得加密的容量可以任意大,这是其优点;其缺点是每插入一个字节的信息,文件大小需增加八个字节;另外,虽然信息加密后的文件浏览的结果不会改变,用记事本这样的编辑软件打开也不容易看出差别(但仔细看还是能看出这些不必要的空白符号的存在),但是当文件以二进制格式打开时其多余的空格符号一览无遗。

2、修改标记名称字符的大小写,用大写表示1,小写表示0来信息加密。例如以大写标记名称、超文本标记语言、代表1,以小写的标记名称、超文本标记语言、代表0。这样,一个标记可加密1bit信息。方法2克服了方法1的缺点,具有较好的隐蔽性和抗攻击性1。