定义
超文本标记语言的一大特征就是利用URI地址,将不同格式、不同属性、不同位置的各项网络资源,用一种统一的方式相互链接起来。担负这种链接任务的,就是URI,即统一资源标识(Uniform Resource Identifiers,URI)有许多种类型。统一(uniform)的规则提供了多种优点:它允许网络上不同类型的资源标识,利用同一种方式表达出来;它采用统一的语法格式,使得在网络上不同位置的资源也能利用同一种方法表达。
链接地址是不同格式、不同属性、不同位置的各项网络资源的网页地址。资源(resource)的种类有许多,它可以是一篇电子文档、一张图片、一段多媒体音频视频,甚至是一项网络服务(例如气象服务或者会融服务)。1在表中使用链接字段时,可以从数据表或窗体中转入各种信息。只要单击字段中显示链接地址,即可进入另一个对象或程序中。
链接地址可以指向的数据类型有以下3种:
①Intemet上的Web页。
②Access 2003中的窗体和报表等对象。
③字处理文档、电子报表或图形。
保存链接地址时可以为每一个记录都保存一个单独的链接地址,以有利于及时地转到相应的信息中。当在一个表中所有的记录都指向同一个超链接地址时,无需在表中设立链接字段,就可以将这个链接地址的内容保存到数据表或者窗体中。2
相关名词网络爬虫网络爬虫是通过网页的链接地址来寻找网页,从网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其他链接地址,然后通过这些链接地址寻找下一个网页,这样一直循环下去,直到把这个网站所有的网页都抓取完毕。如果把整个互联网当成一个网站,那么网络爬虫就可以用这个原理把互联网上所有的网页都抓取下来。这样看来,网络爬虫就是一个自动提取网页的程序,它为搜索引擎从互联网上下载网页,是搜索引擎的重要组成。
在抓取网页的时候,网络爬虫一般有两种策略:广度优先和深度优先。广度优先是指网络爬虫会先抓取起始网页中链接的所有网页,然后再选择其中的一个链接网页,继续抓取在此网页中链接的所有网页。这是最常用的方式,因为这个方法可以让网络爬虫并行处理,提高其抓取速度。深度优先是指网络爬虫会从起始页开始,一个链接一个链接跟踪下去,处理完这条线路之后再转入下一个起始页,继续跟踪链接。这个方法有个优点是网络爬虫在设计的时候比较容易。
由于不可能抓取所有的网页,有些网络爬虫对一些不太重要的网站,设置了访问的层数。这也让有些网站上一部分网页能够在搜索引擎上搜索到,另外一部分不能被搜索到。3
链接链接是超文本链接的简称,是World Wide Web的关键概念。
链接是指从一个网页指向一个目标的连接关系,这个目标可以是另一个网页,也可以是相同网页上的不同位置,还可以是一个图片、电子邮件地址、文件,甚至可以是一个应用程序。4
链接也称超级链接,当浏览者单击已经链接的文字或图片后,链接目标将显示在浏览器上,并且根据目标的类型来打开或运行。
按照链接路径的不同,网页中超链接一般分为以下3种类型:内部链接,锚点链接和外部链接。
如果按照使用对象的不同,网页中的链接又可以分为:文本超链接,图像超链接,E-mail链接,锚点链接,多媒体文件链接,空链接等。