红外光谱是分子能选择性吸收某些波长的红外线,而引起分子中振动能级和转动能级的跃迁,检测红外线被吸收的情况可得到物质的红外吸收光谱,又称分子振动光谱或振转光谱1。
技术背景在有机物分子中,组成化学键或官能团的原子处于不断振动的状态,其振动频率与红外光的振动频率相当。所以,用红外光照射有机物分子时,分子中的化学键或官能团可发生振动吸收,不同的化学键或官能团吸收频率不同,在红外光谱上将处于不同位置,从而可获得分子中含有何种化学键或官能团的信息。
20世纪60年代,随着Norris等人所做的大量工作,提出物质的含量与近红外区内多个不同的波长点吸收峰呈线性关系的理论,并利用近红外漫反射技术测定了农产品中的水分、蛋白、脂肪等成分,才使得近红外光谱技术一度在农副产品分析中得到广泛应用。60年代中后期,随着各种新的分析技术的出现,加之经典近红外光谱分析技术暴露出的灵敏度低、抗干扰性差的弱点,使人们淡漠了该技术在分析测试中的应用,此后,近红外光谱再次进入了一个沉默的时期。
70年代产生的化学计量学(Chemometrics)学科的重要组成部分--多元校正技术在光谱分析中的成功应用,促进了近红外光谱技术的推广。到80年代后期,随着计算机技术的迅速发展,带动了分析仪器的数字化和化学计量学的发展,通过化学计量学方法在解决光谱信息提取和背景干扰方面取得的良好效果,加之近红外光谱在测样技术上所独占的特点,使人们重新熟悉了近红外光谱的价值,近红外光谱在各领域中的应用研究陆续展开。进入90年代,近红外光谱在产业领域中的应用全面展开,有关近红外光谱的研究及应用文献几乎呈指数增长,成为发展最快、最引人注目的一门独立的分析技术。由于近红外光在常规光纤中具有良好的传输特性,使近红外光谱在在线分析领域也得到了很好的应用,并取得良好的社会效益和经济效益,从此近红外光谱技术进入一个快速发展的新时期2。
近红外光是一种介于可见光(VIS)和中红外光(IR)之间的电磁波,美国材料检测协会(ASTM),将其定义为波长780~2526nm的光谱区。利用近红外光谱的优点有:1.简单方便,有不同的测样器件可直接测定液体、固体、半固体和胶状体等样品,检测成本低。2.分析速度快,一般样品可在1min内完成。3.适用于近红外分析的光导纤维易得到,故易实现在线分析及监测,极适合于生产过程和恶劣环境下的样品分析。4.不损伤样品可称为无损检测。5.分辨率高可同时对样品多个组分进行定性和定量分析等。所以目前近红外技术在食品产业等领域应用较广泛。
这种技术专门用在共价键的分析。如果样品的红外活跃键少、纯度高,得到的光谱会相当清晰,效果好。更加复杂的分子结构会导致更多的键吸收,从而得到复杂的光谱。但是,这项技术还是用在了非常复杂的混合物的定性研究当中。
原理当一束具有连续波长的红外光通过物质,物质分子中某个基团的振动频率或转动频率和红外光的频率一样时,分子就吸收能量由原来的基态振(转)动能级跃迁到能量较高的振(转)动能级,分子吸收红外辐射后发生振动和转动能级的跃迁,该处波长的光就被物质吸收。所以,红外光谱法实质上是一种根据分子内部原子间的相对振动和分子转动等信息来确定物质分子结构和鉴别化合物的分析方法。将分子吸收红外光的情况用仪器记录下来,就得到红外光谱图。红外光谱图通常用波长(λ)或波数(σ)为横坐标,表示吸收峰的位置,用透光率(T%)或者吸光度(A)为纵坐标,表示吸收强度。
当外界电磁波照射分子时,如照射的电磁波的能量与分子的两能级差相等,该频率的电磁波就被该分子吸收,从而引起分子对应能级的跃迁,宏观表现为透射光强度变小。电磁波能量与分子两能级差相等为物质产生红外吸收光谱必须满足条件之一,这决定了吸收峰出现的位置。
红外吸收光谱产生的第二个条件是红外光与分子之间有偶合作用,为了满足这个条件,分子振动时其偶极矩必须发生变化。这实际上保证了红外光的能量能传递给分子,这种能量的传递是通过分子振动偶极矩的变化来实现的。并非所有的振动都会产生红外吸收,只有偶极矩发生变化的振动才能引起可观测的红外吸收,这种振动称为红外活性振动;偶极矩等于零的分子振动不能产生红外吸收,称为红外非活性振动。
分子的振动形式可以分为两大类:伸缩振动和弯曲振动。前者是指原子沿键轴方向的往复运动,振动过程中键长发生变化。后者是指原子垂直于化学键方向的振动。通常用不同的符号表示不同的振动形式,例如,伸缩振动可分为对称伸缩振动和反对称伸缩振动,分别用 Vs 和Vas 表示。弯曲振动可分为面内弯曲振动(δ)和面外弯曲振动(γ)。从理论上来说,每一个基本振动都能吸收与其频率相同的红外光,在红外光谱图对应的位置上出现一个吸收峰。实际上有一些振动分子没有偶极矩变化是红外非活性的;另外有一些振动的频率相同,发生简并;还有一些振动频率超出了仪器可以检测的范围,这些都使得实际红外谱图中的吸收峰数目大大低于理论值。
组成分子的各种基团都有自己特定的红外特征吸收峰。不同化合物中,同一种官能团的吸收振动总是出现在一个窄的波数范围内,但它不是出现在一个固定波数上,具体出现在哪一波数,与基团在分子中所处的环境有关。引起基团频率位移的因素是多方面的,其中外部因素主要是分子所处的物理状态和化学环境,如温度效应和溶剂效应等。对于导致基团频率位移的内部因素,迄今已知的有分子中取代基的电性效应:如诱导效应、共轭效应、中介效应、偶极场效应等;机械效应:如质量效应、张力引起的键角效应、振动之间的耦合效应等。这些问题虽然已有不少研究报道,并有较为系统的论述,但是,若想按照某种效应的结果来定量地预测有关基团频率位移的方向和大小,却往往难以做到,因为这些效应大都不是单一出现的。这样,在进行不同分子间的比较时就很困难。
另外氢键效应和配位效应也会导致基团频率位移,如果发生在分子间,则属于外部因素,若发生在分子内,则属于分子内部因素。
红外谱带的强度是一个振动跃迁概率的量度,而跃迁概率与分子振动时偶极矩的变化大小有关,偶极矩变化愈大,谱带强度愈大。偶极矩的变化与基团本身固有的偶极矩有关,故基团极性越强,振动时偶极矩变化越大,吸收谱带越强;分子的对称性越高,振动时偶极矩变化越小,吸收谱带越弱。
分区1. 红外光谱的分区
通常将红外光谱分为三个区域:近红外区(0.75~2.5μm)、中红外区(2.5~25μm)和远红外区(25~300μm)。一般说来,近红外光谱是由分子的倍频、合频产生的;中红外光谱属于分子的基频振动光谱;远红外光谱则属于分子的转动光谱和某些基团的振动光谱。
由于绝大多数有机物和无机物的基频吸收带都出现在中红外区,因此中红外区是研究和应用最多的区域,积累的资料也最多,仪器技术最为成熟。通常所说的红外光谱即指中红外光谱。
2. 红外谱图的分区
按吸收峰的来源,可以将2.5~25μm的红外光谱图大体上分为特征频率区(2.5~7.7μm)以及指纹区(7.7~16.7μm)两个区域。
其中特征频率区中的吸收峰基本是由基团的伸缩振动产生,数目不是很多,但具有很强的特征性,因此在基团鉴定工作上很有价值,主要用于鉴定官能团。如羰基,不论是在酮、酸、酯或酰胺等类化合物中,其伸缩振动总是在5.9μm左右出现一个强吸收峰,如谱图中5.9μm左右有一个强吸收峰,则大致可以断定分子中有羰基。
指纹区的情况不同,该区峰多而复杂,没有强的特征性,主要是由一些单键C-O、C-N和C-X(卤素原子)等的伸缩振动及C-H、O-H等含氢基团的弯曲振动以及C-C骨架振动产生。当分子结构稍有不同时,该区的吸收就有细微的差异。这种情况就像每个人都有不同的指纹一样,因而称为指纹区。指纹区对于区别结构类似的化合物很有帮助。
红外光谱可分为发射光谱和吸收光谱两类。
物体的红外发射光谱主要决定于物体的温度和化学组成,由于测试比较困难,红外发射光谱只是一种正在发展的新的实验技术,如激光诱导荧光。将一束不同波长的红外射线照射到物质的分子上,某些特定波长的红外射线被吸收,形成这一分子的红外吸收光谱。每种分子都有由其组成和结构决定的独有的红外吸收光谱,它是一种分子光谱。
例如水分子有较宽的吸收峰,所以分子的红外吸收光谱属于带状光谱。原子也有红外发射和吸收光谱,但都是线状光谱。
红外吸收光谱是由分子不停地作振动和转动运动而产生的,分子振动是指分子中各原子在平衡位置附近作相对运动,多原子分子可组成多种振动图形。当分子中各原子以同一频率、同一相位在平衡位置附近作简谐振动时,这种振动方式称简正振动。
含n个原子的分子应有3n-6个简正振动方式;如果是线性分子,只有3n-5个简正振动方式。以非线性三原子分子为例,它的简正振动方式只有三种。在v1和v3振动中,只是化学键的伸长和缩短,称为伸缩振动,而v2的振动方式改变了分子中化学键间的夹角称为变角振动,它们是分子振动的主要方式。分子振动的能量与红外射线的光量子能量正好对应,因此,当分子的振动状态改变时,就可以发射红外光谱,也可以因红外辐射激发分子的振动,而产生红外吸收光谱。
仪器1. 棱镜和光栅光谱仪
属于色散型光谱仪,它的单色器为棱镜或光栅,属单通道测量,即每次只测量一个窄波段的光谱元。转动棱镜或光栅,逐点改变其方位后,可测得光源的光谱分布。
随着信息技术和电子计算机的发展,出现了以多通道测量为特点的新型红外光谱仪,即在一次测量中,探测器就可同时测出光源中各个光谱元的信息,例如,在哈德曼变换光谱仪中就是在光栅光谱仪的基础上用编码模板代替入射或出射狭缝,然后用计算机处理探测器所测得的信号。与光栅光谱仪相比,哈德曼变换光谱仪的信噪比要高些。
2. 傅里叶变换红外光谱仪
它是非色散型的,核心部分是一台双光束干涉仪(图4中虚线框内所示),常用的是迈克耳孙干涉仪。当动镜移动时,经过干涉仪的两束相干光间的光程差就改变,探测器所测得的光强也随之变化,从而得到干涉图。经过傅里叶变换的数学运算后,就可得到入射光的光谱B(v):
式中I(x)为干涉信号;v为波数;x为两束光的光程差。
傅里叶变换光谱仪的主要优点是:
傅里叶变换红外光谱仪
①多通道测量使信噪比提高;
②没有入射和出射狭缝限制,因而光通量高,提高了仪器的灵敏度;
③以氦、氖激光波长为标准,波数值的精确度可达0.01厘米;
④增加动镜移动距离就可使分辨本领提高;
⑤工作波段可从可见区延伸到毫米区,使远红外光谱的测定得以实现。
上述各种红外光谱仪既可测量发射光谱,又可测量吸收或反射光谱。当测量发射光谱时,以样品本身为光源;测量吸收或反射光谱时,用卤钨灯、能斯脱灯、硅碳棒、高压汞灯(用于远红外区)为光源。所用探测器主要有热探测器和光电探测器,前者有高莱池、热电偶、硫酸三甘肽、氘化硫酸三甘肽等;后者有碲镉汞、硫化铅、锑化铟等。常用的窗片材料有氯化钠、溴化钾、氟化钡、氟化锂、氟化钙,它们适用于近、中红外区。在远红外区可用聚乙烯片或聚酯薄膜。此外,还常用金属镀膜反射镜代替透镜。
应用红外光谱对样品的适用性相当广泛,固态、液态或气态样品都能应用,无机、有机、高分子化合物都可检测。此外,红外光谱还具有测试迅速,操作方便,重复性好,灵敏度高,试样用量少,仪器结构简单等特点,因此,它已成为现代结构化学和分析化学最常用和不可缺少的工具。红外光谱在高聚物的构型、构象、力学性质的研究以及物理、天文、气象、遥感、生物、医学等领域也有广泛的应用3。
红外吸收峰的位置与强度反映了分子结构上的特点,可以用来鉴别未知物的结构组成或确定其化学基团;而吸收谱带的吸收强度与化学基团的含量有关,可用于进行定量分析和纯度鉴定。另外,在化学反应的机理研究上,红外光谱也发挥了一定的作用。但其应用最广的还是未知化合物的结构鉴定。
红外光谱不但可以用来研究分子的结构和化学键,如力常数的测定和分子对称性的判据,而且还可以作为表征和鉴别化学物种的方法。例如气态水分子是非线性的三原子分子,它的v1=3652厘米、v3=3756厘米、v2=1596厘米而在液态水分子的红外光谱中,由于水分子间的氢键作用,使v1和v3的伸缩振动谱带叠加在一起,在3402厘米处出现一条宽谱带,它的变角振动v2位于1647厘米。在重水中,由于氘的原子质量比氢大,使重水的v1和v3重叠谱带移至2502厘米处,v2为1210厘米。以上现象说明水和重水的结构虽然很相近,但红外光谱的差别是很大的。
红外光谱具有高度的特征性,所以采用与标准化合物的红外光谱对比的方法来做分析鉴定已很普遍,并已有几种标准红外光谱汇集成册出版,如**《萨特勒标准红外光栅光谱集》**收集了十万多个化合物的红外光谱图。近年来又将些这图谱贮存在计算机中,用来对比和检索。
分子中的某些基团或化学键在不同化合物中所对应的谱带波数基本上是固定的或只在小波段范围内变化,例如,
经常出现在1600~1750厘米,称为羰基的特征波数。许多化学键都有特征波数,它可以用来鉴别化合物的类型,还可用于定量测定。由于分子中邻近基团的相互作用(如氢键的生成、配位作用、共轭效应等),使同一基团在不同分子中所处的化学环境产生差别,以致它们的特征波数有一定变化范围(见下表)。
定性分析红外光谱是物质定性的重要的方法之一。它的解析能够提供许多关于官能团的信息,可以帮助确定部分乃至全部分子类型及结构。其定性分析有特征性高、分析时间短、需要的试样量少、不破坏试样、测定方便等优点。
传统的利用红外光谱法鉴定物质通常采用比较法,即与标准物质对照和查阅标准谱图的方法,但是该方法对于样品的要求较高并且依赖于谱图库的大小。如果在谱图库中无法检索到一致的谱图,则可以用人工解谱的方法进行分析,这就需要有大量的红外知识及经验积累。大多数化合物的红外谱图是复杂的,即便是有经验的专家,也不能保证从一张孤立的红外谱图上得到全部分子结构信息,如果需要确定分子结构信息,就要借助其他的分析测试手段,如核磁、质谱、紫外光谱等。尽管如此,红外谱图仍是提供官能团信息最方便快捷的方法。
近年来,利用计算机方法解析红外光谱,在国内外已有了比较广泛的研究,新的成果不断涌现,不仅提高了解谱的速度,而且成功率也很高。随着计算机技术的不断进步和解谱思路的不断完善,计算机辅助红外解谱必将对教学、科研的工作效率产生更加积极的影响。
定量分析红外光谱定量分析法的依据是朗伯——比尔定律。红外光谱定量分析法与其它定量分析方法相比,存在一些缺点,因此只在特殊的情况下使用。它要求所选择的定量分析峰应有足够的强度,即摩尔吸光系数大的峰,且不与其它峰相重叠。红外光谱的定量方法主要有直接计算法、工作曲线法、吸收度比法和内标法等,常常用于异构体的分析。
随着化学计量学以及计算机技术等的发展,利用各种方法对红外光谱进行定量分析也取得了较好的结果,如最小二乘回归,相关分析,因子分析,遗传算法,人工神经网络等的引入,使得红外光谱对于复杂多组分体系的定量分析成为可能。
量子力学研究表明,分子振动和转动的能量不是连续的,而是量子化的,即限定在一些分立的、特定的能量状态或能级上。以最简单的双原子为例,如果认为原子间振动符合简谐振动规律,则其振动能量Ev可近似地表示为:
式中h为普朗克常数;v为振动量子数(取正整数);v0为简谐振动频率。当v=0时,分子的能量最低,称为基态。处于基态的分子受到频率为v0的红外射线照射时,分子吸收了能量为hv0的光量子,跃迁到第一激发态,得到了频率为v0的红外吸收带。反之,处于该激发态的分子也可发射频率为v0的红外射线而恢复到基态。v0的数值决定于分子的约化质量μ和力常数k。k决定于原子的核间距离、原子在周期表中的位置和化学键的键级等。
分子越大,红外谱带也越多,例如含12个原子的分子,它的简正振动应有30种,它的基频也应有30条谱带,还可能有强度较弱的倍频、合频、差频谱带以及振动能级间的微扰作用,使相应的红外光谱更为复杂。如果假定分子为刚性转子,则其转动能量Er为:
式中j为转动量子数(取正整数);i为刚性转子的转动惯量。在某些转动能级间也可以发生跃迁,产生转动光谱。在分子的振动跃迁过程中也常常伴随转动跃迁,使振动光谱呈带状。
辅助解析
有机化合物的结构鉴定在有机化学、生物化学、药物学、环境科学等许多领域越来越显示出它的重要性,而在各种鉴定手段中红外光谱以其方便灵敏的特性成为有机物结构鉴定的重要手段,除了它对分析结构特征反应灵敏这一特点外,红外光谱仪与计算机直接联机,也为引进一些与计算机科学有关的智能手段创造了条件。
各种现代化的分析仪器的出现和广泛应用,使得在短时间内获得物质体系大量信息成为可能,这为化学计量学的数据挖掘研究提供了机遇。由光谱仪器记录下来的谱图中包含大量的结构信息,但是目前还不能实现复杂分子光谱谱图的直接计算,其解析主要还凭借经验,对一个不是长期从事结构鉴定的人来说,解析一张光谱谱图是一项很困难的工作。实际上,即使对不太复杂的分子,也难于指定所有杂原子所处的官能团和峰的归属,而依靠各种计算机检索系统也会受到各种限制,诸如谱图库中数据有限,或测定条件(仪器的类型、具体的实验条件等)与标准图谱所用的条件不同而造成各吸收峰位置的改变等。另外由于红外谱图极其复杂,构成化合物的原子质量不同,化学键的性质不同,原子的连接次序和空间位置的不同都会造成红外光谱的差别。这些都使红外光谱的解析复杂化。如果能由计算机学习和存储红外光谱知识,用计算机辅助完成解析谱图的工作,自然是一件很有意义的事。
几十年以来,人们一直在探索将红外图谱的解析智能化。随着商品化红外光谱仪的计算机化,出现了许多计算机辅助红外光谱识别方法,这些方法大致可以分为三类:谱图检索系统、专家系统、模式识别方法。
谱图检索谱图检索的主要优点是能够收集大量的光谱,只要根据未知物的光谱谱图就能识别化合物而无需其他数据(例如分子式等),它的程序也比较简单。但是它也有一些不可克服的缺点:
首先,检索系统的能力与谱图库存储的化合物的数量成正比,我们不可能把自然界所有的化合物收集其中,谱图库的发展总是滞后于有机化学的发展。其次,光谱仪器随着技术的发展不断改进:波谱范围不断扩大,分辨率不断提高,低温技术得到应用,一些新仪器的出现,这就要求原有的谱图库要不断修改,而庞大的谱图库在短时间内是办不到的。由于检索方法的这些特点,决定了它不能作为结构鉴定的一种完整的手段。
专家系统
计算机辅助结构解析的另一种方法是专家系统。它所研究的领域包括:数学证明,程序编写,行为科学与心理学,生命科学与医学等。
目前设计的专家系统解析谱图的一般方法是:在计算机里预先存储化学结构形成光谱的一些规律;由未知物谱图的一些光谱特征推测出未知物的一些假想结构式;根据存储规律推导出这些假想结构式的理论谱图,再将理论谱图与实验谱图进行对照,不断对假想结构式进行修正,最后得到正确的结构式。但是,目前分子中各种基团的吸收规律,主要还是通过经验或者人工获得。人工比较大量的已知化合物的红外谱图,从中总结出各种基团的吸收规律,其结果虽比较真实地反映了红外光谱与分子结构的对应关系,却不够准确,特别是这些经验式的知识难以用计算机处理,使计算机专家解析系统难以实用化。
模式识别
模式识别的发展是从五十年代开始的,就是用机器代替人对模式进行分类和描述,从而实现对事物的识别。随着计算机技术的普遍应用,处理大量信息的条件已经具备,模式识别在六十年代得到了蓬勃发展,并在七十年代初奠定了理论基础,从而建立了它自己独特的学科体系。模式识别已经应用到分析化学领域的有关方面,其中涉及最多的是分子光谱的谱图解析,在一些分类问题上获得了成功。
Munk等于1990年首次将线性神经网络应用于红外光谱的子结构解析,把红外光谱的解析带入了一个全新的领域,从此引起红外光谱的计算机解析热潮。随后各种方法,如各种人工神经网络,偏最小二乘,信号处理方法如小波变换等逐步引入到红外光谱的计算机解析中,使模式识别在红外光谱的应用中得到很好的发展。
Cabrol-Bass等使用了一个分等级的神经网络系统识别红外光谱的子结构。首先把10000个化合物光谱分为含苯环、含羟基、含羰基、含C-NH以及含C=C等5大类,随后把这几个类进行进一步分类,总共33个子结构。每一个下级网络使用上一级网络输出的结果。以3596~500 cm-1波段每12 cm-1取259个点作为神经网络的输入,输出为“1”和“0”,分别代表子结构存在和不存在。使用了含有一个隐含层30个节点的反向传播神经网络对每个子结构进行识别,对化合物作了全面但较为粗略的分类,涉及了数据库中一些常见化合物。
这些研究中大部分利用神经网络对子结构进行识别,而对特定类别的化合物没有做深入研究,对化合物的特征吸收峰也没有深入的讨论。另外,其中应用最多的人工神经网络在识别子结构时,对结构碎片的预测准确度不是很高,且神经网络存在不稳定、容易陷入局部极小和收敛速度慢等问题。
因此,近年来,人们一直在寻找一种更好的模式识别方法来进行红外光谱的结构解析。Vapnik等人于1995年在统计学习理论(Statistical Learning Theory, SLT)的基础上提出了支持向量机(Support vector machine, SVM),它根据有限的样本信息在模型的复杂性和学习能力之间寻求最佳折衷,以期获得最好的泛化能力。SVM目前在化学中得到了一些较成功的应用,SVM可以较好的对红外光谱的子结构进行识别,与ANN相比,SVM还具有稳定以及训练速度快等优点,是一种很好的辅助红外光谱解析的工具。
本词条内容贡献者为:
郎奠波 - 副教授 - 黑龙江财经学院