原理
EST是从一个随机选择的cDNA 克隆进行5’端和3’端单一次测序获得的短的cDNA 部分序列,代表一个完整基因的一小部分,在数据库中其长度一般从20 到7000bp 不等,平均长度为360 ±120bp 。EST 来源于一定环境下一个组织总mRNA 所构建的cDNA 文库,因此EST也能说明该组织中各基因的表达水平。
技术路线首先从样品组织中提取mRNA,在逆转录酶的作用下用oligo (dT) 作为引物进行RT -PCR 合成cDNA,再选择合适的载体构建cDNA 文库,对各菌株加以整理,将每一个菌株的插入片段根据载体多克隆位点设计引物进行两端一次性自动化测序,这就是EST 序列的产生过程。2
应用EST作为表达基因所在区域的分子标签因编码DNA 序列高度保守而具有自身的特殊性质,与来自非表达序列的标记(如AFLP、RAPD、SSR 等) 相比更可能穿越家系与种的限制,因此EST标记在亲缘关系较远的物种间比较基因组连锁图和比较质量性状信息是特别有用。同样,对于一个DNA 序列缺乏的目标物种,来源于其他物种的EST也能用于该物种有益基因的遗传作图,加速物种间相关信息的迅速转化。
具体说,EST的作用表现在:
⑴ 用于构建基因组的遗传图谱与物理图谱;
⑵ 作为探针用于放射性杂交;
⑶ 用于定位克隆;
⑷ 借以寻找新的基因;
⑸ 作为分子标记;
⑹ 用于研究生物群体多态性;
⑺ 用于研究基因的功能;
⑻ 有助于药物的开发、品种的改良;
⑼ 促进基因芯片的发展等方面。正是因为EST 表现出了这些巨大潜能,使其得到了充分的利用与发展。
在人类基因组研究中,有一个区别于“全基因组战略”的“cDNA战略”,既只测定转录的DNA序列,也就是测定基因转录产物mRNA反转录产生的互补DNA---cDNA.cDNA代表了基因中编码蛋白质的序列。EST则是cDNA的一个片段,一般长200-400个核苷酸对。一个全长的cDNA分子可以有许多个EST,但特定的EST有时可以代表某个特定的cDNA分子。两端有重叠的共有序列的EST可以组装成一个叠连群(contig),直到装配成全长的cDNA序列,这样就等于是克隆了一个基因的编码序列。将EST定位在基因组,也可作为基因组作图时的一种标记序列。