介绍
欧洲分子生物学实验室EMBL(European Molecular Biology Laboratory)1974年由欧洲14个国家加上亚洲的以色列共同发起建立,现在由欧洲30个成员国政府支持组成,目的在于促进欧洲国家之间的合作来发展分子生物学的基础研究和改进仪器设备、教育工作等。EMBL分为7个部分:结构、分化、物理仪器、生化仪器、生物仪器、计算机和应用数学。它的宗旨是:从事结构分子生物学及分子医学方面的基础研究;为科学家、学生及访问学者提供高层次的培训;为成员国的科学家提供必需的科研服务;在生命科学领域开发新型的科研仪器及研究方法;积极参与生物技术的转化及应用。
研究领域EMBL目前约有85个独立的课题组,涵盖分子生物学的各个主要分支,其研究主要集中在以下几个方面:
1.生化实验技术质谱分析(Mass Spectrometry)等。
2.细胞生物学(Cell Biology),研究细胞膜上蛋白和脂肪的分布,包括膜运输、微管网络、细胞核及细胞周期,焦点是Rab蛋白。
3.细胞生物物理(Cell Biophysics),重点是理论创新和实际应用的研究,尤其是光学显微镜的完善使用。
4.分化(Differentiation),集中研究果蝇的早期发育。
5.基因表达(Gene Expression),研究基因到蛋白质信息传递的过程,尤其是核糖体合成在整个细胞生命过程中的重要作用。
6.结构生物学(Structure Biology),在过去几年中建立了cDNA测序技术、生物计算、蛋白工程、晶体学、电子显微镜(EM)及核磁共振(VMR),研究肌肉巨型蛋白分子Titin。
7.法国格勒诺布尔(Grenoble)分站,主要研究蛋白质合成过程,尤其揭示了G-蛋白-鸟苷酸交换因子偶联物的结构。
8.德国Hamburg分站,着重于结构生物学研究,如光学测量系统、晶体学、X-线吸收光谱及小角散射,有长期的分子生物学国际合作研究历史。
9.英国Hinxton分站EBI(European Bioinformatics Institute,欧洲生物信息学研究所),重点是与世界上其他分子生物学数据库进行合作研究,最主要的有EMBL核酸序列数据库,后参与了与日内瓦大学共同进行的SWISS-PROT的建设。在SWISS-PROT与EMBL核苷酸序列库之间的数据转移的基础上,产生了新的数据库TREMBL(Translation from EMBL),使核苷酸序列库的核苷酸序列自动翻译成SWISS-PROT蛋白序列库中的蛋白序列。
10.放射性杂交数据库(Radiation Hybrid Database)。
11.Monterotondo研究中心组,EMBL和欧洲其他研究组一起,加入到哺乳类生物学和生物医学的研究行列,中心位于意大利罗马北部的Monterotondo,着重于鼠遗传学研究。
核酸序列数据库EMBL-DNA数据库于1982年由EMBL建立,与美国的GenBank及日本的DDBJ共同组玉成球性的国际DNA数据库,近年来发展很快,在1995年数据量成倍递增。EBI是EMBL在英国Hinxton的分部,主要负责建立EMBL-DNA数据库,可进行核苷酸序列检索及序列相似性查询。
EMBL数据库的基本单位也是序列条目,包括核甘酸碱基排列顺序和注释两部分。序列条目由字段组成,每个字段由标识字起始,后面为该字段的具体说明。有些字段又分若干次子字段,以次标识字或特性表说明符开始,最后以双斜杠“//”作本序列条目结束标记。条目的关键字包括ID(序列名称),DE(序列简单说明),AC(序列编号),SV(序列版本号),KW(与序列相关的关键词),OS(序列来源的物种名),OC(序列来源的物种学名和分类学位置),RN(相关文献编号或递交序列的注册信息),RA(相关文献作者或递交序列的作者),RT(相关文献题目),RL(相关文献杂志名或递交序列的作者单位),RX(相关文献 Mediline引文代码),RC(相关文献注释),RP(相关文献其他注释),CC(关于序列的注释信息),DR(相关数据库交叉引用号),FH(序列特征表起始),FT(序列特征表子项),SQ(碱基种类统计数)。
欧洲生物信息学研究所(European Bioinformatics Institute, EBI)创建的一个核酸序列数据库。EMBL的数据来源主要有两部分,一部分由科研人员或某些基因组测序机构通过计算机网络直接提交,另一部分则来自科技文献或专利(Stoesser等, 1998)。EMBL与DDBJ、GenBank建有合作关系,他们分别在全世界范围内收集核酸序列信息,每天都将新发现或更新过的数据相互交换。
DNA数据库的规模正在以指数方式增长,平均不到9个月就增加一倍。1998年1月,EMBL中收录的序列数已超过一百万,包括15,500个物种,其中模式生物的序列占50%以上,它们包括人类(Homo sapiens), 线虫(Caenorhabditis elegans),啤酒酵母(Saccharomyces cerevisiae),小鼠(Mus musculus)和拟南芥(Arabidopsis thalania)。
可以利用序列查询系统 SRS(Sequence Retrieval System)从EMBL数据库中提取有关信息(Etzold等,1996年)。SRS序列查询系统通过超文本链接将DNA序列数据库和蛋白质序列、功能位点、结构、基因图谱以及文献摘要MEDLINE等各种数据库联系在一起。利用EBI网站提供的BLAST或FastA程序,可以对EMBL数据库进行未知序列同源性搜索。1