版权归原作者所有,如有侵权,请联系我们

[科普中国]-人类孟德尔遗传联机系统

科学百科
原创
科学百科为用户提供权威科普内容,打造知识科普阵地
收藏

在线人类孟德尔遗传数据库简介

在线孟德尔遗传数据库是一个权威的,及时更新的有关人类基因与遗传性状的综合性数据库。此数据库集中关注于表型与基因型之间的联系,收录了所有孟德尔遗传性疾病和超过12 000种人类基因的相关信息。

它的前身—人类孟德尔遗传数据库(Mendelian Inheritance in Man,MIM)是一个孟德尔遗传性状和疾病的目录,由Johns Hopkins大学的Victor A.McKusick博士在20世纪60年代早期创建。自1966年初版以来,伴随着医学遗传学的迅猛发展,MIM内容急剧扩增,至1998年已出至第12版。一厚再厚的印刷版人类孟德尔遗传数据库越来越难以跟上医学遗传学发展的步伐,1985年,由美国国家医学图书馆和Johns H opkins大学的WilliamH.Wetch医学图书馆合作创建了联机形式的在线孟德尔遗传数据库,并于1995年由NCB工(美国国家生物医学信息中心)开发成为万维网页,供全世界的科学家免费浏览、查询和下载匡〕。

OMIM包括所有已知的遗传病、遗传决定的性状及其基因,除了简略描述各种疾病的临床特征、诊断、鉴别诊断、治疗与预防外,还提供已知有关致病基因的连锁关系、染色体定位、组成结构和功能、动物模型等资料,并附有经镇密筛选的相关参考文献。

OMIM制定的各种遗传病、性状、基因的编号,简称OMIM号,为全世界所公认。有关疾病的报道必须冠以OMIM号,以明确所讨论的是哪一种遗传病。

可见OMIM在国际医学界的权威性。因此,OMIM作为医学遗传学最权威的及时更新的百科全书,被誉为医学遗传学界的“圣经”。

OMIM的功能OMIM是在McKusick博士编撰的《人类孟德尔遗传》一书的基础下发展起来的。目前数据库的整理和注释任务均由John Hopkins大学医学院的一部分专职从事于科学写作和评论的(医学)博士们承担,他(她)们都具有良好的遗传学基础,以保证数据注释的质量1。

对于临床工作者,通过体现病人临床特征的关键词,可以从OMIM数据库中寻找最近的临床检测标准和发展趋势在教学研究方面, OMIM可以迅速、简单地提供给学者们关于基因和遗传病方面最关键的信息和综评,并且实现表型到基因侧的分析。而这些是联机医学检索系统( Vledline )无法比拟的。当然OMIM最具魅力之处是它能够提供给遗传学家关于基因序列、图谱、文献等其它数据库关于该类注释的详尽信息。

因此,这样的无缝集成能够提供和让我们了解疾病基因组领域的前沿性进展和以及该领域活跃的研究工作者。

同时,基于OMIM的知识发现(也就是所谓的数据挖掘,data-mining )也有助于我们掌握生化途径及疾病的分子致病机理。

在线人类孟德尔遗传数据库的特点及时性在线人类孟德尔遗传数据库的内容几乎每日更新,及时更新是O M IM的基本特点。每一收录条目的Edithistory都记录了更新的历史,使读者对于每一条目的“新”的程度心中有数。

全面性OMIM不仅收录了以孟德尔方式遗传的所有单基因病的相关资料,而且还收录了染色体病、多基因病、线粒体病方面的资料,所涵盖的病种异常丰富。具体到每一条目也即是每一种疾病,OMIM都提供了从基础到临床的全方面的信息。基础方面的信息涵盖M appmg(基因定位),MolecularGenetics(分子遗传学)、Pathogenesis(病理机制)、Inheritance(遗传方式),Anneal Model(动物模型)等,临床方面的信息则包括clinical feature(临床特征),Diagnosis(诊断),Clulical Management(临床治疗方案)等。

实用性对于每种疾病,OMIM中的文献经过专家的细致遴选,文献数量远少于Medline,可使科研工作者从浩瀚的文献中解脱出来,快速掌握某种疾病的遗传学知识。此外,此数据库还与其它数据库建立了广泛的链接,如通过链接到NCBI的Medline,可直接链接到相关的参考文献;通过EntrezGene及其子链接Nomenclature, Refseq,G enBank,Protein和UniGene等数据库获得疾病相关基因的DNA序列,蛋白质和表达谱等信息;还可通过Linkout链接到Genetic Association Database(遗传相关性数据库),获得人类复杂性疾病或者性状的基因多态性的相关信息。

准确性OMIM的编辑均为拥有良好的遗传学知识背景的PhD或MD,并且一旦遇到涉及某一新遗传性疾病的论文,只有经过几位高级临床医师的严格审查讨论后,方可载人OMIM。这样,保证了OMIM的准确性和权威性。

OMIM的查询方法OMIM的查询方式有简单查询、高级查询和复杂布尔查询。

简单查询是OMIM的默认查询方式,直接在搜索引擎内填入需要查询的关键词,不必指明搜索范围、限制或布尔算子。例如,我们查询”与心肌病有关的定位于11号染色体的常染色体显性遗传疾病基因”,可以在查询栏内填入"cardiomyopathy 11 autosomal dominant",得到6条结果(查询时间 2001/10/12)。

高级查询可以通过历史(history)、索引(index)和限制(limit)三个菜单的组合方式实现比较多样的查询。历史菜单可以迅速提供先前的查询结果、支持布尔算子(AND,OR,NOT)的组合、修改先前的查询。查询时,布尔算子必须为大写,支持“*”通配符和括号“()”限制。限制菜单的功能包括指定诸如标题,MIM登录号、参考文献等查询范围,以及染色体位置,登录号前缀,如#、*等,记录建立和修改的时间,其它属性诸如等位变异体和基因图座位。索引包括有关数语(terms)的字母列表、包含对应术语的记录文件数,可以提供和选择多个术语用于查询。

这里,我们采取与简单查询同样的例子,来说明高级查询的使用方法。第一步,我们在查询栏内填入“cardiomyopathy" ,’选中“限制菜单(limit ) ",选中复选框“Text”和“chromosomes 11",点击“go"。

第二步,在查询栏内填人“autosomaldominant",选中“限制菜单”,选中查询范围(Searchin Fields))复选框内的“clinical synopsis",点击“go"。第三步,选中“历史菜单(history )" ,敲入上两步的历史代码,如“# 1 AND # 2",得到4条结果。

复杂布尔查询这种查询方式实际上是高级查询的命令行方式,主要优势是一步即可完成高级查询的任务。例如我们前面提到的例子可以改写为布尔算式cardiomyopathy[txt] AND11 [chrom] AND autosomal dominant[clin]。我们可以看到,所有域限定词(field qualifiers)均封闭在方括号内([])。如果没有指定一个域限制词,则系统默认为所有领域(All Fields )。限定词和搜索词可以不必用空格格开,但算子的左右两端则必须是空格。运算符的演算顺序是自左到右,遵循括号优先原则。

OMIM的的缺陷OMIM数据库模式(database schema)和数据模型(data model)不透明,所以无法实现即席查询(adhoc),也没有提供相应的查询界面。也就意味着使用者无法利用SQL查询语句自行编写查询语句进行数据库的知识发现。对于复杂性疾病,例如哮喘,由于所需分析的数据类型异常复杂,OMIM目前提供的解决方案似乎无法满足日益增长的研究需要。而且OMIM包含的内容显然没有座位专一数据库(locus一specific database)那样丰富:突变数据没有完全收集,缺乏引物设计的信息,基因表达谱等等。数据注解仅限于遗传学方面。

值得一提的是,中国医学科学院心血管病研究所生物信息中心正在筹建分子心脏病学数据库,其主要形式将与OMIM和SwissPro相似,是以文本注解为特征,采用专家方式对文献中的数据进行整理,将更多的语义信息以知识表示形式存人系统的一种知识库(knowledgebase )。我们借此也希望全国的同道加人到我们的队伍中来,建立一个具有国际水平的关于心血管疾病方面的生物信息平台,从而推动我国在分子心脏病学领域的研究和协作,以及在世界范围内该领域的研究互动。

在医学遗传学的教学科研中的应用利用OM IM Statistics了解最新的有关遗传病、性状及基因的整体信息

打开OMIM Chttp://www.ncbinlm.mb.gov/om im) ,点击OMIM Facts下的Statistics,截至2009年7月8日,OMIM收录的总条目数为19 437个,与人类疾病或性状相关的序列明确的基因座为13134个(在MIM号前具有“*;号标识),其中具有已知表型的基因座(在MIM号前具有“+”号标识)有374个。分子机制明确的遗传性状有2517个,分子机制未知的孟德尔遗传性状有1744个(在MIM号前具有“%”号标识);其它可能以孟德尔方式进行遗传的性状有2042个。在分子机制未知的孟德尔遗传性状中,常染色体遗传1598个,x连锁遗传141个,Y连锁遗传5个,线粒体遗传0个,采用这种方法,教师可不断获得最新资料介绍给学生。2

利用OMIM数据库获取遗传病最新、最详细的研究资料

科研工作者、教师和学生借助于OMIM,可以从浩瀚的文献堆中解脱出来,快速掌握某一疾病的遗传学知识。如想了解孟德尔遗传病血友病B的相关信息,可在OMIM主页的检索框中输入“hem ophiliaB",点击检索结果中的#306900条目,即可获得关于该疾病的多方面信息,包括Descriptaon(基本描述)、Mapping(基因定位),Molecular Genetics(分子遗传学)、Inheritance(遗传方为,M appmg(基因定位)、Molecular Genetacs(分子遗传学)和PopulataonGenetics(群体遗传学)等。并且每一方面的描述都提供了相应参考文献的链接,可供进一步查阅。

OMIM也收录了多种多基因遗传病,以asthmaCOMIM #600807)为例,OMIM提供了包括Descripton概况),Cfinical Features(临床特例)、Inheritance(遗传方式)、P athogenesis(病理) 、Mappmg(易感基因定位),Molecular Genetics(分子遗传学),AnimalModel(动物模型)等非常全面的信息,使我们可以快速而全面地把握某种疾病的主要信息叹

利用OMIM数据库获得遗传病诊断、咨询及治疗的资料

OMIM还提供了每种疾病的clinical feature(临床特征),Diagnosis(诊断),Cfinical ManagementC临床治疗方案)和Gene Therapy等方面的信息,尤其是其中的clinicalsynopsis(临床提要)简明扼要且实用性很强。可以说掌握了OMIM,就犹如拥有了一套遗传病诊断、治疗的专家系统。

利用OMIM的GeneMap和MorbidMap获取疾病基因定位的详细资料

科研人员借助于OMIM可了解导致特定疾病的特定基因。如在检索框中输入疾病的名称,就可查出该病的基因符号和基因位置信息;输入基因符号可获知与该基因相关的疾病信息;输入染色体区带号可获得该区带定位的基因及相关疾病信息。除此之外,OMIM的不少条目还列出了致病基因的"allelic variants"(等位基因变异型)可供参考巨〕。

目前,遗传性疾病数目不断增多,而大多数遗传病都相对罕见,教学科研工作者、临床医师甚至医学遗传学专家所熟悉的病例毕竟有限,但是通过活用OMIM数据库这部及时更新的字典,可望对数以万计的遗传病轻车熟驾。OMIM也以其庞大的读者群证明着自己的价值。统计表明,全世界每日有4 000位读者查询OMIM,每天的检索次数高达22 000。在医学研究进人分子医学的今天,OMIM必将对医学遗传学的教学科研做出更大贡献。