CRISPR-Cas9最著名的功能是作为编辑DNA的实验室工具,但它的自然功能是作为免疫系统的一部分,帮助某些微生物对抗病毒。
麻省理工学院生物化学家张锋团队联合美国国家生物技术信息中心研究人员开发出一种名为FLSHclust的新算法,在数十亿个蛋白质序列中发现了188个罕见且以前未知的CRISPR连接基因模块。新发现为利用CRISPR系统和了解微生物蛋白质的功能多样性提供了新机会。
“我们对CRISPR系统的多样性感到惊讶。”麻省理工学院生物化学家张锋,“做这种分析可以让我们一石二鸟:既研究生物学,也可能找到有用的东西。”
单细胞细菌和古细菌使用CRISPR系统来保护自己免受噬菌体的侵害。CRISPR系统通常由两部分组成:识别并结合噬菌体DNA或RNA的“引导RNA”分子,以及在引导RNA指示的位点切割或干扰遗传物质的酶。
到目前为止,研究人员已经确定了六种CRISPR系统,分别从I命名到VI。它们有不同的特性,包括使用酶的类型,以及它们如何识别、结合和切割RNA或DNA。用于基因工程的CRISPR - cas9系统被归类为II型,其他类型的CRISPR特征可能对其他方面有用。
为了在自然界中找到不同的CRISPR系统,张锋团队开发了一种名为FLSHclust的算法,可分析公共数据库中的基因序列。这些数据库包含来自细菌和古细菌的数十万个基因组,数亿个未与特定物种相关联的序列,以及数十亿个编码蛋白质的基因。FLSHclust通过寻找基因序列之间的相似性,并将它们分组成大约5亿个簇,发现了CRISPR相关基因。
通过观察这些簇的预测功能,研究人员发现了大约13万个基因以某种方式与CRISPR相关,其中188个是以前从未见过的,他们在实验室测试了几个基因以了解它们的作用。实验结果揭示了CRISPR系统用来攻击噬菌体的各种策略,包括解开DNA双螺旋结构,以及以允许基因插入或删除的方式切割DNA。他们还发现了“抗CRISPR”的DNA片段,这可能有助于噬菌体逃避细菌的防御。
在这些新基因中,有一种完全未知的靶向RNA的CRISPR系统的代码,该团队将其命名为VII型。研究通讯作者之一、美国国家生物技术信息中心生物学家 Eugene Koonin表示,找到新的CRISPR系统越来越难了,VII型和任何其他尚未被识别的CRISPR类型在自然界中一定是极其罕见的,这可能需要付出巨大的努力才能找到下一种类型。
巴黎萨克雷大学微生物学家Christine Pourcel说,很难知道某些类型的CRISPR系统是罕见的,因为它们对微生物通常没有用处,还是专门适应于生活在特定环境中的生物体。她补充说,由于研究中使用的基因数据库包括与特定生物体没有联系的基因组片段,因此很难研究一些新系统的作用。
新西兰达尼丁奥塔哥大学生物化学家Chris Brown表示,该算法本身就是一项重大进步,因为它将使研究人员能够在不同物种之间寻找其他类型的蛋白质。
“这是生物化学家的宝库。”德国马尔堡大学微生物学家Lennart Randau对此表示赞同。他说,下一步将是找出酶和系统工作的机制,以及如何将它们用于生物工程。“一些CRISPR蛋白会随机切割DNA,对工程毫无用处。但它们在检测DNA或RNA序列方面非常精确,可能会成为很好的诊断或研究工具。”
研究人员认为,现在说VII型CRISPR系统或FLSHclust鉴定的任何其他基因是否对基因工程有帮助还为时过早,但它们有一些可能有用的特性。例如,VII型病毒只涉及很少的基因,这些基因可以很容易地装入病毒载体并传递到细胞中。相比之下,该团队发现的其他一些系统包含非常长的引导RNA,这可能使它们能够以前所未有的准确性靶向特定的基因序列。