首页»CRISPR 简介

CRISPR-Cas9的发现历程

1CRISPR-Cas9是什么?

     CRISPR-Cas是一种细菌及古细菌的获得性免疫系统,用来抵抗外源遗传物质的入侵,比如噬菌体病毒和外源质粒。在细菌的基因组上,存在着特殊的CRISPR序列(clustered, regularly interspaced,short palindromic repeats),成簇规律间隔短回文重复序列。当细菌遭受病毒或者外源质粒入侵时,CRISPR产生相应的“记忆”,从而可以抵抗它们的再次入侵。CRISPR-Cas系统可以识别出外源DNA,并将它们切断,沉默外源基因的表达。

     正是由于这种精确的靶向功能,CRISPR-Cas系统被开发成一种高效的基因编辑工具。CRISPR-Cas系统拥有三种类别,其中CRISPR-Cas9是目前研究最深入,应用最成熟的一种类别。

     CRISPR-Cas9是继锌指核酸内切酶(ZFN转录激活因子样效应物核酸酶(TALEN之后出现的第三代基因组定点编辑技术凭借着其成本低廉、操作方便、效率高等优点,CRISPR-Cas9迅速成为了当今最主流的基因编辑技术。

     从科学界首次报道CRISPR的1987年至今,已经过去三十年,而CRISPR-Cas9介导的基因编辑技术在最近5年里才真正在生命科学领域大放异彩。

    2012年,Jennifer Doudna(詹妮弗· 杜德纳)和Emmanuelle Charpentier(埃马纽埃尔·卡彭蒂耶)在Nature杂志上发表论文,首次提出CRISPR-Cas9可以作为简单、灵活的基因组编辑工具。两人因此获得了2015年的“生命科学突破奖”。从那以后最新一代基因编辑技术才真正全面应用到生命科学的各个领域,并迅速崛起,引发新的革命。

2CRISPR-Cas9如何被发现

    CRISPR与锌指蛋白(ZFN)和TALEN蛋白一样,同样是亿万年进化的产物,不过CRISPR原本可不是精密调节基因组的开关,而是——细菌的免疫系统,用于对抗入侵的病毒,比如噬菌体。病毒作为地球上最简单的有机生命形式,没有独立生存繁衍的能力,通过入侵宿主细胞、利用宿主细胞的资源复制自身,完成生命繁衍的循环。


(1)对付噬菌体的杀手锏——CRISPR系统 

    从CRISPR的全名成簇规律间隔短回文重复序列来看,CRISPR本身其实就是细菌基因组DNA上的一段特殊的序列,包含若干重复序列及非重复序列,每个重复序列或非重复序列的长度是几十个碱基。这张图描述了一段典型的CRISPR序列。用数字标记的浅蓝色线段代表了串联间隔重复的DNA序列,而从1到n的数字则是千变万化的非重复序列。


       1987年,日本科学家在K12大肠杆菌的碱性磷酸酶基因附近首次发现了串联间隔重复序列,之后十几年间,世界各地的科学家陆续在不同的细菌中发现了类似的CRISPR序列,但是始终不清楚这意味着什么

  2000年,几位西班牙科学家比对了当时已经具有完整基因组信息的多种细菌,发现二十多种细菌及古细菌里,都带有结构组成相当类似的CRISPR序列。 到2005年,他们继续搜集了六十多种细菌中的4500段CRISPR非重复序列信息,发现其中88段居然在不同物种中重复出现。更妙的是,这其中的47个序列,与许多当时已知的噬菌体基因组序列信息高度一致。

     细菌基因组的深处,隐藏了噬菌体病毒的身份信息生物学家们的第一反应是:CRISPR序列是用来对付噬菌体入侵的武器。

     2007年,一群在杜邦公司旗下的丹尼斯克(Danisco)食品配料公司工作的科学家,在嗜热链球菌中,严格证明了CRISPR序列对于细菌免疫系统的功能。那么,一段CRISPR序列,怎么能识别并抵挡病毒入侵呢?

2CRISPR序列的作用

     后来的研究发现,细菌的CRISPR序列在正常情况下可以被转录成RNA分子,游离于细胞当中。这些小段CRISPR RNA分子充当向导的角色,带着一个蛋白复合体,在细胞体内终日游荡。当有病毒入侵,复合体发现某段病毒DNA的序列和自身向导的序列匹配时,即可切断病毒DNA,使其失去继续利用细菌资源生存和繁衍的能力。

     2012年夏天,杜德纳和卡彭蒂耶联手证明,体外纯化的Cas9蛋白可以单独发挥定位和切割基因组DNA的功能。如果人工编辑CRISPR RNA,即可让Cas9蛋白指哪打哪,切割任意指定的DNA。这个结果清晰地指向了一种全新的基因组编辑技术:理论上人们只需要设计一段几十个碱基的CRISPR,加上天然存在的Cas9蛋白,即可随心所欲地定位和修改任何一段目标基因了。

     此时,距离基于TALEN蛋白的上一代的基因组编辑技术问世不过短短一年。

     2014年,杜德纳和卡彭蒂耶的合作最终完美解释了CRISPR-Cas9系统的工作原理:Cas9蛋白就像一个有着两块卡槽的接线板,能够同时插进一条CRISPR RNA和一条病毒基因组DNA,而当CRISPR RNA和病毒DNA的序列对应时,Cas9蛋白会发生变形,准确地卡住病毒DNA并毫不犹豫的挥起剪刀。



CRISPR-Cas9的具体机制

1CRISPR-Cas9系统的构成

 

    CRISPR-Cas9技术的灵感来源于细菌及古细菌的获得性免疫系统。与哺乳动物的二次免疫应答类似,细菌在抵抗病毒或外源质粒入侵时,会产生相应的“记忆”,来抵抗该种外源遗传物质的再次入侵,而这种获得性免疫正是由细菌的CRISPR-Cas系统实现的。细菌基因组上,CRISPR位点主要由Cas基因,前导区域,CRISPR序列构成。间隔区是源自外源病毒的序列,称为间隔序列(Repeat Spacer array,在病毒或外源质粒上,存在原间隔序列(Protospacer与之对应。


         在细菌及古细菌中,CRISPR系统共分成3类,其中类和类需要多种Cas蛋白共同发挥作用,而类系统只需要一种Cas9即可(Cas9蛋白含有两个核酸酶结构域,可以分别切割DNA两条单链),这为其能够广泛应用提供了便利条件。目前,来自酿脓链球菌CRISPR-Cas9系统应用最为广泛。

2CRISPR获得性免疫的流程

Stage 1:外源DNA俘获  ——“黑名单登记

    CRISPR-Cas系统在这一步实现了黑名单登记功能。CRISPR-Cas系统将识别出入侵者的名字PAM)并找到它的身份证(原间隔序列),然后把入侵者身份信息作为档案(间隔序列)记录到黑名单CRISPR序列)中。

    当噬菌体病毒首次入侵宿主细菌,病毒将双链DNA注入细胞内部。CRISPR-Cas系统会从这段外源DNA中截取一段序列作为外源DNA的“身份证”,然后将其作为新的间隔序列被整合到基因组的CRISPR序列之中。因此,这段与间隔序列对应的“身份证”被称为原间隔序列(protospacer)。

然而,“身份证”的选取并不是随机的。原间隔序列向两端延伸的几个碱基都十分保守,被称为原间隔序列临近基序(protospacer adjacent motif,PAM)。PAM通常由NGG三个碱基构成(N为任意碱基)。

     病毒首次入侵时,Cas1和Cas2编码的蛋白将扫描这段外源DNA,并识别出PAM区域,然后将临近PAM的DNA序列作为候选的原间隔序列。随后,Cas1/2蛋白复合物将原间隔序列从外源DNA中剪切下来,并在其他酶的协助下将原间隔序列插入临近CRISPR序列前导区的下游。最后,细菌DNA进行修复,将打开的双链缺口闭合。这就是CRISPR序列上“间隔序列”产生的过程。


Stage 2: crRNA复合物合成  ——“精确制导导弹

    在CRISPR-Cas9系统中,当入侵者到来,CRISPR序列会在指挥官(前导区)的调控下转录出两种军火材料pre-CRISPR-derived RNApre-crRNA)和trans-acting crRNAtracrRNA)。pre-crRNA是由整个CRISPR序列转录而成的大型RNA分子;tracrRNA是由CRISPR序列中重复序列区转录而成的具有发卡结构RNA,随后,pre-crRNAtracrRNA以及Cas9编码的蛋白将会组装成一个小型兵工厂它将根据入侵者的类型,选取对应的身份证(间隔序列RNA),并在RNase 的协助下对这段目标身份证进行剪切,最终形成一段短小的crRNA(包含单一种类的间隔序列RNA以及部分重复序列区)。crRNAtracrRNA以及Cas9组成的复合物,就是最终的精确制导导弹

Stage 3: 靶向干扰 —— 强大火力,精确打击

    Cas9/tracrRNA/crRNA复合物可以对入侵者的DNA进行精确的打击。复合物将扫描整个外源DNA序列,并识别出与crRNA互补的原间隔序列。当复合物定位到目标PAM/原间隔序列的区域时,DNA双链将被解开,形成R-LoopcrRNA与互补链配对,另一条链则保持游离状态。随后,Cas9蛋白发起猛烈攻势,其HNH核酸酶活性位点将剪切与crRNA互补的DNA单链,而其RuvC活性位点将剪切另一条非互补单链。最终,Cas9强大的火力使目标DNA双链断裂(DSBdouble-strand break),外源DNA的表达被沉默,一举歼灭入侵者。


3、如何使用CRISPR-Cas9技术

    CRISPR-Cas9是进行基因编辑的强大工具,可以对基因进行定点的精确编辑。在向导RNAgRNAcrRNAtracrRNA的复合物)和Cas9蛋白的参与下,待编辑的细胞基因组DNA将被看作病毒或外源DNA,被精确剪切。

   使用CRISPR-Cas9进行基因编辑也有一些限制条件。首先,待编辑的区域附近需要存在相对保守的PAM序列(NGG碱基)。其次,向导RNA要与待编辑的区域的序列碱基互补配对。

   CRISPR-Cas9最基础的应用是基因敲除。如果对目标基因的上下游各设计一条向导RNA(向导RNA1,向导RNA2),将其与含有Cas9蛋白编码基因的质粒一同转入细胞中,向导RNA通过碱基互补配对可以靶向PAM附近的目标序列,Cas9蛋白会使目标基因上下游的DNA双链断裂。而生物体自身存在的DNA损伤修复机制,会将断裂的序列连接起来,从而实现了细胞中目标基因的敲除。果在此基础上为细胞引入一个修复的模板质粒(供体DNA分子),这样细胞就会按照提供的模板在修复过程中引入片段插入或定点突变,实现基因的替换或者突变。随着研究深入,CRISPR-Cas9还可以被用于基因激活、转录抑制模型等其他方面。