基因编辑

19

SEP

CRISPR 基因编辑技术及张锋的贡献

SEP 19, 2016科学网MIT

核心提示: 地球上所有细胞生物的遗传信息都储存在数字化的DNA序列中。今天,基因测序技术已经非常发达,DNA序列可以非常廉价迅速的确定。但测序只是读取数据,近年生物学最大的发现与发明之一是可编程的基因编辑技术:CRISPR-Cas9。

 

CRISPR 基因编辑技术及张锋的贡献

地球上所有细胞生物的遗传信息都储存在数字化的DNA序列中。今天,基因测序技术已经非常发达,DNA序列可以非常廉价迅速的确定。但测序只是读取数据,近年生物学最大的发现与发明之一是可编程的基因编辑技术:CRISPR-Cas9。这个技术类似于 WORD的搜索替换功能:用户输入一串字符串,程序找到匹配的字符串,然后进行删除或者替换。CRISPR-Cas9 的编辑技术里,搜索匹配字符串由实验人员通过一段 RNA表示,叫做导引 RNA -- gRNA,编辑由一个称为 Cas9 的蛋白根据 gRNA 定位完成。这个编辑系统的灵活性显而易见。Cas9 蛋白是固定的,你只需要改变导引就能在不同位置对DNA进行编辑。

CRISPR-Cas9 技术的来源是细菌的自然免疫系统。某些细菌在遭到病毒入侵后,能够把病毒基因的一小段存储到自身的 DNA 里一个称为 CRISPR 的存储空间。当再次遇到病毒入侵时,细菌能够根据存写的片段识别病毒,将病毒的DNA切断而使之失效。有的细菌的CRISPR系统很复杂,涉及多种 Cas 蛋白 (Cas 的意思是 CRISPR-associated -- 与CRISPR相联的 )。经过多年的研究,生物学家们终于找到了一种简单的系统,只用到一种蛋白 -- Cas9。接下来,他们成功把这个细菌的系统进行改造用于动植物细胞的基因编辑。率先完成这一实际应用性开发的是张锋的研究小组。本文试图对相关技术与历史进行简单的介绍。

这里我把CRISPR之前漫长的研究历史一笔带过。简单而言,人们之前发现细菌免疫系统依靠一段很短的RNA进行识别,这段RNA称为 crRNA (CRISPR RNA)。可想而知,这段 crRNA 包含有入侵病毒的基因识别码。

张峰博士

CRISPR相关研究在2011年取得了重大突破。这一年,法国女科学家 Emmanuelle Charpentier 报告,通过基因分析与相关实验,发现一个只有四个组件的细菌免疫系统。除了 Csn1 蛋白(后来称为 Cas9)与 crRNA外,还发现一个他们称之为 trans-activating CRISPR RNA(简称 tracrRNA)的RNA。顾名思义,这个 tracrRNA 起到转写-启动的功能。第四个组件是一个作用于RNA的生成,称为 RNase III的蛋白。但这篇2011年的论文对各个组件的具体功能并没有完全确定。其论文中的下图显示 :蓝色是 Cas9 蛋白,红色的是 tracrRNA, 绿色+黑色线段是 crRNA (其中绿色部分对应需要识别的病毒编码),黄色是RNase III。

DOUDNA、Charpentier 联合小组通过在细胞体外的试管实验发现了负责DNA切割的充分并且必要的三个部分:Cas9, crRNA 与tracrRNA (不需要 RNase III)。论文还确定了三个部分的作用:其中Cas9 是切割机, crRNA 的主要作用是定位。而 tracrRNA 在与crRNA耦合后启动 Cas9 的切割功能(activate)。他们还成功把 crRNA 与tracrRNA 连起来成为一个分子,这样可以把 DNA 切割的组件由三个变成两个。如上图。左边是自然原核细菌中的机制,两个RNA分子。右边则是人工机制,把两个RNA给连起来了,成为一个带着一个配对圈的RNA分子。但 DOUDNA 等人的实验并没有在任何细胞内进行,只是在细胞体外的试管里,当然也没有在动植物等真核细胞内实验,也不知道能否可行( “it was not known whether such a bacterial system [the CRISPR-Cas9 system] would function in eukaryotic cells.”) 。

现在我们知道,Charpentier 2011年的论文出来后,美国东部 BROAD研究院的张锋小组也展开了研究。在Doudna/Charpentier 2012年6月论文发表前半年,张锋在2012年1月向NIH申请了一个项目:运用Cas9系统对真核细胞进行基因编辑。

cripsr

上图是一个哺乳动物 CRISPR 基因编辑系统的设计。其代码进行表达后会生成四个部分(1)带NLS的Cas9 蛋白,(2)tracrRNA ,(3)多个 crRNA -- 注意不同颜色的线段 (图中称为 guide RNA array),(4) 带NLS的RNase III。真核细胞的特点是遗传物质在细胞核内,一般较大的蛋白是进不去的。其中 的 NLS 是为了使 Cas9 等 生成后能够被拖入细胞核内。可以这么说,张锋的思路是先不管具体机制是什么,直接在高等生物上进行基因编辑实验,而且多点编辑同时进行。

张的小组在2013年1月发表论文,报告了他们的发现:(1)他们对四个组件进行了组合实验,发现基因编辑不需要 RNase III;(2)使用 Cas9 、crRNA 与 tracrRNA 组合,成功对真核细胞实现编辑,效率相当高( indel 达19%);(3)使用 DOUDNA 论文中的嵌合 RNA (chimera),发现长的那个(chimera A )编辑效率较双RNA系统低 (最高5.6%, 部分无法探测),短的那个 (chimera B) 不能编辑。