摘要:基因编辑技术是以特异性改变遗传物质靶向序列为目标的技术。近年来,锌指核酸酶(zincfingernuclease,ZFN)、类转录激活因子效应核酸酶(transcriptionactivator-likeeffectornuclease,TALEN)、规律成簇的间隔短回文重复(regularclusteringofshortpalindromerepeats,CRISPR)和单碱基编辑(baseediting,BE)技术的相继出现,不仅为基因功能研究提供了有力的工具,还为生命医学提供了新的治疗方案。基因编辑技术已经大范围应用于动物细胞模型的构建、药物靶点的筛查和基因功能研究等,在基因治疗领域也展现出广阔的应用前景。本文就基因编辑技术的研究进展及其在基因治疗中的应用进行了概述,并对基因编辑技术的的原理、发展史、优缺点以及在基因治疗中的应用前景和机遇挑战进行了讨论,以期为基因编辑技术的临床转化提供参考。
关键词:基因编辑技术;CRISPR/Cas9;单碱基编辑;基因治疗
基因编辑技术是以改变目的基因序列为目的,实现定点突变、插入或敲除的技术。从20世纪末人们就开始对基因编辑技术进行探索,但直到2013年CRISPR/Cas9(clusteredregularlyinterspacedshortpalindromicrepeats(CRISPR)/CRISPR-associatedprotein9)技术成功用于哺乳动物细胞,才极大地推动了基因编辑技术的发展热潮[1]。
相关期刊推荐:《基因组学与应用生物学》Genomics and Applied Biology(双月刊)着重刊登农林科学、医药科学、动物科学、环境、生态领域的研究成果。办刊宗旨及业务范围为:反映国内外基因组学、生物科学及农业、医药领域的最新进展和发展趋势,报道前沿学科突破性成果,为中国生命科学研究与发展提供学术交流平台。有投稿需求的作者,可以咨询期刊天空在线编辑。
真核生物的基因组包含数十亿个碱基,对其基因组的操作一直面临挑战。同源重组技术(homologousrecombination,HR)是最早的基因编辑技术,也是真核生物基因编辑的一个重大突破。其原理是将外源性目的基因导入受体细胞,通过同源序列交换,使外源性DNA片段取代原位点上的基因,从而达到使特定基因失活或修复缺陷基因的目的。但是对高等真核生物来说,外源DNA与目的DNA自然重组率非常低,只有10-7~10-6[2,3];若要得到稳定遗传的纯合体基因敲除模型,至少需要两代遗传,因此HR的大规模应用受到了一定的限制。
为应对这一挑战,一系列基于核酸酶的基因编辑技术相继出现,实现了在真核生物尤其是哺乳动物中精准有效的基因编辑。与传统的基因编辑技术相比,基于核酸酶的基因编辑技术减少了外源基因随机插入,提高了对基因组特定片段进行精确修饰的几率。目前基因编辑技术主要包括以下几种:人工介导的锌指核酸酶技术(zincfingernucleases,ZFNs)、类转录激活因子效应核酸酶技术(transcriptionactivatorlikeeffectorsnucleases,TALENs)、规律成簇的间隔短回文重复相关蛋白技术(CRISPR/Cas9)和单碱基编辑(baseeditor,BE)技术等[4]。
基因编辑技术掀起的研究热潮,一方面是因为基因编辑技术本身的发展,更为精准、高效、低成本的基因编辑技术不断地被开发出来;另一方面基因编辑技术作为一项重要的工具,在基因筛查、动物、细胞模型构建等基础研究中发挥着重要的作用,也为许多疾病的基因治疗提供了新的思路[2~4]。因此,本文从基因编辑技术的发展历程及其在基因治疗中的探索和应用进行概述,并对基因编辑技术面临的挑战和机遇进行讨论。
1基因编辑技术研究进展
基于DNA核酸酶的基因编辑技术发展迅速,从第一代DNA核酸酶编辑系统ZFNs、第二代TALENs到第三代CRISPR/Cas9系统,基因编辑效率不断提高、成本逐渐降低,应用范围不断扩大。ZFNs、TALENs和CRISPR/Cas9等3种基因编辑技术都是在基因组靶标位点引起DNA双链断裂(double-strandbreaks,DSBs),进而激活细胞内部修复机制的基础上建立的。细胞内DNA双链断裂的修复机制包括易引起随机插入、缺失的异源末端连接(non-homologousendjoining,NHEJ)和需要同源模板存在才可以激活的同源重组修复(homologydirectedrepair,HDR)[5,6]。2016年,BE技术的开发实现了在不引起DNA双链断裂和无需同源模板的情况下的单个碱基转换,有效地规避了基于双链DNA断裂后NHEJ和HDR修复的基因编辑技术的不足。
1.1ZFNs
20世纪90年代,FokI酶的发现促进了ZFNs的出现[7,8]。1996年,美国约翰霍普金斯大学环境卫生科学系Chandrasegaran团队构建了基于FokⅠ酶和锌指蛋白融合的ZFNs技术[9]。ZFNs包含两个结构域:DNA结合的锌指蛋白区域和限制性核酸内切酶FokⅠ的核酸酶切活性区域(图1)。锌指蛋白区域决定了ZFNs的序列特异性。锌指基序一般由30个氨基酸组成,其结合锌离子的保守区域通常为4个半胱氨酸或2个半胱氨酸和2个组氨酸,其空间结构由1个螺旋和2个反向的b平行结构组成。螺旋的1、3、6位的氨基酸分别特异性地识别并结合DNA序列中的3个连续的碱基。由于不同的锌指基序中a螺旋的1、3、6位氨基酸不同,因此由3~6个不同锌指基序组成的锌指蛋白区域与FokⅠ核酸酶区域连接就构成了可以特异识别DNA序列并进行切割的人工核酸酶。FokⅠ必须二聚化才具有活性。由于FokⅠ自身二聚化也能对DNA进行切割,但是切割效率低且易产生非特异切割,所以在设计ZFNs时可以对FokⅠ进行突变,使之不能形成同源二聚体。当两个结合不同靶序列的突变的FokⅠ被5~7bp的spacers隔开就可以形成具有核酸酶的活性的异源二聚体[10,11]。这样设计的ZFNs可以增加其DNA序列识别的特异性。
基于Chandrasegaran的工作,美国犹他大学医学院生物化学系的DanaCarrol团队使用ZFNs注入果蝇胚胎,第一次实现了在动物中的基因编辑[12,13]。随后,科学家用ZFNs技术在动物、植物和人类细胞中都实现了靶基因的编辑[10,14]。尽管ZFNs技术在多个物种中成功进行了基因编辑,但是锌指蛋白的设计费时费力,成本较高,限制了该方法的大规模应用[14,15]。
1.2TALENs
2009年,美国爱荷华州立大学植物病理学与生物信息学系的AdamJ.Bogdanove团队和德国马丁卢瑟大学生物研究所的UllaBonas团队分别发现了来自植物致病黄单胞菌属的转录激活效应蛋白(transcription-activator-likeeffector,TALE)和DNA的相互作用[16,17]。将TALE蛋白与FokⅠ酶区域结合构建了新一代的核酸酶编辑技术——TALENs[14,18]。TALENs的组成和ZFNs的相似之处是在其羧酸末端也含有FokⅠ核酸酶结构域,不同之处是TALENs的DNA结合域为TALE蛋白(图1)[19]。TALE蛋白中每个识别模块由34个氨基酸组成,除了第12和13位氨基酸外其余氨基酸序列都是保守的,第12和13位氨基酸称为可变的双氨基酸残基(repeatvariabledi-residue,RVD)。RVD决定了TALE识别并结合的DNA碱基。4种不同的碱基都有与之对应的TALE识别模块。因此构建TALEN人工核酸酶时,只需要按照目标序列的顺序将不同的TALE识别模块的序列连接起来,再与FokⅠ的编码序列融合即可。相对于ZFNs来说,TALENs的设计变得容易,对任意的DNA序列理论上都可以设计和构建一个特异的TALEN核酸酶。但是目标序列的每个碱基都需要一个TALE识别模块,因此TALENs的构建过程工作量较大。此外,TALENs在人类细胞中的细胞毒性较低[14,20]。2011年,Miller等[18]第一次使用TALENs在人类细胞中对NTF3和CCR5基因进行编辑,证明了TALEN核酸酶对内源靶向基因的调节和修饰作用。
1.3CRISPR/Cas9
2012年CRISPR/Cas9的体外重构和2013年在人类细胞中证明了其基因编辑功能,标志着新一代基因编辑时代的开始[21,22]。CRISPR/Cas9系统来源于细菌和古细菌的天然获得性免疫系统,通过CRISPRRNA(crRNA)和trans-activatingcrRNA(tracrRNA)以及Cas9蛋白组成的复合体抵御外源性DNA的入侵。CRISPR/Cas9系统发挥作用的基本过程可以分为3个阶段:第一个阶段为间隔序列获得期,质粒或噬菌体携带的DNA片段被宿主的核酸酶切割成短的DNA片段,符合条件的DNA片段整合进宿主CRISPR位点成为crRNA重复序列间的间隔序列;第二个阶段为CRISPR/Cas9表达期,Cas9蛋白表达,CRISPR序列由pre-crRNA加工为成熟的crRNA,成熟的crRNA包含间隔序列,靶向结合于外来入侵的DNA;第三阶段为DNA干扰期,Cas9蛋白在向导crRNA的引导下识别靶向位点,并调节基因组的剪切[22]。根据Cas蛋白的不同,CRISPR/Cas系统可以分为5类:类型Ⅰ、Ⅲ和Ⅳ的CRISPR位点包含crRNA与多个Cas蛋白形成的复合物;类型Ⅱ(Cas9)和类型V(Cpf1)只需要RNA介导的核酸酶[23]。许多CRISPR系统都依赖于临近crRNA靶向位点的PAM(protospaceradjacentmotif)序列,PAM序列的缺失将会导致Ⅰ型和Ⅱ型CRISPR系统的自我剪切[24]。
广泛用于基因编辑的CRISPR/Cas9是Ⅱ型CRISPR系统,由Cas9蛋白和sgRNA(singleguideRNA)组成。sgRNA是根据crRNA和tracrRNA形成的高级结构设计的,与Cas9核酸酶蛋白结合,指导其识别并剪辑靶向序列,靶向序列附近必需存在含有NGG或者NAG的PAM基序[25~27](图1)。
相比较ZFNs和TALENs,CRISPR/Cas9通过一段与目标DNA片段匹配的向导RNA引导核酸酶识别靶向位点,提高了Cas9核酸酶的特异性;同时,Cas9在sgRNA的引导下以单体蛋白的形式发挥功能,不像ZFNs和TALENs的FokⅠ酶只有二聚化才具有切割靶向DNA的活性,因此CRISPR/Cas9也避免了精细复杂的蛋白质设计或组装的需要。但是,由于CRISPR/Cas9来自于原核生物天然获得性免疫系统抵御外来遗传物质的防御系统,Cas9核酸酶可能继承了序列特异性低的特点,使其非特异性切割的几率增加,造成脱靶效应增多。不同的科研团队提出了不同的方法修饰或编辑Cas9和sgRNA以降低脱靶效应[28,29]。如将Cas9蛋白与FokⅠ核酸酶、锌指蛋白或者TALE蛋白结合提高Cas9的特异性[30~32];用失活的Cas9蛋白和FokⅠ区域融合形成新的核酸酶,使其只有在核酸酶二聚化时才具有活性;Fatih等[32]将锌指蛋白或者TALE蛋白与Cas9蛋白变异体融合增强核酸酶的特异性。另一种降低脱靶效应的方法是使用切口酶代替核酸酶,产生单链断裂而不是双链断裂,单链断裂不能诱导NHEJ的修复,仍然可以激活HR的精确修复[14]。单链断裂可以使脱靶效应降低,但修复效率也降低,因此有人提出了使用双切口酶的方法,既提高了基因编辑的特异性也提高了编辑的效率[33]。
1.4BE
ZFNs、TALENs和CRISPR/Cas9技术都依赖于在靶位点诱导双链断裂进而激活DNA的NHEJ和HDR。NHEJ容易引起随机插入和缺失,造成移码突变,进而影响靶基因的功能;HDR尽管精确性高于NHEJ,但是其在细胞中的同源重组修复效率低,约为0.1%~5%。BE技术的出现有效地改善了以上问题[34,35]。
2016年4月,美国哈佛大学DavidLiu实验室第一次发表了不需要DNA双链断裂也不需要同源模板即可进行单碱基转换的基因编辑技术——BE技术。该技术基于无核酸酶活性的dCas9(Inactive,ordeadCas9)或有单链DNA切口酶活性的Cas9n(Cas9nickase)、胞嘧啶脱氨酶、尿嘧啶糖基化酶抑制子(uracilDNAglycosylaseinhibitor,UGI)以及sgRNA形成的复合体,在不引起双链DNA断裂的情况下,直接使靶向位点的胞嘧啶(Cytosine,C)脱氨基变成尿嘧啶(Uracil,U);由于尿嘧啶糖基化酶抑制子的存在,抑制了U的切除;随着DNA复制,U被胸腺嘧啶(Thymine,T)取代;同时,互补链上原来与C互补的鸟嘌呤(Guanine,G)将会替换为腺嘌呤(Adenine,A),最终实现了在一定的活性窗口内C到T和G到A的单碱基精准编辑。BE技术的出现促进了点突变基因编辑的有效性和使用范围[36]。
DavidLiu团队对4种胞嘧啶脱氨酶——hAID(humanactivationinduceddeaminase)、hAPOBEC3G(humanapoliproteinBmRNA-editingenzyme-catalyticpolypeptide-like-3G)、rAPOBEC1(ratapolipoproteinBmRNA-editingenzyme1)和七鳃鳗(Lethenteroncamtschaticum)来源的AID类似物PmCDA1进行评估,发现rAPOBEC1具有最高的脱氨酶活性[36]。他们通过将rAPOBEC1与dCas9的N末端以及16个残基的XTEN连接体融合,组成了第一代碱基编辑器BE1(rAPOBEC1-XTEN-dCas9),具有5nt的活性窗口[36]。第二代碱基编辑器BE2(APOBEC-XTENdCas9-UGI)融入了UGI抑制了U糖基化引起碱基切除修复,编辑效率在人类细胞比BE1高3倍[36]。第三代碱基编辑器BE3(APOBEC-XTEN-dCas9(A840H)-UGI)恢复了Cas9HNH区域840位置组氨酸的催化作用,可以剪切非编辑链上与编辑链上U互补的G碱基,对非编辑链的剪切使BE3的编辑效率比BE2高2~6倍[36]。
随着单碱基编辑技术的出现,日本科学家基于PmCDA1和dCas9或Cas9n以及鸟嘌呤糖苷化酶抑制子UGI的融合,也开发了PMCDATA-dCas9/Cas9nUGI的单碱基编辑器[37]。中国科学院上海营养与健康研究院常兴研究组开发了基于hAID的dCas9-AIDx单碱基编辑系统,用于耐药突变的筛选[38]。
2017年,DavidLiu实验室对BE技术做了多方面改进。首先针对常用的化脓性链球菌(Streptococcuspyogenes)的Cas9(SpCas9)蛋白靶向范围较窄,只识别含有NGG或NGA的PAM序列的靶位点的限制,他们使用金黄色葡萄球菌(StaphylococcusAureus)的Cas9(SaCas9)、SaCas9突变体(Sacas9-KKH)、SpCas9突变体(SpCas9-VQR、SpCas9-EQR、SpCas9-VRER)替代SpCas9,可以识别含有NGG、NGA、NGAN、NGAG、NGGG、NNGRRT和NNNRRT的PAM序列,从而显著提高了单碱基基因编辑的靶向范围。其次,他们通过突变胞嘧啶脱氨酶,降低酶的活性、改变底物的结合和构象,或者直接降低底物进入胞嘧啶脱氨酶活性区域的能力,缩小了单碱基编辑系统的活性窗口,从5个核苷酸窗口缩小至1~2个核苷酸活性窗口[39]。再次,DavidLiu实验室通过对BE3引入突变来减少脱靶效应,产生了高保真的碱基编辑器(high-fidelitybaseeditor,HF-BE3)[40]。随后,他们又报道了基于E.coliTadA(ecTadA)的新型单碱基编辑器——腺嘌呤碱基编辑器(adeninebaseeditors,ABEs),实现了A×T碱基对向G×C碱基对的转换。经过不断的改进,第7代的腺嘌呤碱基编辑器将靶向的A.T碱基转化为G×C碱基对可以达到约50%的效率(人类细胞),并且引入插入或缺失的频率低于0.1%[34]。
* 稍后学术顾问联系您