约98%-99%的人类基因组为非编码序列,可以通过多种机制调控靶基因的表达水平。以往研究表明,CRISPR/Cas9 mutagenesis和base editing文库筛选可以准确找出非编码区的调控元件和遗传变异。然而,由于Cas9识别有PAM基因序列(5’-NGG,约占基因组的1/16)的限制,因此基于CRISPR-Cas9的筛选仅能鉴定非编码区的部分调控元件和遗传变异。在前期工作中,研究团队与哈佛医学院的Benjamin P Kleinstiver教授合作,利用SpRY(Cas9变体,对几乎所有5’-NNN PAM都有编辑效率)在造血干细胞中模拟了与红细胞发育有关的遗传变异,并深入研究其靶基因调控红细胞发育的作用机制[1]。研究团队认为SpRY mutagenesis和base editing文库筛选可以高效精准地鉴定非编码区的调控元件和遗传变异。
近日,细胞生态海河实验室饶书权/姚瑶团队与中国科学院天津工业生物技术研究所薛超友团队合作在《Cell Genomics》(IF=11.1)和《Cell reports》期刊分别发表了题为“SpRY-mediated screens facilitate functional dissection of non-coding sequences at single-base resolution”(细胞生态海河实验室为第一完成单位)和“PAMless SpRY exhibits a preference for the seed region for efficient targeting”的研究论文。此外,中国科学院天津工业生物技术研究所薛超友团队、天津大学卢文玉团队和细胞生态海河实验室饶书权团队在《Nucleic Acids Research》(IF=16.6)期刊发布了题为“EcCas6e-based antisense crRNA for gene repressionRNA editing in microorganisms”的研究论文。
在《Cell Genomics》文章的工作中,研究团队通过将Spacer长度由20-nt截短为19-nt来增加SpRY的编辑效率,并针对RPS19基因的启动子区设计了mutagenesis和base editing筛选文库,结果显示SpRY mutagenesis筛选可以准确鉴定非编码区的调控元件,而SpRY base editing筛选可以鉴定非编码区的致病变异(与ClinVAR数据库中RPS19基因突变相比较)。该研究进一步探索了SpRY筛选是否可以鉴定GWAS locus的调控元件和致病变异,结果显示SpRY筛选可以准确鉴定非编码区调控元件和致病变异。目前,确定GWAS locus中的致病变异主要依赖于statistical fine mapping的策略,然而该方法的假阳性率很高,不利于后续的功能验证。该研究利用SpRY base editing筛选可以准确鉴定GWAS locus的致病变异,极大地促进了非编码区遗传变异功能基因组的研究[2]。该研究为理解SpRY的作用机制提供了关键线索,并初步揭示了SpRY mutagenesis和base editing文库筛选在非编码区功能基因组研究中的价值,为开发针对非编码区的基因和细胞治疗奠定了基础。
在《Cell Reports》文章的工作中,研究团队利用生物化学和单分子成像等技术手段揭示了SpRY在部分位点切割效率低的分子机制,并进一步发现SpRY会依赖protospacer种子区的前三个碱基(称之为non-classic PAMs)来辅助识别基因组上的靶点[3]。有趣的是,来自得克萨斯大学奥斯汀分校的David W. Taylor教授在《Nature Communications》期刊上发表了类似的工作。该研究阐明,尽管SpRY理论上可以识别5’-NNN PAMs,但是当考虑到种子区的非经典PAM时,SpRY仍然显示出一定的靶序列识别偏好性。
在《Nucleic Acids Research》文章的工作中,研究团队开发了基于EcCas6e的新型微生物RNA(crRNA)干扰和RNA编辑工具(crAIE)。EcCas6e-crRNA系统中工具蛋白小且crRNA阵列构建简单,基于该系统的基因干扰和RNA编辑工具在研究和生物技术中具有广泛的应用价值[4]。
在《Cell Genomics》文章中,细胞生态海河实验室饶书权教授、姚瑶副教授和中国科学院天津工业生物技术研究所薛超友研究员为共同通讯作者,团队成员姚瑶、周智伟、王晓玲和柳志睿为共同第一作者;在《Cell Reports》文章中,天津工业生物技术研究所薛超友研究员和细胞生态海河实验室饶书权教授为共同通讯作者,团队成员杨晨和周智伟为共同第一作者;在《Nucleic Acids Research》文章中,中国科学院天津工业生物技术研究所薛超友研究员、天津大学张传波副教授和细胞生态海河实验室饶书权教授为共同通讯作者,团队成员李穆桐、蔡朝辉和宋书成为共同第一作者。
原文链接:
《Cell Genomics》文章:https://www.cell.com/cell-genomics/fulltext/S2666-979X(24)00167-8
《Cell Reports》文章:https://www.cell.com/cell-reports/fulltext/S2211-1247(24)00553-9
《Nucleic Acids Research》文章:https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkae612/7712613?searchresult=1
参考文献:
1. Hu Y, Stilp AM, McHugh CP, Rao S, Jain D, Zheng X, Lane J, Mér ic de Bellefon S, Raffield LM, Chen MH, et al. Whole-genome sequencing association analysis of quantitative red blood cell phenotypes: The NHLBI TOPMed program. Am J Hum Genet. 2021 May 6;108(5):874-893. doi: 10.1016/j.ajhg.2021.04.003. Epub 2021 Apr 21. Erratum in: Am J Hum Genet. 2021 Jun 3;108(6):1165.
2. Yao Y, Zhou Z, Wang X, Liu Z, Zhai Y, Chi X, Du J, Luo L, Zhao Z, Wang X, Xue C, Rao S. SpRY-mediated screens facilitate functional dissection of non-coding sequences at single-base resolution. Cell Genom. 2024 Jul 10;4(7):100583.
3. Yang C, Zhou Z, Sun X, Ju H, Yue X, Rao S, Xue C. PAMless SpRY exhibits a preference for the seed region for efficient targeting. Cell Rep. 2024 May 28;43(5):114225.I
4. Li M, Cai Z, Song S, Yue X, Lu W, Rao S, Zhang C, Xue C. EcCas6e-based antisense crRNA for gene repressionRNA editing in microorganisms. Nucleic Acids Res. 2024 Jul 12:gkae612.
撰稿:饶书权
编辑:赵婉婉
校对:张婷婷
审核:祁健伟 郝 莎