Nature Biotech:新工具可預(yù)測基因編輯的成功率
自2012年CRISPR-Cas9技術(shù)問世以來,基因編輯便駛?cè)肓丝燔嚨?,取得了一系列新突破。如果將CRISPR-Cas9比作能夠破壞目標(biāo)基因的分子剪刀,那么base editor(堿基編輯器)可以稱為分子鉛筆,因其能對單個(gè)核苷酸進(jìn)行替換。2019年開發(fā)的prime editor則具有更強(qiáng)大的功能,能夠?qū)蚪M進(jìn)行搜索和替換,堪稱分子世界的“文字處理器”。
開發(fā)這些技術(shù)的終目標(biāo)是修復(fù)人類基因中的有害突變。16,000多個(gè)小的缺失變異與人類疾病存在因果關(guān)系,理論上可以通過插入缺失的序列來修復(fù)。囊性纖維化就是一個(gè)很好的例子,70%的病例由三核苷酸缺失而引起。
為了實(shí)現(xiàn)臨床應(yīng)用,人們需要一種技術(shù)來準(zhǔn)確、高效且安全地插入序列,避免出現(xiàn)意外的結(jié)果。prime editing系統(tǒng)雖然在治療囊性纖維化等遺傳病上表現(xiàn)出巨大潛力,但目前仍不清楚哪些因素決定了編輯效率。
英國Wellcome Sanger研究院和愛沙尼亞塔爾圖大學(xué)的研究人員近日在Nature Biotechnology雜志上發(fā)文稱,他們開發(fā)出一種新工具,可預(yù)測將基因編輯的DNA序列成功插入基因組的幾率。
影響插入效率的多個(gè)因素
在這項(xiàng)研究中,研究人員試圖系統(tǒng)評估插入序列的長度和組成、細(xì)胞系、目標(biāo)位點(diǎn)以及prime editor的不同版本如何影響插入效率。
為此,他們共設(shè)計(jì)了3,604條pegRNA,編碼切口位點(diǎn)上游的插入物,這些插入物的長度從1nt到69nt不等,且GC含量不同。他們將序列插入兩個(gè)細(xì)胞系(HEK293T和HAP1細(xì)胞)中,靶向四個(gè)目標(biāo)位點(diǎn)(HEK3、EMX1、FANCF和CLYBL)。一周后,他們對這些細(xì)胞進(jìn)行基因組測序,觀察編輯是否成功。評估插入效率的整體策略詳見圖1。
由于插入率的變化跨越了三個(gè)數(shù)量級,于是研究人員試圖了解相關(guān)的特征,首先是插入物的長度。他們在HEK293T細(xì)胞中發(fā)現(xiàn)了兩個(gè)特點(diǎn):3和4nt序列的插入率高于其他序列;15-21nt序列的插入率高于周圍的序列。不過在HAP1細(xì)胞中,1-4 nt短序列的插入率并沒有高于較長序列。他們將其歸因于錯配修復(fù)(MMR)系統(tǒng),因?yàn)镠EK293T細(xì)胞在MMR上存在部分缺陷。敲除錯配修復(fù)基因MLH1的HAP1細(xì)胞也證明了這一點(diǎn),表明MMR系統(tǒng)阻礙了短序列的插入。
之后,他們分析了prime editing的不同步驟如何影響序列的插入率。他們發(fā)現(xiàn),若pegRNA中帶有四個(gè)或更多的連續(xù)腺嘌呤,則插入率會大大下降。此外,prime editing中的另一個(gè)重要步驟是帶有5’ flap(包含野生型序列)和3’ flap(包含插入物)的中間產(chǎn)物之間達(dá)到平衡,而5’ flap核酸酶FEN1及3’ flap核酸酶TREX1和TREX2介導(dǎo)了這種平衡。他們發(fā)現(xiàn),3’ flap核酸酶TREX1和TREX2抑制了較長序列的插入。
同時(shí),插入序列的核苷酸組成和二級結(jié)構(gòu)也會影響插入率。研究人員發(fā)現(xiàn),prime editing系統(tǒng)對胞嘧啶有著明顯的偏好。插入序列中每增加1%的胞嘧啶,則插入率平均增加2.2%。相反,腺嘌呤和胸腺嘧啶的百分比則降低了各個(gè)位點(diǎn)的插入率。此外,他們還發(fā)現(xiàn),結(jié)構(gòu)強(qiáng)度更高的序列能夠被更有效地插入。
在此過程中,他們使用了Twist Bioscience提供的寡核苷酸池。據(jù)Twist介紹,他們獨(dú)特的硅基DNA合成平臺能夠在單次運(yùn)行中生成超過一百萬條寡核苷酸,對數(shù)量幾乎沒有限制,而且寡核苷酸池精準(zhǔn)均一,讓人們對實(shí)驗(yàn)結(jié)果充滿信心。此外,實(shí)驗(yàn)中使用的多個(gè)載體和基因片段也是由Twist Bioscience提供的。
預(yù)測不同序列的插入率
在了解影響插入率的多個(gè)因素后,研究人員接下來想預(yù)測不同序列在同一位點(diǎn)的插入效率。他們采用了機(jī)器學(xué)習(xí)的方法,挑選出10個(gè)特征來訓(xùn)練數(shù)據(jù),包括插入序列的長度、組成、pegRNA二級結(jié)構(gòu)和MMR等。這種稱為MinsePIE的方法能夠很好地預(yù)測測試數(shù)據(jù)的插入效率,相關(guān)性達(dá)到0.68(圖2)。
在現(xiàn)有數(shù)據(jù)上進(jìn)行訓(xùn)練后,他們在新數(shù)據(jù)上測試MinsePIE模型,發(fā)現(xiàn)它能夠準(zhǔn)確預(yù)測多個(gè)插入序列的成功率。之后,他們還對預(yù)測的序列進(jìn)行實(shí)驗(yàn)測試。與預(yù)測插入率較低的變體相比,預(yù)測插入率較高的密碼子變體確實(shí)表現(xiàn)出較高的插入率,這凸顯了MinsePIE模型在密碼子優(yōu)化方面的優(yōu)勢。研究人員認(rèn)為,這種計(jì)算模型可以幫助人們選擇出有效的序列寫入基因組中。
對于如何提高prime editing系統(tǒng)的插入效率,研究人員提出了幾點(diǎn)建議。他們建議選擇胞嘧啶含量高且容易形成二級結(jié)構(gòu)的序列。對于使用U6啟動子的pegRNA,盡量避免腺嘌呤的插入。對于小于14nt的序列,暫時(shí)抑制MMR或敲除MLH1將極大提高插入效率??偟膩碚f,這項(xiàng)工作增加了人們對短序列插入效率的理解,有望實(shí)現(xiàn)復(fù)雜的基因組工程和糾正各種致病突變。
聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息,如作者信息標(biāo)記有誤,或侵犯您的版權(quán),請聯(lián)系我們,我們將在及時(shí)修改或刪除內(nèi)容,聯(lián)系郵箱:marketing@360worldcare.com