繼上次QB期刊給大家推薦了WendyV. Gilbert教授的《關于pre-mRNA存在的修飾形式及其對剪接的影響》綜述后,小編看到讀者們的熱情度特別高。借此機會,再給大家推薦一篇來自德克薩斯大學西南醫學中心,QBRC、BICF中心主任謝陽教授實驗室在QB期刊上發表的最新關于分析MeRIP-Seq (methylated RNA immunoprecipitation sequencing)數據的新方法(A Bayesian hierarchical model for analyzing methylated RNA immunoprecipitation sequencing data)。
在《A Bayesian hierarchical model for analyzing methylated RNA immunoprecipitation sequencing data》這篇文章中,我們首次提出用一種貝葉斯統計模型,即貝葉斯層次模型BaySeqPeak,用于分析MeRIP-Seq數據,從而幫助研究人員發現轉錄組中的甲基化位點信號[1]。
RNA甲基化數據分析現狀
DNA與組蛋白的表觀遺傳修飾在調控基因表達上的重要影響已為科學界所廣泛熟知。同DNA一樣,作為生物遺傳信息傳遞中的重要一環,RNA分子也廣泛存在著化學修飾。目前,科學家已經鑒定確認了超過100種的RNA化學修飾方式,其中以m6A(N6-methyladenosine,6-甲基腺嘌呤,化學結構見圖1)最為常見[2]。
圖1 m6A甲基化修飾過程
m6A甲基化修飾是一種由多種蛋白參與的動態可逆的修飾方式。它的生成主要是由甲基轉移酶復合體介導,其中包含METTL3,METTL14和WTAP;而擦除甲基化修飾基團的過程則由去甲基化酶FTO和ALKBH5負責。此外,多種蛋白,如YTHDF1和YTHDF3都可識別m6A信號位點,并通過結合下游效應蛋白的方式傳遞甲基化信號。目前已經發現,m6A在調控基因表達、剪接、RNA 編輯、RNA 穩定性和控制mRNA壽命和降解等多方面都存在重要的影響[3]。
雖然RNA甲基化在上世紀七十年代就已經被發現證實,但長期以來由于技術局限,相關的修飾機理、調控手段以及生物學意義一直未能闡明。現在,MeRIP-Seq (methylated RNA immunoprecipitation sequencing)技術的出現[4,5](圖2),使得通過高通量手段在全轉錄組(transcriptome)水平上研究m6A甲基化修飾變為可能。
圖2 MeRIP-Seq技術流程圖
通行的分析MeRIP-Seq數據的思路是,利用一個特定長度的(通常為100~200nt長)窗口從前至后掃描整條染色體,并記錄每個樣本落入每個窗口中的RNA短序列數目(read count)。通常,實驗條件下(IP)樣本的RNA短序列應大致分布在甲基化位點附近,而對照條件下(INPUT)則和正常的每個基因的表達值正相關(沒有甲基化影響)。這一數據特點使得傳統分析DNA甲基化的工具無法很好地勝任RNA甲基化數據的分析。總而言之,轉化為統計語言就是,我們需要尋找那些在實驗條件下序列數目顯著高于對照條件下序列數目的窗口(甲基化位點),并相應地給予顯著性統計值(p值或假陽性概率)。
BaySeqPeak模型分析RNA甲基化數據的優勢
我們建立的BaySeqPeak模型則主要從MeRIP-Seq數據的重復樣本數少,樣本數據空間上前后相關,以及存在大量零數據的特點出發,利用以下三種不同的策略解決了這些難題:
1)采用零膨脹的負二項分布擬合單樣本的序列計數,以防止大量零數據和過度離散破壞模型穩定性;
2)采用隱馬爾可夫模型模擬單樣本空間上的前后相關性;
3)利用貝葉斯統計的思路,使得模型在低樣本數的條件下依然維持足夠的準確度。
在模擬數據中,BaySeqPeak能很好地預測了實驗人員預先設定的甲基化位點,而比較的exomePeak和MeTPeak模型則匯報了較多的假陽性和假陰性位點(圖3)。
圖3 模擬數據中真實的甲基化位點與各模型預測的甲基化位點(紅色)
通過ROC曲線可以發現,不同參數下的模擬數據中,BaySeqPeak模型的預測準確性均顯著高于exomePeak和MetPeak模型(圖4)。
圖4 不同參數條件下,各模型預測的ROC曲線
在數值收斂方面,模型在經過多次迭代之后,預測值已穩定地收斂到了真實值附近(圖5)。
圖5 甲基化位點的預測數的收斂過程
在真實數據中,BaySeqPeak模型也很好地預測了甲基化的區段。不僅如此,相較于exomePeak,BaySeqPeak還詳細區分出了一個甲基化區域中臨近的幾個甲基化峰位,顯示了模型的高精度與高分辨率。
圖6 一個真實數據中預測的甲基化區域
RNA甲基化的研究目前仍然處于起步階段,修飾調控過程的具體細節,以及這些修飾如何具體地影響細胞的功能,特別是在疾病條件下,這些化學修飾是如何發生變化的仍然存在大量未知。本文提出的統計方法為有效準確地分析m6A甲基化數據提供了可能,我們期待在未來RNA甲基化的研究中能夠在此模型基礎上再推進一步。
參考文獻
Zhang, M., Li, Q., & Xie,Y. (2018). A Bayesian hierarchical model for analyzing methylated RNA immunoprecipitationsequencing data. Quantitative Biology, 6(3), 275-286.
Machnicka, M. A., Milanowska,K., Oglou, O., Purta, E., Kurkowska, M., Olchowik, A., Januszewski, W.,Kalinowski, S., Dunin-Horkawicz, S., Rother, K. M., et al. (2013) MODOMICS: adatabase of RNA modification pathways–2013 update. Nucleic Acids Res., 41,D262–D267
Meyer, K. D., and Jaffrey, S.R. (2014) The dynamic epitranscriptome: N 6-methyladenosine and gene expressioncontrol. Nat. Rev. Mol. Cell Bio., 15, 313–326
Dominissini, D.,Moshitch-Moshkovitz, S., Schwartz, S., Salmon-Divon, M., Ungar, L., Osenberg,S., Cesarkas, K., Jacob-Hirsch, J., Amariglio, N., Kupiec, M., et al. (2012)Topology of the human and mouse m6A RNA methylomes revealed by m6A-seq. Nature485, 201–206.
Meyer, K. D., Saletore, Y.,Zumbo, P., Elemento, O., Mason, C. E. and Jaffrey, S. R. (2012) Comprehensiveanalysis of mRNA methylation reveals enrichment in 3′ UTRs and near stopcodons. 1517 Cell, 149, 1635–1646.
近日,中國農業科學院深圳農業基因組研究所(嶺南現代農業科學與技術廣東省實驗室深圳分中心)和佛山鯤鵬現代農業研究院研究員唐中林團隊在國際期刊《腸道微生物》(GutMicrobes)上發表論文。該研究揭示......
據27日《自然》雜志報道,英國倫敦大學學院(UCL)化學家通過模擬早期地球的條件,首次實現了RNA與氨基酸的化學連接。這一難題自20世紀70年代以來一直困擾著科學家,如今,這一突破性成果為解答生命起源......
美國芝加哥大學團隊開發了一種更為靈敏的液體活檢技術,該方法利用RNA而不是傳統的DNA來檢測癌癥。這一創新方法在使用患者血液樣本進行測試時,識別出早期結直腸癌的準確率達到95%,顯著優于現有的非侵入性......
由新加坡科技研究局基因組研究所領導的科學家團隊,發布了迄今全球最大、最全面的長讀長RNA測序數據集之一——新加坡納米孔表達數據集(SG-NEx)。這一成果有望解決疾病研究中長期存在的技術瓶頸,使研究人......
4月15日,中國工程院院士、中國科學院亞熱帶農業生態研究所首席研究員印遇龍領銜的單胃動物營養研究團隊在科技合作和成果轉化上取得新進展。其團隊博士生王芳以“RNA技術研發與產業化應用”為主的項目,歷經初......
近日,中山大學生命科學學院教授張銳團隊首次提出名為MIRROR的全新內源性ADAR招募gRNA設計理念,顯著提高了RNA編輯效率,這一突破為RNA編輯技術走向臨床應用注入了強勁動力,同時也為相關疾病的......
中國科學院分子細胞科學卓越創新中心陳玲玲研究組揭示了雙鏈RNA依賴的蛋白激酶R(PKR)在阿爾茨海默病(AD)發生與進展過程中異常激活的分子病理特征,開發了基于具有分子內短雙鏈結構環形RNA(ds-c......
在癌癥治療領域,化療藥物耐藥性問題一直是阻礙治療效果提升的關鍵瓶頸。癌細胞擁有多種復雜的機制,能夠巧妙地逃避化療藥物的“攻擊”,其中,高活性的抗氧化系統可以有效減輕藥物誘導的活性氧(ROS)損傷,成為......
比利時布魯塞爾自由大學主導的一項研究揭示,DNA和RNA的表觀遺傳學協同調控比過去想象的更加緊密。這項發表在最新一期《細胞》雜志上的研究,結合了DNA和RNA研究結果,指出這兩種調控方式共同作用,形成......
近日,廣州醫科大學-中國科學院廣州生物醫藥與健康研究院聯合生命科學學院特聘教授、廣州實驗室研究員苗智超團隊與合作者,對來自全球18個團隊的預測進行了大規模評估,涉及23個RNA結構,包括RNA元件、適......