NEWS
新聞資訊
|
ChIP/ATAC/CUT/DAP必看——*Peak到底怎么來的在分子生物學研究中,識別和分析基因組范圍內的調控元素是理解基因表達調控機制的關鍵。隨著高通量測序技術的不斷進步,諸如ChIP-seq、ATAC-seq、CUT&Tag和DAP-seq等技術為我們提供了強大的工具,以揭示轉錄因子結合位點、開放染色質區域和DNA結合蛋白的相互作用等信息。在這些實驗數據中,我們常常接觸到“peak/差異Peak”的概念。從分析邏輯上來說Peak究竟是如何產生的?本文將探討這些問題背后的分析邏輯,主要圍繞以下四個問題幫助大家更好地理解這些高通量數據的分析結果。
Q1: merge peak 和合并組peak是什么,計算邏輯以及差異是什么? A1: 首先我們來解釋下什么是peak,peak(峰)是指在基因組中發現的特定區域,這些區域顯示出顯著的信號強度,通常與轉錄因子結合或其他蛋白質-DNA相互作用相關。表觀組學的研究一般會同組設計2~3個重復,MACS2軟件(圖1)進行call peak時,會基于reads進行建模以及均一化(方便IN和IP之間具有可比性),隨后利用泊松分布計算顯著性p值后,利用預先設置的顯著性閾值輸出peak結果文件(圖1)。除了單樣本IP VS IN的call peak,當組內有生物學重復時,MACS也能整合組內重復數據輸出“以組為單位的peak結果”(圖2)。除了MACS自身分析的“組peak”外,我們還會人為對組內生物學重復peak進行merge peak分析,得到以第二種方式分析的“組的peak”,分析邏輯如圖3。
圖 1 MACS2分析流程
圖 2 “合并組peak”的分析邏輯
圖 3 merge peak示意圖 Q2: diff peak計算邏輯? A2:差異peak就是要涉及到組間比較了,通常使用的分析軟件是DiffBind分析包。該軟件會對兩個不同組樣品進行差異分析,計算peaks重復間隔的測序reads數,并基于結合親和力鑒定具有統計顯著性的差異結合位點,確定樣品間上調或下調差異修飾的區間。分析思路采用了RNA-seq中差異基因表達的方式來進行peak的差異分析,和macs2的差異功能(bdgdiff)不同,DiffBind需要依賴已有的peak calling結果,將peak區域當做RNA-seq中的基因區域,然后對這些區域進行定量和差異分析,其核心的差異分析通過調用RNA-seq中常用的R包來實現。通常默認的模型是DESeq2。這就意味著如果要用DiffBind進行差異分析的話,必須要有重復樣本,否則行不通。 除了直接使用DiffBind軟件計算組間差異,還可以順著merge peak的位置信息,通過取交集的方式分析兩組樣本間的差異。 Q3: diff peak的結果文件怎么看?Up / down代表什么? A3: Diff_anotation注釋表格(圖4)是整個差異組比較中最核心的部分:“Treat_vs_CK.merge_peak_down.peak_annotation”是利用組內重復merge取交集后的peak再按照peak位置關系做組間比較,得到Treat與CK相比較只在CK中有富集的峰;“Treat_vs_CK.merge_peak_up.peak_annotation”是利用組內重復merge取交集后的peak再按照peak位置關系做組間比較,得到Treat與CK相比較只在Treat中有富集的峰; 以上merge之間peak的比較只有有無的區別,沒有顯著性的統計學計算。 “Treat_vs_CK.down.peak_annotation”是利用DiffBind軟件(默認是內置DESeq2邏輯)分析組間peak差異,與merge_peak分析不同,該軟件包會進行統計學顯著性的計算,并對富集倍率有一定要求,默認閾值為FDR值小于0.05,并且Fold(log2FC)小于0。分析結果包含Fold、p.value、FDR、關聯靶基因等,如圖5。down是指Treat與CK相比較,在Treat中富集倍率降低的peak區域。 “Treat_vs_CK.up.peak_annotation”同樣也是利用DiffBind軟件分析的,是指Treat與CK相比較,在Treat中富集倍率升高的peak區域。 “Treat_vs_CK.mid”是樣本間所有差異的Peak的文件,老師們可以利用這個文件結果,自主利用閾值篩選;“Treat_vs_CK.nofilt”同樣也是樣本間所有差異的Peak的文件,只不過包含了注釋信息。 兩種比較方案有不同的側重點,merge diff側重于分析A組相對于B組的“特有peak”,而diffbind則傾向于分析兩組間固定區域的結合強度差異(FOLD)。因此,兩個差異方案結合,能從不同角度探究組間差異,老師可自行按照自身關注點來選擇以哪種結果進行后續研究。
圖 4 Diff_anotation文件
圖 5 軟件分析表格結果 Q4: 無重復單樣本組間比較和多重復樣本組間比較的邏輯差異 A4: 對于多重復樣本差異分析可以參考上述A3中的DiffBind軟件包或者先取組內交集merge再做組間比較;而對于單樣本的組間比較就沒有那么多選擇了,只能通過peak位置判斷差異,取兩組間非交集的peak區域。 上述所有的分析內容,在愛基的ChIP-seq、ATAC-seq、CUT&Tag和DAP-seq項目中都可以分析哦,依據分析出來的peak愛基還可以提供指定的基因/peak的reads富集峰圖,歡迎各位有相關需求的老師前來咨詢~
項目咨詢 愛基百客王牌產品 ChIP-seq技術將染色質免疫共沉淀和二代測序技術結合,是研究體內蛋白質與DNA相互作用的有力工具,可用于組蛋白修飾、RNA聚合酶、轉錄因子和輔因子以及G4鏈體(G4)等方面的研究,技術成熟穩定。愛基百客ChIP-seq可提供: ChIP-seq測序分析 Peak分析:Peak注釋和分布分析,Peak關聯基因的GO、KEGG的注釋和富集分析,轉錄因子和Motif分析等。 多樣本差異分析:差異Peak分布情況統計,差異Peak關聯基因GO、KEGG功能注釋與富集,轉錄因子預測,Motif預測等。 后續驗證 · ChIP-qPCR 分析組蛋白修飾/轉錄因子與染色質區域的結合情況,揭示染色質狀態和基因表達調控之間的關系,真實反映結合特性。 · EMSA 基于DNA-蛋白質復合體在聚丙烯酰胺凝膠電泳(PAGE)中的遷移率不同,檢測活化的與DNA結合的蛋白轉錄或調節因子。 · 雙熒光素酶報告實驗 檢測轉錄因子與靶啟動子的特異結合。 ChIP-seq+轉錄組關聯分析 ChIP-seq和轉錄組關聯分析可以做以下2個方面的研究 · DNA結合蛋白和基因表達調控: 通過ChIP-seq技術可以確定DNA結合蛋白(如轉錄因子)的結合位點,然后與轉錄組數據結合分析,可以獲得轉錄因子直接調控的靶基因,為全面理解轉錄因子調控功能提供依據。 · 組蛋白修飾和基因表達: ChIP-seq可以用于鑒定組蛋白修飾的位點,結合轉錄組數據可以了解這些修飾對基因表達的影響。 愛基百客ChIP-seq三大優勢 · 優勢一: 項目經驗豐富,研究物種200+種,累計實驗2000余次。全面覆蓋醫口和農口等不同樣本,不懼特殊樣本(如脂肪組織、高淀粉組織和真菌類),抗體經驗也極其豐富(多種組蛋白修飾、轉錄因子、標簽抗體以及p300和RNApol II等均有涉及); · 優勢二: 提供前期實驗設計、測序、分析以及后期驗證(ChIP-qPCR、EMSA)一站式服務; · 優勢三: 項目文章多次發表于Science、Cancer Cell、Nature Plants、Nature Metabolism以及Plant Cell等期刊。
Zhang, Y., Liu, T., Meyer, C. A., Eeckhoute, J., Johnson, D. S., Bernstein, B. E., Nusbaum, C., Myers, R. M., Brown, M., Li, W., & Liu, X. S. (2008). Model-based analysis of ChIP-Seq (MACS). Genome biology, 9(9), R137. https://doi.org/10.1186/gb-2008-9-9-r137 Stark, R., & Brown, G. (2011). DiffBind: differential binding analysis of ChIP-Seq peak data. R package version, 100, 4-3
了 解 更 多 { 往 期 精 彩 回 顧 } 精選合集,歡迎收藏喲!
|








