遺傳病相關資料庫和軟體(四):GTEx人類組織表達資料庫

遺傳病相關資料庫和軟體(四):GTEx人類組織表達資料庫

4 人贊了文章

在確證一個新的致病基因時,常常會想到看這個基因是否有組織特異性表達,這時GTEx資料庫可以幫得上忙。GTEx(the Genotype-Tissue Expression project)稱為「基因型-組織表達計劃」,由國立衛生研究院(NIH)「共同基金」(Common Fund)支持,通過建立一個組織基因型和表達資料庫,以研究遺傳變異與基因表達之間的關係。GTEx數據由約650名已故成年者的全基因組序列和RNA序列組成,每個捐獻者均收集多個組織樣本(例如肺,腦,胰腺,皮膚等)。

---------------------------------------------

GTEx portal

GTEx資料庫的官方入口在這裡:gtexportal.org/home/

然而,為啥這個網站點什麼都沒有反應?等哪天正常了我再來更新一下這個部分。

---------------------------------------------

UCSC的GTEx入口

想查某個基因的表達,官網又查不了怎麼辦?UCSC是提供了GTEx的查詢入口的。網址在這裡:UCSC的GTEx入口

頁面長這個樣子,請忽略這個模特的姿勢和性別問題。。

可以從上方看出,目前樣本為570個donors,涉及53個器官。左上角可以選GTEx這個track(它是UCSC的track之一)顯示哪些基因,RPKM至少為多少才會顯示出來等等。點右上角的GO回到UCSC Genome Browser。輸入一個不育相關基因SPO11看一下。搜索框敲完基因後等一下,下方會出現一個默認轉錄本,選擇它。然後點擊GTEx那個track看看詳情。

可以看到SPO11在testis(睾丸)中有特異性的表達。假設在尋找致病基因的過程中,研究者不清楚SPO11這個候選基因是否與不育相關,看到這個結果應該心裡會有底得多。

---------------------------------------------

GTEx數據的用途

截止到2017年,使用GTEx數據資源已發布了超過650篇論文。這裡是nature雜誌的collection,這一個頁面專門介紹了GTEx項目發表的文章。

第一篇題目為「Genetic effects on gene expression across human tissues」,它回答的是遺傳變異如何影響組織內的基因表達。大部分可以導致轉錄水平發生變化的變異是順式eQTL,多位於基因的啟動子、增強子等位置;少部分是反式eQTL,多位於離基因較遠的染色體區域。除了蛋白功能、剪切造成的疾病以外,大多數疾病與基因表達息息相關,搞清楚遺傳突變和基因表達的關係,對於提高臨床診斷率十分重要。

第二篇「The impact of rare variation on gene expression across tissues」講了罕見變異對表達的影響。研究發現,58%的表達異常和28%的過表達異常,基因附近都有位於保守區域的罕見變異。這為基因組和轉錄組聯合進行致病基因定位提供了思路,文章還提供了一個叫做RIVER的R包工具,RIVER。

第三篇「Landscape of X chromosome inactivation across human tissues」討論了基因轉錄和X染色體失活(XCI)。正常情況下,女性兩條XX染色體會被沉默掉一條,然而有時會出現XCI逃逸的情況,至少影響23%的X染色體基因,可能會導致多種表型。

第四篇為「Dynamic landscape and regulation of RNA editing in mammals」,討論了腺苷 - 肌苷(A-to-I)RNA編輯機制。這種機制是ADAR酶介導的轉錄後調控機制,對GTEx數據的解析進一步闡述了這種RNA編輯如何、何時發生,還揭示了潛在的調控途徑,如AIMP2可能通過增強ADAR蛋白的降解來減少肌肉中的RNA編輯。

第五篇「The impact of structural variation on human gene expression」則討論了來自13個組織中23602個高可信度的結構變異(SVs)和24884個順式eQTL的關係。文章估計,SV可解釋3.5-6.8%的eQTLs,並且識別了可直接改變基因表達的789個SV,其中大多數是位於非編碼區的調控元件。

---------------------------------------------

GTEx就介紹到這裡,作者期待以後可以將轉錄組、甲基化等其他組學技術應用於臨床診斷;或者有更多GTEx類似的計劃,解釋更多能對錶型產生影響的遺傳變異,以提高診斷效率。


推薦閱讀:

【工具】TCGAbiolinks分析TCGA數據(DEA篇)
生物信息學軟體安裝2:使用Bioconda管理生信軟體
從biomart上下載兩個物種的orthologs數據集
生物信息學100個基礎問題 —— 第8題 讀懂FastQC報告 Part III
測序之前篇: NGS測序中,接頭是如何添加上的,以及如何去接頭

TAG:遺傳病 | 二代測序 | 生物信息學 |