
圖片來源:https://www.nature.com/articles/d41586-020-00308-w
2001年,人類基因組計劃完成,整個計劃花費約30億美元,1985年提出,1990年正式啟動,歷經十余年。腫瘤是最熱門的研究領域之一,該領域的研究者們一直希望可以借助測序手段去表征腫瘤的基因組,從而一窺腫瘤的秘密。在隨后的20年中,各種測序技術的發展以及測序成本的降低使得實現上述目標變的可能。
2006年,美國國家癌癥研究所和國家人類基因組研究所開啟了癌癥基因組圖譜計劃(
The Cancer Genome Atlas Program),簡稱TCGA。該計劃涵蓋了33種癌癥類型,包括超過2萬個癌癥及正常組織的分子特征。經過12年的發展,TCGA產生了超過2.5PB的海量數據,包括基因組、表觀組、轉錄組和蛋白質組。

隨著TCGA的發展以及各種關于癌癥研究的深入,大家越來越認識到詳細記錄癌癥的每一個突變是可行的。于是在2008年,全球癌癥基因組協會(global cancer genomics community)建立了International Cancer Genome Consortium(國際癌癥基因組聯盟,ICGC),ICGC的目標是系統性記錄各種常見癌癥中的突變(ICGC成立初期計劃投資10億美元,用10年時間詳盡、深入研究可導致癌癥的變異基因,集世界各國和地區的科學家之力,繪制完整的人類癌癥基因圖譜,是一項與人類基因組計劃具有同等重要意義的研究計劃——引自http://www.cncbd.org.cn/News/Detail/1261)。在人員上,ICGC與TCGA有著一定的重疊。每一個ICGC小項目瞄準一個癌癥或者相似的一類癌癥。
TCGA與ICGC的早期研究揭示,在不同腫瘤中,突變似乎存在有一定的共性和差異,比如不同腫瘤中都有同一個突變,有些突變只在特定的一個或幾個腫瘤中存在,這些發現揭示了腫瘤背后是復雜的,再加上不同的小組在處理各自的項目中存在有各種各樣的技術障礙甚至有些標準參差不齊,因此為達到泛癌分析以及實現標準化,Pan-Cancer Analysis of Whole Genomes(PCAWG) Consortium應運而生。
PCAWG聯盟由4大洲744個機構的科研人員所組成,分為16個小組,每個小組專注于腫瘤基因的不同方面。該聯盟需要克服整個項目所面臨的技術、倫理、道德、法律等方面的障礙;在工作內容上,主要整合分析38種腫瘤類型,獲得了2658個腫瘤全基因組。這一工作涉及到海量的數據處理,需要多種算法相的結合以及多數據中心的聯合。當然,這一項目也證明了國際之間在云計算方面合作的可能性。
2020年2月4日,全基因組泛癌分析(PCAWG)聯盟在Nature雜志上連發6篇文章,提出了目前為止最為全面的癌癥基因組分析。與以往關注于蛋白編碼區不同,這次是分析癌癥全基因組。

Nature雜志對6篇系列工作給予高度重視,發表了相關社論
該項目最后以6篇Nature文章呈現出來,涵蓋腫瘤驅動突變、非編碼區域、突變特征、結構變異、腫瘤進化和RNA改變共計六個方面。下面將簡單概括這六篇文章,同時在后續報道中我們會進一步詳細介紹這些內容。
一、驅動突變
第一篇文章來自于The ICGC/TCGA Pan-Cancer Analysis of Whole Genomes Consortium,標題為Pan-cancer analysis of whole genomes。該文章從整體上描述了38種腫瘤類型2658個腫瘤全基因組,展示了PCAWG項目相關數據的廣度與深度。據分析,平均每一個癌癥基因組攜帶有4-5個驅動突變,然而大約5%沒有發現,從另一方面講有可能目前對于驅動突變的了解或者發現并不完全;另外許多腫瘤中表現出chromoplexy (17.8%)和 chromothripsis (22.3%),而這會導致基因組結構的改變。
二、非編碼區域改變
第二篇文章來自于PCAWG Consortium和Joachim Weischenfeldt, Rameen Beroukhim, I?igo Martincorena, Jakob Skou Pedersen, Gad Getz,題目為Analyses of non-coding somatic drivers in 2,658 cancer whole genomes。該文章分析了2658個腫瘤基因組中非編碼區域的驅動突變和結構變異。鑒于非編碼區域的復雜性,研究人員開發了不同的算法系統性鑒別上述變異,確定了以往報道的驅動突變,也懷疑了以往部分突變,并發現了一些新的驅動突變。比如TP53基因非編碼區的一個復發突變,TRET非編碼區的一個突變與該酶過表達有關等。雖然這些非編碼區的突變頻率不如編碼區,但是這些突變也至關重要。
三、突變特征
第三篇文章來自于PCAWG Consortium和Steven G. Rozen, Michael R. Stratton,題目為The repertoire of mutational signatures in human cancer。體細胞突變可由多種原因造成,包括外源因素和內源因素。那么這些突變特征是什么呢?研究者從4645個全基因組測序和19184個外顯子測序獲得的84,729,690個體細胞突變中分析得到了81個突變特征:49個單堿基替換特征、11個雙堿基替換特征、4個群堿基替換特征和17小插入/缺失特征。這些突變特征既有以往報道的,也有這次新發現的。通過對這些突變特征的深入分析,挖掘出了不同突變特征與不同分子事件的關系,盡管許多突變特征沒有明顯誘因,但是這一系統性分析有利于我們了解腫瘤的發育與進化。
四、結構變異
第四篇文章來自于PCAWG Consortium和Joachim Weischenfeldt, Rameen Beroukhim, Peter J. Campbell,題目為Patterns of somatic structural variation in human cancer genomes。上一篇文章關注了以somatic mutation為內容的突變特征,在這篇文章中,研究者們關注了結構變異,發現了16個結構變異特征,比如缺失大小差異,在不同腫瘤中也有不同,在晚期復制區域富集;串聯復制也有大小差異,在早期復制區域富集。
五、腫瘤進化
第五篇文章來自于PCAWG Consortium和Peter Van Loo, Moritz Gerstung, 題目為The evolutionary history of 2,658 cancers。在該項研究中,研究人員利用數據庫中的全基因組測序數據,重建了突變進程和驅動突變的進化歷史,發現早期腫瘤發生與少數驅動突變和拷貝數變異有關,但在隨后腫瘤的發展過程中,突變圖譜的變化則很大,在晚期階段驅動基因突變的多樣性可以達到4倍以上,同時基因組的不穩定性也增加。這一研究有助于了解腫瘤進化和幫助腫瘤早期診斷。
六、RNA改變
第六篇文章來自于PCAWG Consortium和Alvis Brazma, Angela N. Brooks,Gunnar R?tsch, 題目為Genomic basis for RNA alterations in cancer。RNA改變包括:過表達、異常剪接、RNA融合等。通過結合全基因組數據和轉錄組數據,研究人員發現了649個影響基因表達的單核苷酸突變,1900個與突變相關的異常剪接,82%的基因融合與結構變異有關。這些轉錄改變在不同腫瘤類型中有不同的特征,同時這些數據與基因組數據結合可以更好地讓我們了解癌癥中基因的功能。
觀點與評論
在同期,密歇根大學的Marcin Cieslik與Arul M. Chinnaiyan發表了評論文章Global cancer genomics project comes to fruition對這一項目進行了簡單的描述與總結。
這六篇文章與相關的文章是癌癥研究和云計算的一個里程碑。這些研究無疑擴展了我們對癌癥測序數據的理解,豐富了我們對癌癥發生發展的認識,但是需要注意的是,這些研究也有一定的不確定性。另外,這些研究的一個局限是:缺少臨床信息的支撐,比如治療方法、臨床收益等。在另外一個項目——International Cancer Genome Consortium–Accelerate Research in Genomic Oncology (ICGC–ARGO)中,則以超過10萬個腫瘤患者為對象,加入了上述臨床信息。我們也期待著這一項目能夠更加豐富我們對于癌癥的認識。
癌癥的基因組結構研究發表《NatureGenetics》B細胞通過一系列精心控制的染色體重排和“良好”突變產生抗體,這些突變使細胞能夠產生大量不同的抗體。“盡管變化對產生大量多樣的抗體至關重要,但仍有......
英國韋爾科姆基金會桑格研究所5日宣布,一個國際團隊完成了迄今覆蓋面最廣泛的癌癥全基因組分析,這有助于加深研究人員對癌癥的認識,為開發出更高效的治療方案鋪平道路。這個被稱為“泛癌癥計劃”的項目由來自37......
圖片來源:https://www.nature.com/articles/d41586-020-00308-w2001年,人類基因組計劃完成,整個計劃花費約30億美元,1985年提出,1990年正式啟......
近日,一項刊登在國際雜志Nature上的研究報告中,來自加拿大安大略省癌癥研究所的科學家們通過研究在人類癌癥基因組中的大量非編碼區域(也被稱之為人類癌癥DNA的“暗物質”)中發現了一種新型的致癌突變;......
Science一篇文章描述了DNA單鏈如何以所謂的"發夾"結構折疊起來,對許多癌癥中表達的基因編輯酶的突變高度敏感。但是,這些突變"熱點"中的許多發生在與癌癥完......
超過20個研究機構的63位研究人員公布了一項包括30,000多人血液樣本的大規模研究成果,通過這項分析,研究人員確定了13種膠質瘤新遺傳危險因素,這揭示了增加膠質瘤易感性的個體DNA的特殊差異,同時也......
Science雜志發表的一項大規模癌癥基因組研究揭示了與吸煙有關的突變標簽。研究人員首次證實,吸煙會使直接和間接接觸煙草煙霧的組織發生體細胞突變,由此提高多種癌癥的風險。過去有研究顯示,吸煙會提高17......
如果有一種軟件能告訴你今后患上癌癥的可能性是多少,而其中判斷的因素之一就是你的性別是男還是女,你會相信嗎?可能大部分人都會搖頭:怎么可能性別影響如此之大。但越來越多的研究表明,性別在癌癥中起著不可忽視......