首頁/ 科技/ 正文

『重磅!最新發現癌症相關基因』真相:基本找不著癌症無關基因

Every gene can (and possibly will) be associated with cancer。

編譯 | 

剛剛過去的十月是世界乳腺癌防治月。作為乳腺癌防治活動的公認標識,粉紅絲帶一直在默默提醒著人們,人類將癌症研究放在何等重要的位置。美國國立衛生研究院

(NIH)

2021年整年的預算是429億美元,國立癌症研究院就划走了65。6億美元,佔比超過15%。這些投入到癌症研究的大把資金將轉化為一篇篇科研文獻。

如此巨量的資金投入癌症研究領域,會對生命科學領域的整體研究產生什麼影響?

英國利物浦大學研究員João Pedro de Magalhães 於上個月末在期刊《遺傳學趨勢》

Trends in Genetics

上發表了一篇討論“科學之科學”

(以科學研究本身為研究物件的科學研究)

的文章,嘗試回答了這個問題。João Pedro de Magalhães博士的研究領域是衰老與長壽,現在專攻減緩衰老的課題。在開始分析衰老相關的遺傳因素時,他注意到,相關文獻中的大多數都是癌症研究,這顯示了人為因素造成的偏差。文獻檢索的結果既可能幫助研究人員摸清某些領域科學知識的框架,也可能使其更加模糊難辨。

作者分析了PubMed資料庫上的文獻,結果顯示,PubMed上的文章總共提及了17371個人類基因,其中87。7%的基因或多或少被認為和癌症有關——可以說,絕大部分人類基因都可能與癌症有這樣或那樣的關聯。同時,資料庫中癌症相關的研究簡直不要太多,關於其它嚴重疾病的文章數量

(例如中風)

則不免相形見絀。

『重磅!最新發現癌症相關基因』真相:基本找不著癌症無關基因

圖1。  癌症(藍色)與中風(橙色)相關文獻數量比較。PubMed資料庫中3000餘萬篇論文中,超過 400 萬篇與癌症有關。相比之下,僅有約 35萬篇論文與中風相關。截至 2020 年,每年有超過 20 萬篇與癌症相關的論文。

據此,João Pedro de Magalhães提出了“文獻發表偏差”

(publication bias)

的概念,也稱“研究人員偏差”

(researcher bias)

,表示

的現象。缺少統計上的顯著性的研究,發表的可能性會比較低;因為掛上一個癌症的標籤,論文更容易被更具影響力的期刊接受,所以涉及癌症的文章看起來就會比較多。

不久前,

TheScientist

雜誌採訪了João Pedro de Magalhães博士,探討了這一偏差效應可能帶來的問題。

Kestrel

你的研究主要聚焦在衰老和壽命方面,怎麼會想到寫這篇癌症遺傳學文章的呢?

研究者根據實驗結果的指向以及證據的強度來決定是否發表論文、發表在哪裡

我說到的“文獻發表偏差”或者“研究人員偏差”的想法其實很早之前就有了。很簡單,就是我們對於某些基因或者分子過程或者疾病的理解要遠多於其它的基因、分子、疾病。

我們做了很多系統學研究。比如說,我們知道衰老並不是由單個基因控制的。有一些先天的因素,比如某個基因的突變,會讓你衰老得更快。再例如癌症或者老年痴呆

(阿爾茲海默病)

,有些人可能因為攜帶某些基因突變而比其他人更容易患癌,或更容易老年痴呆。但總體而言,大多數複雜表型——諸如衰老、長壽、癌症、老年痴呆、心血管疾病等等——是由多個基因以及環境共同造成的。這就需要你去研究不同系統的組分之間的相互作用。

進行這種分析的時候,讓我比較擔憂的一點就是文獻發表偏差。你會查到某些基因的資訊要遠多於其它基因,那該怎麼控制文獻發表偏差的影響呢?基本上,我的想法就是,沒法控制。人為偏差就是影響著我們的研究方式,就是有一些主題和基因被研究得比較多。

當你研究基因的時候,你總是會找到一些跟癌症有關聯的基因。正是這點讓我想到要做這次分析。關於癌症的研究會比其它主題的研究要多得多。我覺得這是個尚無人探索過的主題——不是癌症本身,我指的是“科學之科學”,包括研究過程中的人為偏差。

Q:

。這樣的偏差存在,可能是有合理的原因,也可能只是歷史原因。我只是希望科學更具效率。

A:

癌症的細分形式林林總總,有那麼多基因跟癌症存在某種聯絡也見怪不怪吧。你是說看到科學家把這麼多的基因放在腫瘤的語境下研究,你很驚訝嗎?

我們對某些基因的研究比對其它基因多得多,我覺得這也是個問題

數目之巨讓我驚訝。對於至少被一篇文獻探討過的基因,我覺得大概其中90%會跟癌症有牽扯。你再看那些被超過百篇文獻討論過的基因,幾乎就找不到跟癌症沒關係的。我不是覺得總體的結果很驚人,而是這個偏差效應的程度之大,很驚人。

Q:

那麼,強調這麼多人類遺傳學文獻或聚焦或提及癌症這件事情,是為了什麼呢?你覺得研究者會由此走到何方?

A:

結論有兩點。

第一點剛剛我提過,任何時候,當你做系統的基因網路分析,你都得考慮到,會涉及的每個基因已有多少文獻探討過。這是一個可能引起混淆的因素。而實際上,網路分析常常沒有考慮這些偏差。解讀結果的時候嘗試修正這些偏差,或者至少知道它們的存在,我想會對你分析的質量有幫助。

『重磅!最新發現癌症相關基因』真相:基本找不著癌症無關基因

圖2。 重構調控網路舉例。根據在膠質母細胞瘤中的基因表達資料,計算機預測了包含6個轉錄因子的調控網路。(Carro MS, et al。 Nature。2010)

其二是

Q:

。幾乎所有基因都可以叫“癌症相關基因”。所以你在寫文章或申請經費的時候,對於絕大部分人類基因,你都可以加上一句“這個基因跟癌症相關”。

當你解讀結果或申請經費的時候,要小心。做大尺度分析

(注:例如研究一種疾病所涉及的所有蛋白質的相互作用網路)

,找到多個基因的時候,它們很多會是癌症相關基因。解釋分析結果的時候得把這點考慮進去。

A:

你在文章中寫道,“在一個幾乎任何東西、任何基因都可以跟癌症扯上關係的科學世界中,真正的挑戰在於確定哪些是驅動腫瘤發生的關鍵、哪些是有潛力的治療靶標。”可以詳細談談這些挑戰會體現在什麼地方嗎?

對於“癌基因”或“癌症相關基因”這樣的說法,我們應當更慎重些

在某個生命過程中,發現一個基因是靶點,或者發現它受到抑制,並不就意味著就可以在臨床上加以利用。所以,最開始討論的是相關性,然後就要確定因果性,最後才是找尋好的靶點。

我認為相比其它的疾病或生理過程,癌症可以說是研究起來最直接的。例如,你可以找到各種腫瘤的細胞系作為研究材料,研究體系的問題就解決了。實驗方法上,癌症研究沒有其它某些疾病那麼繁複。找到與癌症相關的基因相對容易,但要區分相關和因果。還有,就算因果性有了,也不意味著這個基因就是個好的治療靶點。所以下一步就是找到驅動癌症發生的關鍵因子。有一些我們已經知道了,還有一些不知道,還有些有潛力的治療靶點尚未為人所知。

Q:

你在文章中可能有點幽默地提到,多虧了這些可能存在的與癌症的關聯,科學家們可以以此為理由去申請經費來研究幾乎任何基因。那你會覺得研究人員們真的已經這麼做了嗎?比方說我是個遺傳學家,想要研究一個人們不太瞭解的基因,那我指出“該基因與癌症相關”,會對我的研究有利嗎?

A:找到很多跟某個表型有關聯的基因,並不意味著這些基因就重要。可能有相關性,但不一定存在因果關係。

我不太清楚申請癌症相關研究經費的具體細節是怎麼樣的,但是,如果你找到一個跟衰老有弱相關性的基因,你就可以在經費申請裡面說,這個基因與衰老有潛在關聯,我們想要在衰老研究的語境下去研究它。

這會帶來另一個問題,就是我們該如何評估一項研究。

我們是該專注於那些已經比較瞭解的基因,還是去研究那些鮮有涉及的基因呢?這是個開放式的問題。目前來說,你要申請任何研究經費,通用的辦法是要有一些初步的資料來支撐。也有人會說,我們應該更支援去研究那些人們還不太瞭解的基因。在這個問題上我不挑邊站,但我認為這是一個當前語境下可以思考的問題。

現在回答你的問題:是的。會有利。你可以把“與癌症相關”寫到經費申請裡面去,即使這個相關性不是很強。這又引出另一個問題:應該如何去稽核評估經費申請呢?這又是另一個大的問題了。

Q:

這麼多研究與腫瘤相關聯,有什麼不好嗎?它是否會掩蓋其它重要的研究工作?

A:

我覺得這也是一個大問題。我們應該研究啥?經費應該投給什麼樣的研究?因為癌症比阿爾茲海默病容易研究,所以關於癌症的已有文獻就比關於老年痴呆的多。我們注入到癌症研究中的資金要比注入到衰老或其它疾病研究的要多得多。這樣做到底應不應該,

Q:

我們應該投錢來研究癌症、找到癌症的治療方法。我們也應該找到阿爾茲海默病、心臟病的治療方法。如何去分配經費?我覺得這是個難題。我也沒有答案。

A:

[1]

https://www。the-scientist。com/news-opinion/q-a-nearly-every-single-human-gene-can-be-linked-to-cancer-69365

[2]

https://www。cell。com/trends/genetics/fulltext/S0168-9525(21)00266-3

可能不太是一個科學問題,而是個社會問題

1。 進入

『返樸』微信公眾號底部選單“精品專欄“,可查閱不同主題系列科普文章。

2。 『返樸』提供按月檢索文章功能。關注公眾號,回覆四位陣列成的年份+月份,如“1903”,可獲取2019年3月的文章索引,以此類推。

參考文獻

『重磅!最新發現癌症相關基因』真相:基本找不著癌症無關基因

相關文章

頂部