[從 DNA 看世界系列] 醫療除了「精準」,還需要「公平」

A-Tsai
5 min readAug 24, 2017

--

這幾週美國總統川普因為 Charlottesville attack 的言論觸動了大家在族群的敏感神經。上星期看到一個有趣的報導 — 「Medicine is getting more precise for white peopel」[1],於 2009 年研究發現研究基因與疾病關係的樣本有 96% 都是白人血統,在 2016 年的研究還是發現白人血統仍占有高達 81% 。也就是目前的疾病研究或藥物大多以白人血統的基因體為基礎。換句話說,目前的醫藥對白人是比較有效的。

讓我回想到三年多前與陳倩瑜教授的一次會面談到次世代定序技術面臨的挑戰與機會時,陳教授當年說的一句話:「阿才,我們一起來弄個台灣人的Genome Reference!」至今,這句話還是深深烙印在我心裡,每當遇到被客戶打槍或技術無法突破時,一回想到這句話,就會讓我有繼續堅持下去的動力。

但為什麼非得大張旗鼓地弄個台灣人的基因體樣版 ( Genome Reference) 不可呢?全世界的人都是用 Global Reference (e.g. HG 19/38 or GRCh 37/38 ) 來分析基因體資料呀?這是不是在搞某種意識形態的「台獨」?

回到 1990 年開始的人類基因體計劃( Human Genome Project,HGP)[2],其中一個目標就是把人類的 23 對染色體上的 DNA 序列排列出來。在草圖出來後,研究人員就可以此為樣版 (Reference),先將定序出來的序列回貼到樣版(Resequencing)上,找出病人的基因體上與樣版的差異(稱之為變異點),接著就可以找出變異點與疾病的關係。而樣版回貼所需的運算資源比起直接做組裝 (De Novo Assembly)少很多,也因此,大家就習慣了這樣的分析流程,但這樣的流程有任不妥呢?

實際上,人類的基因體有很多相似序列片段,而次世代定序的 read 長度有只有1~2百,更不用說定序儀產生的錯誤雜訊增加回貼的困難度。圖一是由一個全基因體 (WGS) 30X 回貼 HG19 的結果,可以看出這個區域竟然可以回貼到1千多條的深度,原因是因為這段樣版序列跟其它區域的序列很相似,來自其它區域的序列片段都同時回貼到這個區域中,導致回貼的深度如此高。因此,從這個區域找出來的變異點常常都是假訊號 (False Positive)。

圖一、用 IGV 顯示 reads 回貼 Global Reference 的示意圖

基於樣版回貼的過程中,就會造成一些失真。若使用的樣版與受測者的基因體差距越大,造成的失真就會越嚴重。一般來說,每個人的基因體差異粗估約千分之一,也就是根據樣板回貼後產生約 3百萬個變異點。圖二是 The 1000 Genomes Project Consortium 於 2015 年發表在 Nature 期刋的統計資料[3],由圖上可看出各個人種在基因體上的不同,例如非洲人種的變異點相對歐洲的多很多,也就是目前使用的樣版跟非洲人種比較不像(針對單點變異(SNV)和小片段變異(INDEL)),換句話說,對非洲人比較不公平。更不用說大片段基因體的結構變異(Structural Variation)對樣版回貼造成的影響了。

圖二、不同人種變異點統計 https://www.nature.com/nature/journal/v526/n7571/fig_tab/nature15393_F1.html

陳教授提出「建立台灣人 Reference 」想法就是想要解決因樣版回貼造成失真的問題,若有更符合台灣人的樣版,相信回貼失真的問題可以減少,後續分析也就更不會出錯。當然,越貼近目標族群的 Reference對回貼的正確性會提高,但後續的分析及資料比對會更複雜,但這不就是身為電腦工程師或資料科學家們更能發揮所長的地方嗎?

相信就精準醫療議題上,唯有「因人而異」才能真正做到「公平正義」。

後記:最近陳教授又對我講了一句話:「要不忘初衷真是太難了!」這 ……

[1] https://fivethirtyeight.com/features/medicine-is-getting-more-precise-for-white-people/

[2] https://en.wikipedia.org/wiki/Human_Genome_Project

[3] https://www.nature.com/nature/journal/v526/n7571/full/nature15393.html

--

--

A-Tsai
A-Tsai

Written by A-Tsai

Practitioner of Multi-Party Computation

No responses yet