初探「放射基因圖譜學」- Radiogenomics

A-Tsai
13 min readMar 25, 2021

--

擷錄自 https://hdwallpapers.cat/thumbnail/footballdefense-fussballabwehr-funny-x-ray-AtZp.jpg

緣起

前陣子開發新客戶時不小心看到「Radiogenomics」這個陌生的專有名詞,顧名思義它應該就是「Radiomics」+ 「Genomics」的新領域,突然有種回到當年在念博班時看到「Bioinformatics」=「Biology」+「Informatics」的感覺,所以就再花點時間整理一下這個領域目前發展的狀況來跟大家分享,希望這個領域能帶領我們朝「精準醫療」更往前邁進一步。

話說 Genomics 的資訊就可以把每個人祖宗十八代的資訊都看得一清兩楚,若再加上 Radiomics 的資訊,如同上圖,醫生就可以完完全全把每個人看光光了!但實際上有這麼容易嗎?

這兩種資料都有「雜訊與變異難以分別」和「致病特徵細節微小且多元」的特性,非常適合有意往生醫領域的 Data Scientist 高手們一起投入。

小結論

這次想先把結論寫在前面,對此有興趣的人再往下繼續看下去:

Radiogenomics 應屬於 Multi-omics 的一環,主要強調利用 Radiomics 和 Genomics 來互補各自的缺點與限制,進而提升各自的能力。我會將其歸納為「研究」和「臨床研究」的領域,離「臨床」似乎還有些距離。

另外,就此領域所使用的方法部分,目前仍尚未脫離 Radiomics 和 Genomics 原本的領域 (可能是因為我相關論文讀得還不夠多)。如同十多年前 Bioinformatics 的方法大多來自 Pattern Recognition、Information Retrieval、Data Mining 及 Machine Learning 等領域一樣,但相信不久的將來一定會發展出自己獨特的方法論。

名詞定義

Radiogenomics 一字在 2006 年前就己在論文 [11] 中被提及,但尚未普及,直到近幾年隨著 Deep Learning 在 Medical Image 上有重大突破,這個領域才又開始熱鬧起來,但主要還是 Radiomics 這領域的研究者的投入。

Radiogenomics 的中文相關說明並不多,目前查到對這個英文名詞的中文翻譯有以下三個:

  • 放射基因圖譜學 [1]
  • 影像基因圖譜學 [1,2]
  • 磁振影像圖譜學 [2]

最近幾年,Radiogenomics 的概念已被導入癌症醫學,其主要概念是建立癌症影像表型與癌症基因表型間的關聯性 [1]。

另外,我蠻喜歡 Mayo Clinic 放射科主任 Dr. Erickson 的說明[3]:

  • Many diseases are largely determined by genome
  • Some diseases are determined by multiple genes and some diseases are gene + environment
  • Radiomics: Identify properties in images that reflect disease or prognosis
  • Radiogenomics: Identify genomics of tissues using radiological images

我的解讀如下:

很多疾病都是因為基因體上的變異造成的。就癌症來講,可以從基因變異來對病情進行分類,以便採用合適的治療手段或術後追蹤;然而,基因資訊需要額外的支出,所以若能從目前己建立在檢測標準流程中的醫學影像得到與基因型有高度相關性的 Biomarker,則可大大加速及簡化治療的決策,也因此而蘊育出 Radiogenomics 這個領域。當然,反之亦然。

另外,2018 發表在 Radiology 的這篇 Review Paper [4] 有給更明確的定義:

  • Radiogenomics as a distinct, new field within medical imaging.
  • Radiogenomics aims to correlate imaging characteristics (ie, the imaging phenotype) with underlying genes, mutations, and expression patterns.
  • Radiogenomics represents the evolution of radiology-pathology correlation from the anatomic-histologic level to the genetic level and also characterizes the interface of biologic systems approaches and imaging.
  • Importantly, radiogenomics is not equivalent to radiomics.
  • The goal of radiogenomics is to develop imaging biomarkers incorporating both phenotypic and genotypic metrics that can predict risk and patient outcomes and thereby better stratify patients for more precise therapeutic care.

流程架構

Radiogenomics 這個領域進展神速,看過幾篇相關論文後,覺得 2020 年發表在 International Journal of Oncology 的 Artificial intelligence radiogenomics for advancing precision and effectiveness in oncologic care 的這篇 Review [5] 所提出的架構是最符合目前發展的方向,雖然它在 Genomics 這塊主要是拿 Gene Fusion 來當例子,但熟悉 Genomics 的專家們應該都知道還有那些面向可以運用。

圖一、 Radiogenomics 流程示意圖 [5]

主要架構會依照圖一,分成五個階段進行說明:

第一階段 Data Acquisition — 分別從醫學影像 (X-Ray/MRI/PET) 和分子檢測 (DNA/RNA/Protein) 得到資料;

第二階段 Feature Extraction / Modeling — 分子檢測可以從 Genomics/Transcriptomics/Epigenomics/Proteomics/… 等得到基因變異或表現差異等資料;而影像部分則分為「工人智慧」手動建立的特徵值和「人工智慧」自動產生的模式這兩種,如 The Image Biomarker Standardization Initiative (IBSI) 所定義的 169 個標準化影像特徵值 [6] 就屬於「工人智慧」的範籌;另外,近幾年在各領域大嗚大放的 Deep Learning 早己成為醫學影像的主流,當然也不會在 Radiogenomics 中缺席;

第三階段 Correlation / Association — 這個步驟才會開始整合 Radiomics 和 Genomics 的數據、模型和特徵值。主要方法與 Multiomics 領域差不多,不是 Genomics 當答案或 Phenotype 來建立新模型或找 Association,不然就是反過來。再不然就是另外從臨床數據 (Clinical record) 當答案 (or Phenotype),同時把 Radiomics 和 Genomics 的數據一起當 Training data 等方式,如同圖二 (b) 所示。

圖二、Graphical representation of the radiogenomic process [7]

第四階段 Data Analysis — 這階段的重點是找出合適臨床問題的 biomarker,「可解釋性」就是某些機器學習和 Deep Learning 方法的限制,但這階段我覺得就是在找「具解釋力」的 biomarker。

第五階段 Endpoints — Radiogenomics 還是希望能解決臨床問題,所以最後都會設定某個臨床問題來進行研究,例如精準用藥、5年存活率預測、是否容復發/轉移等。

補充一下上面第二階段討論到 Radiomics 的部分,主要的方法可以分為兩大類,如下圖三,應該之後會再另外寫一篇來討論。

圖三、Outline of the two kinds of radiomics pipeline [8]

討論至此,會發現大部分 Radiogenomics 的論文內容主要著重在 Radiomics 的部分,較少提及 Genomics 這領域,唯獨 2018 年這篇針對乳癌的論文 [4],因為乳癌是目前被較多研究的癌種,所以相對各類 omics 都可發現一些有用的 biomarker,若整合起來,應該在臨床決策上可以提供最合適的治療方式。也因此,在文章一開始才會說:「Radiogenomics 是屬於 Multi-omics 的一個特定組合」。

圖四、A general hierarchical diagram of the systems biology approaches toward diagnosis and prognosis of a cancer [4]

相關應用

Radiogenomics 的主要應用就是結合多面向的資料,提供醫生更完整的資訊來治療決策,如下圖所示。

圖五、Radiogenomic Process in Clinic [7]

但目前看到大部分的應用都是拿 Genomics 的特徵當答案,拿 Radiomics 的影響當 training data,如北醫嚴前校長團隊在 2018 年發表在 Clinical Cancer Research 的這篇文章 [9] ,就是以 WHO 在 2016 年定義出 Diffuse Gliomas 針對組織特性和基因體變異的五種不同型態為分類基礎,試著利用 MRI 資料來進行訓練,文章提出三層式 Binary Classification 的架構,共訓練出 4 種分類器。

圖六、The clinical characteristics of the training dataset [9]

另外,2020 年發表在 Diagnostics 的文章 [10] 提供了一個針對 Radiogenomics 進行系統性的研究流程,也非常值得大家參考。

圖七、Systematic process of Radiogenomics research [10]

最後,這領域目前研究遇到的限制有那些呢?根據 [5]的統計,可以簡單分成三大類:絕大部分都是資料不足的問題 (e.g. Dataset size, Lack of independent dataset),其次是 Genomics 的問題 (e.g. Genomics data cost and Technical complexity of genomic data),最後是方法論的問題 (e.g. No standard acquisition protocol, Black box, Multi-model data analysis, computational resources)。

圖八、Limitations addressed by the authors of the reviewed publications [5]

感想

看起來這領域才剛起飛,還不到進入軍備競賽階段,而且方法論的部分仍有發展空間,建議研究者們有經費就往這邊砸,一定可以投到不錯的期刋。

圖九、擷錄自 [3]

另外,套句「深度學習之父」Hinton 的話(圖九)給放射學家及放射醫療研究人員,Radiomics 就交給 AI 去玩吧!大家可以往 Radiogenomics 的方向大步邁進,或者是找個懂 Genomics 的好友一起合作吧。

--

--

A-Tsai
A-Tsai

Written by A-Tsai

Practitioner of Multi-Party Computation

No responses yet