免費乳腺癌X光片檢測:網友50塊GPU搭建AI醫療圖像早篩平台

免費乳腺癌X光片檢測:網友50塊GPU搭建AI醫療圖像早篩平台

來自專欄機器之心115 人贊了文章

選自V2EX,作者:Coolwulf,機器之心編譯。

網友 Coolwulf(他也是 K-MeleonCCF 瀏覽器的作者)近日在社交網路中發文表示,為了提升乳腺癌 X 光片的早期診斷速度,他向所有人開放了一個免費網站:人們可以將 jpg 格式的乳房 X 光照片輸入其中,並獲得由人工智慧做出的「疾病判斷」,準確度高達 90%。目前該項目獲得了人們的一致稱讚。

  • 工具鏈接:neuralrad.com

為了實現這一項目,Coolwulf 搭建了一個 50 塊 GPU 的集群

CoolWulf 對於 Neuralrad 的介紹

去年的時候,我一個在芝加哥比我小几級的南京大學校友去世了。乳腺癌,發現得晚了,才 34 歲,留下了一個 4 歲的孩子。非常可惜。想想能不能做點什麼事情可以幫助大眾來提高乳腺癌的早期檢測成功率。因為如果在 stage 1 發現乳腺癌的話,5 年存活率是 99%。

想想能否寫一個完全免費的網站和 ios app 來讓用戶可以迅速得到 X-ray Mammogram 的診斷結果。至少可以是 2nd Opinion. 因為用戶做完 Mammography 之後有時候需要等好幾天才能有 Radiologist 來讀片子。而且現在 Radiologist 有 20% 的概率會漏掉早期的腫瘤。我決定用 Deep Learning (深度學習) 來做這件事情。

對於一個足夠好的 Deep Learning Model, 一是要有足夠多的數據 (即使是做 Transfer Learning 的情況下), 二是要有足夠強大的計算力。為了做成這件事情,我在本地搭建了一個 50 個 Nvidia Geforce GTX 1080 Ti 的 GPU cluster, 這是搭成之後的硬體:

有了硬體之後就是設計 Model 和收集數據。我從北美和歐洲的幾個研究組獲取了 Annotated Breast Mammo 的數據。這些 Annotation 大多都是根據北美 ABR certified 的 Radiologist 做出的。也就是如果這個 Model 能夠訓練好,就可以達到 ABR Certified Radiologist 的 Reading 的平均水平或者更好。

最終的結果我在歐洲的 InBreast 數據上做了測試,達到了 90% 的準確度 (AUC)。

我覺得這個 Model 已經可以給大眾實用了,在這裡公開出來。

你可以直接上傳 .jpg 形式的 Mammo 圖片,這個 AI 會給出判斷結果。下面是使用時的截圖:

這個網站是完全免費使用的。我現在還在繼續更新和改進 Model, 也在聯繫國內的幾家醫院來合作來獲取更多的數據來 Training。

University of Kentucky Hospital 和國內的一家合作公司已經在測試了這個模型。

乳腺癌檢查去年有個全世界競賽,他們先用這個競賽獲得第二名程序測試了 MIAS 數據,漏了 10 個 case, 然後他們用我的網站測試了一下,只漏了一個。

這個第二名程序發表了一篇自然雜誌的論文:

nature.com/articles/s41

這兩天,我也公布了完全免費的桌面版本,支持讀取和瀏覽 dicom 文件,並自動轉換 Normalize for AI analysis. 在 InBreast 的 Dicom 數據上 AUC(準確率)大概 93%。桌面版本截圖:

下載地址就在網頁主頁上。

此工具一經放出,立即引來了人們的關注,大家對於作者希望通過技術改變陌生人健康的想法感到欽佩,同時也有人希望向作者提供更多的脫敏數據幫助訓練機器學習模型,以進一步提高醫療圖片的識別精度。

Q&A

面對人們對於 AI 檢測工具的各種疑問,Coolwulf 表示:

1. 出於顯而易見的原因,該工具並不能用於診斷,它僅能幫助人們建立乳房安全意識。不過,作者希望放射科醫師也可以開始嘗試使用這種工具,並相信這種工具有助於醫生在診斷時更有信心。

2. 很多研究表明 20%-30%被診斷出的癌症可以在盲審者的早篩檢查中找到。誤報雖然是一個問題,不過假陽性和假陰性只是 AI 圖像檢測的代價而已,假陰性肯定比假陽性有更大的危險。錯過惡性病變總比讓病人去做活檢要麻煩很多。

3. 目前,作者正在訓練第二代乳房 X 射線照片檢測模型,其將實現 BiRads 分類預測。作者希望它在保持低假陰性(目前出現的幾率已經非常低)的表現時也可以減少假陽性發生的幾率。

4. 該項目是完全由作者自己出資搭建的。

5. 想使用該網站,你可以輸入任何 jpg 格式的乳房 X 射線照片圖像。如果想使用 Win X64 版應用程序,則還可以使用 dicom 格式——該格式的 X 光片會在本地自動轉換為 jpg 格式的圖片並用於檢測。由於使用的是常規圖片格式,沒有像 dicom 的標題信息,所以檢測過程中沒有使用到患者信息。同時,在分析過後,所有 jpg 圖片都會被伺服器刪除。

原文鏈接:v2ex.com/t/462641?


推薦閱讀:

80年從人工智慧看中日兩國的發展差距
乾貨:德國計算機雙學位(英語授課)盤點
羅永浩「嚇尿」大會上,我褲子真濕了
Norman,一個患有精神病的AI
比自己失業更可怕的是,你的孩子也即將失業

TAG:機器學習 | 圖形處理器GPU | 人工智慧 |