國際產業動態
醫療AI工具如何評估效能?美FDA審核流程未明
2021-04-22

美國食品藥品監督管理局(FDA)正以前所未有的速度發展AI,從CT掃描標記潛在肺栓塞病例到識別早期肺癌,皆令人期待後續成果。但目前FDA審查流程卻被指出缺乏幾步評估演算法的步驟。

在目前FDA批准的130種AI工具中,審查研究人員發現,大多數的工具都是依賴回顧性研究數據而建立的模型。多數開發人員都沒有共享在點上進行的研究、實驗數據,而且也並未提供相關病患性別、種族的差異資料。

Stanford生物醫學數據學系助理教授James Zou表示,他認為現在FDA公開的資訊相當稀少有限,這樣的結果會導致資料具有侷限性。從監督機構的角度來看,FDA這130台批准的設備中,有126台是根據回顧性數據運作,這意味這些設備大多數的數據在評估模型之前就已經被收集了。

另一個FDA被指出的缺點是大多數的設備都沒有共享AI設備的站點數量。根據統計,目前FDA只有41項批准的設備分享演算法。由於測試站過少,AI的性能產生很大的影響。雖然不同的醫院有不同的數據處理方式,但機器學習是由大家提供的數據而成立的,若數量過少也會有很嚴重的影響。

另外,通常報告僅會公開一個整體的演算法,這也很有可能會掩蓋模型在不同患者群中的表現方式。為了驗證這一點,James Zou和他的同事創建了三個自己的AI模型,他們分別從美國三個不同的公開醫院索取可用的胸部X射線數據影像進行分析,並將X射線對潛在的氣胸病例進行分類。當這些模型在其他地點進行測試時,他們發現模型的整體性能大幅的下降。

這些差異證實了不同的醫院做法會有不同的變動因子,而且不同患者之間的差異也會有影響。例如,他們發現在不同地點進行測試時,模型在白人患者和黑人患者中的表現方式存在顯著差異。

James Zou建議,目前FDA應當對使用這些演算法的公司進行更多的前瞻性測試。雖然這並不能完全解決問題,但這會是重要的一步。他還建議製造商在更多的站點測試演算法,尤其是那些高風險的設備。

(DIGITIMES/陳研旻)

本網站中所有資料(包括圖檔及文字檔),著作權皆屬本會所有(除另有註明者,或本會網站連結至外部之網站除外),如有引用,請確實註明出處來源。<完整資訊>
© 2024 Institute for Biotechnology and Medicine Industry (IBMI) All rights reserved.
地址:115 台北市南港區忠孝東路七段508號9樓 電話:(02)2655-8168 傳真:(02)2655-7978