醫療AI工具如何評估效能？美FDA審核流程未明｜社團法人國家生技醫療產業策進會

國際產業動態

醫療AI工具如何評估效能？美FDA審核流程未明

2021-04-22

上一則

下一則

返回列表

｜

美國食品藥品監督管理局(FDA)正以前所未有的速度發展AI，從CT掃描標記潛在肺栓塞病例到識別早期肺癌，皆令人期待後續成果。但目前FDA審查流程卻被指出缺乏幾步評估演算法的步驟。

在目前FDA批准的130種AI工具中，審查研究人員發現，大多數的工具都是依賴回顧性研究數據而建立的模型。多數開發人員都沒有共享在點上進行的研究、實驗數據，而且也並未提供相關病患性別、種族的差異資料。

Stanford生物醫學數據學系助理教授James Zou表示，他認為現在FDA公開的資訊相當稀少有限，這樣的結果會導致資料具有侷限性。從監督機構的角度來看，FDA這130台批准的設備中，有126台是根據回顧性數據運作，這意味這些設備大多數的數據在評估模型之前就已經被收集了。

另一個FDA被指出的缺點是大多數的設備都沒有共享AI設備的站點數量。根據統計，目前FDA只有41項批准的設備分享演算法。由於測試站過少，AI的性能產生很大的影響。雖然不同的醫院有不同的數據處理方式，但機器學習是由大家提供的數據而成立的，若數量過少也會有很嚴重的影響。

另外，通常報告僅會公開一個整體的演算法，這也很有可能會掩蓋模型在不同患者群中的表現方式。為了驗證這一點，James Zou和他的同事創建了三個自己的AI模型，他們分別從美國三個不同的公開醫院索取可用的胸部X射線數據影像進行分析，並將X射線對潛在的氣胸病例進行分類。當這些模型在其他地點進行測試時，他們發現模型的整體性能大幅的下降。

這些差異證實了不同的醫院做法會有不同的變動因子，而且不同患者之間的差異也會有影響。例如，他們發現在不同地點進行測試時，模型在白人患者和黑人患者中的表現方式存在顯著差異。

James Zou建議，目前FDA應當對使用這些演算法的公司進行更多的前瞻性測試。雖然這並不能完全解決問題，但這會是重要的一步。他還建議製造商在更多的站點測試演算法，尤其是那些高風險的設備。

(DIGITIMES/陳研旻)

上一則台灣生育率全球倒數試管嬰兒之父呼籲「放寬人工生殖補助」

下一則世界醫師會首爾理事會通過支持台灣參與WHO決議

返回列表

■ 熱門點閱

2023生醫上市櫃營收Top 20公司綜覽

2023生醫上市櫃營收九大領域營收表現總覽

2023生醫上市櫃獲利拉警報！上半年淨利只剩去年同...

2023生醫上市櫃EPS前20強名單出爐！

■ 產業監測