人工智慧模型ChatGPT在醫學領域的應用能力受到關注,根據中山醫學大學最新研究顯示,GPT-4和GPT-4o在西醫師國考中表現出色,正確率分別達95.71%及96.72%,遠超及格標準。然而,面對中醫師考試時,即使是最先進的GPT-4o也僅能答對62.29%的題目,顯示AI在處理特殊知識體系時仍有明顯侷限。
這項研究由中山醫學大學醫學系學生吳曜丞與教授宋文瑋醫師共同進行,分析了2021至2024年間醫師國考第一試的非圖像選擇題。研究結果顯示,GPT-4和GPT-4o的正確率均超過90%,而GPT-3.5僅達65.74%,且在所有科目表現均較差。
值得注意的是,GPT-4o處理中文題與英文題的正確率相當接近,分別為98.14%與98.48%,證明其已具備跨語言處理醫學資訊的能力。
宋文瑋表示,選用醫師國考作為研究對象是因其題目範圍廣泛且答案明確,適合評估AI對醫學中文的理解與推理能力。他認為GPT-4和GPT-4o已可作為醫學生複習和模擬測驗的輔助工具,也能為臨床提供參考建議,但目前仍無法取代專業醫師的經驗及判斷。
研究團隊成員吳芸琪另外針對AI處理中醫師考試的能力進行研究,結果顯示只有GPT-4o勉強通過,正確率僅約六成,反映中醫特殊的語言與邏輯系統仍是AI難以突破的領域。
對於AI在醫學領域的應用前景,宋文瑋持樂觀態度。他指出,AI能快速整合複雜資料,提供衛教知識,並協助搜尋醫學指引,讓醫療人員更有效學習。只要在專業監督下應用,AI將有助於提升整體醫療品質,「活在AI時代是幸福的,相信醫療品質也會愈來愈好」。