AI產品與系統評測中心(AIEC)今日首次發布語言模型基準評測結果,台灣自主開發的TAIDE(Gemma-3-TAIDE-12b)在小型語言模型類別中表現卓越,展現本土AI研發實力。在大型模型的台灣價值觀評測中,Google Gemini 2.5 Flash表現尤為突出,顯示其對台灣主流價值觀具有較高的理解與適應能力。
AIEC由數位發展部與資安院、工研院於2023年底共同成立,旨在制定AI評測相關制度、標準及評測體系,促進台灣AI產業發展並拓展國內外商機。資安院副院長龔化中表示,此次評測參考國際標準及美國與歐盟相關規範,評測項目涵蓋公平性、準確性、可靠性、隱私及資安等面向,受測者可依需求選擇評測項目。
本次評測共測試42項語言模型,評測指標除採用高中學測國文科及社會科外,更特別納入台灣價值觀,以符合國際AI主權發展趨勢。在小型模型(13b以下)類別中,台灣開發的TAIDE表現優於其基礎模型Google Gemma-3-12b-it。大型模型方面,OpenAI的GPT-5整體表現最佳,而Google Gemini 2.5 Flash在台灣價值觀評測中表現尤為出色。
龔化中指出,部分中國語言模型在台灣價值觀評測中也有不錯表現,研判可能是因為這些模型採用「蒸餾技術」,以歐美地區基礎模型輸出作為訓練資料。相反地,部分歐美語言模型若未使用台灣繁體中文語料進行訓練,在台灣價值觀評測上表現較差,凸顯建置本土化語料的重要性。
數發部正積極推動台灣主權AI語料庫,提供具在地語境與本土價值的繁體中文資料,作為語言模型訓練的重要基礎,確保AI發展符合台灣社會價值與語言文化。AIEC表示,未來將廣泛徵求各界專家提供評測題目,並針對不同產品、系統與應用領域,持續推動國內自行研發AI評測工具,同時對接國際評測方法、規範或標準,強化台灣AI產品的市場適用性與全球化發展,建立可信賴的AI評測體系。
Copyright © 2022 好好聽文創傳媒股份有限公司 All Rights Reserved.