AIEC首次公布語言模型評測結果 Gemini在台灣價值觀測試中脫穎而出

2025-10-03 15:00 　　鉅聞天下｜撰稿編輯中心

AI產品與系統評測中心（AIEC）今日首次發布語言模型基準評測結果，台灣自主開發的TAIDE（Gemma-3-TAIDE-12b）在小型語言模型類別中表現卓越，展現本土AI研發實力。在大型模型的台灣價值觀評測中，Google Gemini 2.5 Flash表現尤為突出，顯示其對台灣主流價值觀具有較高的理解與適應能力。

AIEC由數位發展部與資安院、工研院於2023年底共同成立，旨在制定AI評測相關制度、標準及評測體系，促進台灣AI產業發展並拓展國內外商機。資安院副院長龔化中表示，此次評測參考國際標準及美國與歐盟相關規範，評測項目涵蓋公平性、準確性、可靠性、隱私及資安等面向，受測者可依需求選擇評測項目。

本次評測共測試42項語言模型，評測指標除採用高中學測國文科及社會科外，更特別納入台灣價值觀，以符合國際AI主權發展趨勢。在小型模型（13b以下）類別中，台灣開發的TAIDE表現優於其基礎模型Google Gemma-3-12b-it。大型模型方面，OpenAI的GPT-5整體表現最佳，而Google Gemini 2.5 Flash在台灣價值觀評測中表現尤為出色。

龔化中指出，部分中國語言模型在台灣價值觀評測中也有不錯表現，研判可能是因為這些模型採用「蒸餾技術」，以歐美地區基礎模型輸出作為訓練資料。相反地，部分歐美語言模型若未使用台灣繁體中文語料進行訓練，在台灣價值觀評測上表現較差，凸顯建置本土化語料的重要性。

數發部正積極推動台灣主權AI語料庫，提供具在地語境與本土價值的繁體中文資料，作為語言模型訓練的重要基礎，確保AI發展符合台灣社會價值與語言文化。AIEC表示，未來將廣泛徵求各界專家提供評測題目，並針對不同產品、系統與應用領域，持續推動國內自行研發AI評測工具，同時對接國際評測方法、規範或標準，強化台灣AI產品的市場適用性與全球化發展，建立可信賴的AI評測體系。

社群