除了訓練資料集。評鑑也是個大問題!!!
CKIP 說這個LLM 經過C-Eval中文模型評測,C-Eval 是什麼?它是「中國清大」、「中國交大」開發的中文基礎模型評量系統
C-Eval: 一个适用于大语言模型的多层次多学科中文评估套件中研院用簡轉繁的資料集訓練完他們認為適用台灣的基礎模型,然後再派它去考中國的考試,計算分數。
這相當於「教育部搬中國所有系所的教科書,簡轉繁教學生;再拿中國所有的專業考卷,簡轉繁後考學生。」學生考不好,敢問是要叫它背台灣教科書還是背中國教科書?
一般商用的還好,中研院推的基礎模型用中國資料轉繁體後訓練,並說明可用於「學術、商業使用、文案生成、文學創作、問答系統、客服系統、語言翻譯、文字編修、華語教學等。」
這會出事的。