「聽風就是雨的八卦王」
這是最接近語言本質的比喻。
LLM 就像村口那位聽過所有人講話的「包打聽」: 他聽過村子裡幾百萬次的對話。他知道當有人說「小明」的時候,接下來很常會聽到「愛吃蘋果」。
為什麼這是統計? 經過幾百萬次的聆聽,他腦中建立了一個強大的連結:小明 = 愛吃蘋果。
為什麼這不等於真實? 也許小明其實恨透了蘋果,只是因為前幾天村裡流行一個關於蘋果的笑話剛好提到小明。或者,小明昨天才剛開始對蘋果過敏。但這位「包打聽」只依賴過去累積的統計數據(大家常把這兩者連在一起講),所以他會信誓旦旦地告訴你:「小明肯定愛吃蘋果。」他無法驗證,他只是在重複大數據下的「刻板印象」。