space20021: 他技術上有新東西,這個部分在論文公開之後,已經有不少團隊驗證過
只是這些新東西並不是讓他能夠用低算力達到高分數的主因,高度的蒸餾才是
(注意它一開始強調自己是在foundation model上有突破,並得到接近大型LLM的分數)
另外它使用的算力是否有那麼低,這方面還沒被其他團隊證實(而且他們已CEO承認有使用高階GPU,一開始公布的訓練設備等同作假)
從DS能得到高分來看,他們在蒸餾模型方面很有一套
但是蒸餾模型早就不是新技術,不少AI新創也會使用
DS目前在技術上能帶來明確影響的,大概就是他們的蒸餾技術比別人更加優化
至於在LLM泛用服務方面,他們沒有能力把自己蒸餾的源頭模型指紋去掉,不但造成服務沒有市場區別,現在還被openAI提告
(雖然這個提告比較偏政治動作就是了