小型語言模型分析程式碼的優點是容易佈署,也較不會偷偷把一些和現狀不符的記憶摻入推論過程。但,一方面,有些程式碼的過程實在複雜,模型很常漏掉一些流程。也因為知識不足,難以瞭解一些特別的程式關聯。例如 code generator 產生的 code 和 source 之間的關聯。因此,需為 code base 搜集一些相關知道,寫成文件讓模型可以學習和查詢。透過知識庫的建立,能模型能在該 code base 發揮更好的效率。
另外,因為 context window 太小,使其記憶力不如大型模型,於是需要重複相同的動作多次。例如在不同時間段,重複讀同一份文件,以確認不同的疑問。因此需要更長的工作時間。
每次因為不同問題而閱讀同一份文件後,agent 都會把問題和得到的答案記錄在筆記中。透過整理筆記的過程,解決最終的問題和任務。