LLM4Decompile: Decompiling Binary Code with Large La...Ref Will 保哥
有人使用 LLM 反編譯二進制程式碼,硬是將編譯好的 machine code 翻譯回 C 原始碼,準確度比 GPT-4 高出 50% 之多
這個 LLM4Decompile 模型以 40 億個 Token 的 C 原始碼和相應的 machine code (組合語言) 訓練。作者還提出 Decompile-Eval,一個用於評估重新相容性和反編譯的重新執行能力,以及從程式語意角度進行評估的資料集。