为了解基于大语言模型的代码生成的能力和原理,对关键的原始论文进行阅读和总结。
论文阅读原则:
在大模型生成代码领域,具有代表性的奠定论文能说清楚最新前沿情况的最新论文1.1国外研究现状“AI助手”与程序员并肩工作的想法存在于我们的想象几十年了,它催生了来自编程语言[Ferdowsifardetal.;Miltneretal.;Nietal.;Raychevetal.]和机器学习[Guoetal.;Kalyanetal.;Xuetal.]社区的大量工作。由于大型语言模型(LLMs)[Lietal.;Vaswanietal.]的最新突破,这个梦想变得接近了。OpenAI的Codex模型[Chenetal.]包含亿个模型参数,训练了GitHub上万个软件库,能够正确解决0-70%的常规的Python问题,而DeepMind的AlphaCode[Lietal.]在竞争性编程平台Codeforces上排名前54.%,超过了名人类程序员。凭借这种令人印象深刻的表现,大型代码生成模型正在迅速逃离研究实验室,为工业编程助手工具提供动力,例如GithubCopilot[Friedman]。
2代表性的论文工作2.1OpenAI的Codex()2.1.1概述论文