码农狂喜!微软提出CodePlan,跨168个代码库编码任务,LLM自动化完成

对于大模型来说,擅长的是本地化编码任务。

如果任务涉及多个相互依赖的文件,LLM无法解决这个问题

微软研究人员为此设计了一个名为CodePlan的任务无关的神经网络框架

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

码农狂喜!微软提出CodePlan,跨168个代码库编码任务,LLM自动化完成图片

论文地址:https://arxiv.org/pdf/2309.12499.pdf

论文中,CodePlan综合了多步骤编辑链(chain-of-edits),是一种将程序分析、规划和LLM结合在一起的新方法。

一起来具体看看,CodePlan是如何设计的?

CodePlan:大模型+规划

软件工程活动中,例如软件包迁移、修复静态分析或测试的错误报告,以及向代码库添加类型提示或其他规范,涉及到对整个代码存储库的普遍编辑。

研究人员计划这些活动,以实现”存储库级别的编码任务”

编码工具如GitHub Copilot、Code Whisperer已经获得了大模型能力的支持,为码农在本地化编码问题上提供了解决方案

然而,事实是,「存储库级别的编码任务」更加复杂,无法直接通过LLM解决,因为存储库中的代码是相互依赖的,整个存储库可能太大而无法纳入提示

这项研究中,微软团队将库级编码框架作为一个规划问题,并提出了一个任务不可知的框架,称为CodePlan。

CodePlan综合了一个多步骤的编辑链(计划) ,其中每一步都会调用代码位置上的LLM。该代码位置上的上下文来自整个存储库、以前的代码更改和特定于任务的指令。

CodePlan是一种新型组合,它基于增量依赖分析、变更可能影响分析和自适应规划算法

码农狂喜!微软提出CodePlan,跨168个代码库编码任务,LLM自动化完成图片

如下图,展示了复数库API的变化,微软研究人员的任务是根据这一变化迁移代码库。

码农狂喜!微软提出CodePlan,跨168个代码库编码任务,LLM自动化完成图片

在图3的左侧展示了代码库中与使用复数库相关的部分

具体来说,Create.cs文件中的方法func,调用了库中的create_complex方法,Process.cs文件中的方法Process.cs调用了func。

码农狂喜!微软提出CodePlan,跨168个代码库编码任务,LLM自动化完成图片

研究人员将任务描述和func主体从图1传递给LLM,以生成修改后的func代码,如图3右侧所示

可以看到,LLM已经正确地编辑了对create_complex API的调用,以便它返回一个Complex类型的对象,而不是两个浮点值的元组。

注意,这个编辑导致了方法func的签名发生了变化——它现在返回了一个Complex类型的对象。

需要进行修改的是:需要修改方法func的调用者,例如在Process.cs文件中的process方法,如图3左下角所示。如果不对process方法的主体进行适当的修改,代码将无法构建!

图3右下方显示了对process方法的适当修改,它能使版本库达到一致的状态,从而在编译时不会出错。

研究人员的主要任务是建立一个「存储库级别的编码系统」,该系统能够自动生成编辑所需的派生规范

LLM驱动的库级编码任务定义如下:

码农狂喜!微软提出CodePlan,跨168个代码库编码任务,LLM自动化完成图片

在CodePlan的整体框架中,输入包括一个存储库、一个通过自然语言指令或一组初始代码编辑表达种子规范的任务、一个正确性oracle和一个LLM

CodePlan创建了一个计划图,其中每个节点都代表LLM需要执行的代码编辑任务,而边表示目标节点需要在源节点之后执行

CodePlan监控代码编辑,并自适应地扩展计划图。

一旦计划中的所有步骤都已完成,存储库将由oracle进行分析。如果oracle验证了资源库,则任务完成。如果发现错误,错误报告将作为下一轮计划生成和执行的种子规范。

码农狂喜!微软提出CodePlan,跨168个代码库编码任务,LLM自动化完成图片

此外,CodePlan算法还维护了一个依赖关系图,图4说明了依赖关系图的结构。

码农狂喜!微软提出CodePlan,跨168个代码库编码任务,LLM自动化完成图片

刷新SOTA

研究人员对CodePlan在两个存储库级任务上的有效性进行了评估:包迁移(C#)和时态代码编辑(Python)

每个任务在多个代码库上进行评估,每个代码库都需要对多个文件(2-97个文件)进行相互依赖的更改。

码农狂喜!微软提出CodePlan,跨168个代码库编码任务,LLM自动化完成图片

以前从未有过使用LLM自动完成这种复杂程度的编码任务

研究结果显示,与基准相比,CodePlan更符合基本事实,能够使5/6个存储库通过有效性检查,例如无错误构建和正确的代码编辑

总的来说,CodePlan为自动化复杂的库级编码任务提供了一种有前途的方法,既提高了生产效率,又提高了准确性

它成功地应对了许多挑战,为高效可靠的软件工程实践开辟了新的可能性

参考资料:https://www.php.cn/link/23b1f559d8bd157d0d741c83957ed4f2

ImagetoCartoon ImagetoCartoon

一款在线AI漫画家,可以将人脸转换成卡通或动漫风格的图像。

ImagetoCartoon 106 查看详情 ImagetoCartoon

以上就是码农狂喜!微软提出CodePlan,跨168个代码库编码任务,LLM自动化完成的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1050391.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年12月2日 10:01:39
下一篇 2025年12月2日 10:02:11

相关推荐

  • soul怎么发长视频瞬间_Soul长视频瞬间发布方法

    可通过分段发布、格式转换或剪辑压缩三种方法在Soul上传长视频。一、将长视频用相册编辑功能拆分为多个30秒内片段,依次发布并标注“Part 1”“Part 2”保持连贯;二、使用“格式工厂”等工具将视频转为MP4(H.264)、分辨率≤1080p、帧率≤30fps、大小≤50MB,适配平台要求;三、…

    2025年12月6日 软件教程
    600
  • 哔哩哔哩的视频卡在加载中怎么办_哔哩哔哩视频加载卡顿解决方法

    视频加载停滞可先切换网络或重启路由器,再清除B站缓存并重装应用,接着调低播放清晰度并关闭自动选分辨率,随后更改播放策略为AVC编码,最后关闭硬件加速功能以恢复播放。 如果您尝试播放哔哩哔哩的视频,但进度条停滞在加载状态,无法继续播放,这通常是由于网络、应用缓存或播放设置等因素导致。以下是解决此问题的…

    2025年12月6日 软件教程
    000
  • 当贝X5S怎样看3D

    当贝X5S观看3D影片无立体效果时,需开启3D模式并匹配格式:1. 播放3D影片时按遥控器侧边键,进入快捷设置选择3D模式;2. 根据片源类型选左右或上下3D格式;3. 可通过首页下拉进入电影专区选择3D内容播放;4. 确认片源为Side by Side或Top and Bottom格式,并使用兼容…

    2025年12月6日 软件教程
    100
  • Linux如何防止缓冲区溢出_Linux防止缓冲区溢出的安全措施

    缓冲区溢出可通过栈保护、ASLR、NX bit、安全编译选项和良好编码实践来防范。1. 使用-fstack-protector-strong插入canary检测栈破坏;2. 启用ASLR(kernel.randomize_va_space=2)随机化内存布局;3. 利用NX bit标记不可执行内存页…

    2025年12月6日 运维
    000
  • VSCode终端美化:功率线字体配置

    首先需安装Powerline字体如Nerd Fonts,再在VSCode设置中将terminal.integrated.fontFamily设为’FiraCode Nerd Font’等支持字体,最后配合oh-my-zsh的powerlevel10k等Shell主题启用完整美…

    2025年12月6日 开发工具
    000
  • PHP中向数组对象添加或修改属性的实用指南

    本教程详细介绍了如何在php中高效地向数组中的对象添加或修改属性,尤其是在处理json数据时。文章强调了利用php内置的`json_decode()`和`json_encode()`函数进行数据转换和操作的重要性,避免手动构建json字符串,从而确保数据结构的完整性和代码的健壮性。 在PHP开发中,…

    2025年12月6日
    000
  • 解决HTML锚点链接页面重载与URL路径丢失问题

    在使用html锚点链接进行页面内部导航时,开发者可能会遇到页面意外重载或url路径丢失的问题,导致无法正确滚动到目标区域。本文将深入探讨这一常见问题的根源,并提供一种简洁有效的解决方案:确保锚点链接的`href`属性包含当前页面的完整相对路径,从而实现平滑的页面内跳转,避免不必要的页面刷新和url结…

    2025年12月6日 后端开发
    000
  • Java中char与String的字节表示深度解析

    本文深入探讨java中`char`类型和`string`对象在内存中的字节表示及其与字符编码的关系。`char`固定占用2字节并采用utf-16编码,而`string.getbytes()`方法返回的字节数组长度则取决于所使用的字符集,这正是导致常见混淆的关键。文章将通过示例代码和详细解释,阐明不同…

    2025年12月6日 java
    000
  • JavaScript内存泄漏检测与修复

    未清理的事件监听器、闭包引用大对象、全局变量滥用、定时器依赖外部作用域、DOM引用残留是JavaScript内存泄漏的五种典型场景。使用Chrome DevTools的Memory面板拍摄堆快照,对比操作前后对象数量变化,可发现Detached DOM trees等异常;通过Record alloc…

    2025年12月6日 web前端
    000
  • PHP URL处理函数_PHP URL解析与参数处理常用方法

    掌握PHP中parse_url、parse_str、http_build_query和urlencode函数可高效处理URL解析、参数提取与拼接;parse_url拆分URL为组件,parse_str将查询字符串转为数组,http_build_query将数组编码为查询字符串,urlencode和u…

    2025年12月6日 后端开发
    000
  • VSCode代码转换:编码格式处理

    遇到乱码时先查看文件编码,点击右下角编码名称选择“通过编码重新打开”,尝试 UTF-8、GBK 等常用编码以正确显示内容;2. 确认后可选择“通过编码保存”将文件转换为 UTF-8 等标准编码,便于跨平台协作;3. 为避免重复操作,可在设置中将 “files.encoding&#8221…

    2025年12月6日 开发工具
    000
  • VSCode快捷键:括号与缩进处理

    VSCode默认自动补全括号引号,可用Ctrl+Z撤销或设置中关闭;2. Enter或→可跳过自动闭合符号;3. Tab和Shift+Tab用于调整选中行的缩进;4. Shift+Alt+F格式化文件或选中代码,可设保存时自动格式化;5. 光标靠近括号时高亮匹配,Ctrl+Shift+快速跳转配对括…

    2025年12月6日 开发工具
    000
  • 在Java中如何压缩与解压ZIP文件

    Java通过java.util.zip包实现ZIP文件的压缩与解压,使用ZipOutputStream压缩文件、ZipInputStream解压文件,需注意路径安全、编码问题及资源管理。 Java提供了内置的工具来处理ZIP文件的压缩与解压,主要通过java.util.zip包中的类实现,如ZipI…

    2025年12月6日 java
    000
  • win11家庭版怎么开启组策略编辑器_Win11家庭版组策略编辑器开启方法

    Windows 11家庭版默认不包含组策略编辑器,可通过批处理脚本调用DISM命令安装缺失组件,或修改注册表解除MMC限制,亦可使用可信第三方工具部署gpedit.msc功能。 如果您尝试在Windows 11家庭版中使用组策略编辑器(gpedit.msc),但系统提示该功能不存在,则是因为家庭版本…

    2025年12月6日 系统教程
    000
  • 解决Outlook接收邮件时UTF-8编码显示异常的问题

    本文旨在帮助开发者解决在使用PHP发送邮件时,邮件内容在Outlook客户端中出现UTF-8编码显示异常的问题。通过分析问题原因,并结合实际代码示例,提供了一种有效的解决方案,确保邮件内容在各种邮件客户端中都能正确显示,避免出现乱码情况。 在使用PHP发送HTML邮件时,有时会遇到一个令人头疼的问题…

    2025年12月6日 后端开发
    000
  • 构建VSCode金融量化交易环境与实时数据回测

    搭建基于VSCode的金融量化交易环境需先配置Python及VSCode相关扩展,再创建虚拟环境并安装依赖;接着通过AKShare等工具接入历史与实时数据;随后使用Backtrader构建双均线策略并回测;最后对接实盘接口实现自动化交易,形成完整工作流。 搭建一个基于VSCode的金融量化交易环境,…

    2025年12月6日 开发工具
    000
  • 实现VSCode多模态编程界面与触控交互开发体验

    多模态编程通过融合触控、语音、手写等输入方式提升VSCode交互体验。1. 触控优化包括增大行高、使用Touch Bar Simulator扩展和自定义CSS提升操作精度;2. 手写识别可通过Ink Extension实现笔输入批注,结合MathPix转换公式为LaTeX;3. 语音控制借助Voic…

    2025年12月6日 开发工具
    000
  • PHP生成可被JavaScript解析的JSON对象教程

    本文旨在解决PHP中使用`json_encode`生成JSON数据,并将其传递给JavaScript客户端时,由于特殊字符导致`JSON.parse()`解析失败的问题。我们将探讨如何正确编码JSON数据,确保其在JavaScript中能够被顺利解析,并提供示例代码和注意事项,帮助开发者避免常见错误…

    2025年12月6日 后端开发
    000
  • OpenCSV CsvToBean解析带BOM头:ZWNBSP字符处理教程

    本文探讨了opencsv csvtobean 在处理csv文件头部包含零宽度不间断空格(zwnbsp,即bom)字符时遇到的解析问题。当csv文件以\ufeff字符开头时,opencsv可能无法正确匹配列名,导致字段值为null。教程提供了一种有效的临时解决方案:通过在@csvbindbyname注…

    2025年12月6日 java
    000
  • Java中三维数组的定义、初始化与遍历实战指南

    本文深入探讨了java中三维数组的定义、初始化及高效遍历方法。通过一个具体的客户账户交易数据处理案例,详细讲解了如何使用嵌套循环结合数组长度属性,准确访问和计算三维数组中的元素总和,旨在帮助开发者掌握三维数组的正确使用技巧,避免常见的索引错误和硬编码限制。 1. Java中三维数组的定义与初始化 在…

    2025年12月6日 java
    000

发表回复

登录后才能评论
关注微信