devin
-
GPT-4单项仅得7.1分,揭露大模型代码能力三大短板,最新基准测试来了
首个ai软件工程师devin正式亮相,立即引爆了整个技术界。 Devin虽然不能够轻松解决编码任务,但可以自主完成软件开发的整个周期——从项目规划到部署。他尽力挖掘,但不限于构建网站、自主寻找并修复BUG、培训和微调AI模型等。 这种 “强到逆天” 的软件开发能力,让一众码农纷纷绝望,直呼:“程序员…
-
登顶开源AI软件工程师榜首,UIUC无Agent方案轻松解决SWE-bench真实编程问题
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@ji…
-
开源版AI程序员来了:GPT-4加持,能力比肩Devin,一天1.4k Star
想了解更多AIGC的内容,请访问: 51cto ai.x社区 https://www.51cto.com/aigc/ 最近,有很多人在为 AI 代替自己的工作而担忧。 上个月火遍AI圈的「首位 AI 程序员」Devin,利用大模型能力已经掌握了全栈技能,仅需要人类给出自然语言指令,就可以自动完成复杂…
-
AI程序员哪家强?探索Devin、通义灵码和SWE-agent的潜力
2022年3月3日,距世界首个AI程序员Devin诞生不足一个月,普林斯顿大学的NLP团队开发了一个开源AI程序员SWE-agent。它利用GPT-4模型在GitHub存储库中自动解决问题。SWE-agent在SWE-bench测试集上的表现与Devin相似,平均耗时93秒,解决了12.29%的问题…
-
编程的“Devin AI 时代”,软件开发者的喜与忧
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 作者 | Keith Pitt 编译 | 伊风 出品 | 51CTO技术栈(微信号:blog51cto) 这篇文章的作者基思-皮特(Keith Pitt),是一家软件开发公司Buildkite的…
-
GitHub版Devin上线,会打字就能开发应用,微软CEO:重新定义IDE
微软的“github版devin”——copilot workspace,终于上线了! WorkSpace是一种“Copilot原生”的全新开发环境,目的是让所有开发者都可以用自然语言,把脑海里的创意转化成应用。 也就是说,只要有想法,而且会打字,就可以搞软件开发了。 ☞☞☞AI 智能聊天, 问答助…