OpenAI今天Open了一下:开源多智能体框架Swarm

毫无疑问,多智能体肯定是 openai 未来重要的研究方向之一,前些天 openai 著名研究科学家 noam brown 还在 x 上为 openai 正在组建的一个新的多智能体研究团队招募机器学习工程师。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

OpenAI今天Open了一下:开源多智能体框架Swarm

就在几个小时前,这个或许还没有组建完成的新研究团队就已经开源发布了一项重量级研究成果:Swarm。这是一个实验性质的多智能体编排框架,主打特征是工效(ergonomic)与轻量(lightweight)。

OpenAI今天Open了一下:开源多智能体框架Swarm

项目地址:https://github.com/openai/swarm
Swarm 开源后引起了热烈讨论,有网友表示这能帮助简化许多潜在的多智能体用例的工作流程。

OpenAI今天Open了一下:开源多智能体框架Swarm

我们先来看一个例子。首先安装 Swarm,很简单:
pip install git+ssh://git@github.com/openai/swarm.git
装好这个框架之后,用起来也很方便。以下代码定义了 2 个智能体,而用户的指令是与智能体 B 交谈:
from swarm import Swarm, Agentclient = Swarm()def transfer_to_agent_b():return agent_bagent_a = Agent(name="Agent A",instructions="You are a helpful agent.",functions=[transfer_to_agent_b],)agent_b = Agent(name="Agent B",instructions="Only speak in Haikus.",)response = client.run(agent=agent_a,messages=[{"role": "user", "content": "I want to talk to agent B."}],)print(response.messages[-1]["content"])
输出消息:
Hope glimmers brightly,New paths converge gracefully,What can I assist?
下面我们就来简单介绍一下这个开源项目。
首先,需要再次强调,Swarm 是一个实验性质的多智能体框架,并不是为生产目的开发的,因此团队表示不会提供任何官方支持。
Swarm 概况
Swarm 关注的重点是让智能体协作和执行变得轻量、高度可控且易于测试。
为此,它使用了两种原语抽象:智能体(agent)交接(handoff)。其中,智能体包含指令和工具,并且在任何时间都可以选择将对话交接给另一个智能体。
该团队表示,这些原语很强大,「足以表达工具和智能体网络之间的丰富动态,让你可以针对真实世界问题构建可扩展的解决方案,同时避免陡峭的学习曲线。」
另外,该团队指出,请注意 Swarm 智能体与 Assistants API 中的 Assistants 无关。之所以名字相似,只是为了方便。Swarm 完全由 Chat Completions API 提供支持,因此在调用之间是无状态的。
为什么要使用 Swarm?
在设计上,Swarm 是轻量级、可扩展且高度可定制的。它最适合处理存在大量独立功能和指令的情况——这些功能和指令很难编码成单个提示词。
如果开发者想要寻求完全托管的线程以及内置的内存管理和检索,那么 Assistants API 就已经是很好的选择了。但如果开发者想要完全的透明度,并且能够细粒度地控制上下文、步骤和工具调用,那么 Swarm 才是最佳选择。Swarm (几乎)完全运行在客户端,与 Chat Completions API 非常相似,不会在调用之间存储状态。
该团队还展示了一个应用示例,包括天气查询智能体、用于在航空公司环境中处理不同客户服务请求的多智能体设置、客服机器人、可以帮助销售和退款的个人智能体等。具体示例请访问 Swarm 代码库。

OpenAI今天Open了一下:开源多智能体框架Swarm

文心智能体平台 文心智能体平台

百度推出的基于文心大模型的Agent智能体平台,已上架2000+AI智能体

文心智能体平台 0 查看详情 文心智能体平台

                                              简单的天气查询智能体示例,问题先经过筛选智能体处理,再转交给天气智能体解答
Swarm 的核心组件
Swarm 的核心组件包括 client(客户端)、Agent(智能体)、Function(函数)。
运行 Swarm 就是从实例化一个 client 开始的(其就是在内部实例化一个 OpenAI 客户端)。
from swarm import Swarmclient = Swarm()
client.run()
Swarm 的 run() 函数类似于 Chat Completions API 中的 chat.completions.create() 函数——接收消息并返回消息,并且在调用之间不保存任何状态。但重点在于,它还处理 Agent 函数执行、交接、上下文变量引用,并且可以在返回给用户之前进行多轮执行。
究其核心,Swarm 的 client.run() 是实现以下循环:
先让当前智能体完成一个结果
执行工具调用并附加结果
如有必要,切换智能体
如有必要,更新上下文变量
如果没有新的函数调用,则返回
参数
client.run() 的参数包括:

OpenAI今天Open了一下:开源多智能体框架Swarm

client.run() 完成后(可能进行过多次智能体和工具调用),会返回一个响应,其中包含所有相关的已更新状态。具体来说,即包含新消息、最后调用的智能体、最新的上下文变量。你可以将这些值(加上新的用户消息)传递给 client.run() 的下一次执行,以继续上次的交互——就像是 chat.completions.create()

响应字段

OpenAI今天Open了一下:开源多智能体框架Swarm

Agent
Agent(智能体)就是将一组指令与一组函数封装在一起(再加上一些额外的设置),并且其有能力将执行过程交接给另一个 Agent。
Agent 字段

OpenAI今天Open了一下:开源多智能体框架Swarm

指令(instructions)
Agent instructions 会直接转换成对话的系统提示词(作为第一条消息)。只有当前活动的 Agent 的指令会被使用(当发生智能体交接时,系统提示词会变化,但聊天历史不会)。
agent = Agent(instructions="You are a helpful agent.")
instructions 可以是常规字符串,也可以是返回字符串的函数。该函数可以选择性地接收 context_variables 参数,该参数将由传入 client.run() 的 context_variables 填充。
def instructions(context_variables):user_name = context_variables["user_name"]return f"Help the user, {user_name}, do whatever they want."agent = Agent(instructions=instructions)response = client.run(agent=agent,messages=[{"role":"user", "content": "Hi!"}],context_variables={"user_name":"John"})print(response.messages[-1]["content"])
输出消息:
Hi John, how can I assist you today?
Function
Swarm Agent 可以直接调用 Python 函数。
函数通常应返回一个字符串(数值会被转换为字符串)。
如果一个函数返回了一个 Agent,则执行过程将转交给该 Agent。
如果函数定义了 context_variables 参数,则它将由传递到 client.run() 的 context_variables 填充。
def greet(context_variables, language):user_name = context_variables["user_name"]greeting = "Hola" if language.lower() == "spanish" else "Hello"print(f"{greeting}, {user_name}!")return "Done"agent = Agent(functions=[print_hello])client.run(agent=agent,messages=[{"role": "user", "content": "Usa greet() por favor."}],context_variables={"user_name": "John"})
输出消息:
Hola, John!如果某个 Agent 函数调用出错(缺少函数、参数错误等),则会在聊天之中附加一条报错响应,以便 Agent 恢复正常。如果 Ageny 调用多个函数,则按顺序执行它们。交接和更新上下文变量通过在返回的函数中包含一个 Agent,可将执行过程交接给这个 Agent。sales_agent = Agent(name="Sales Agent")def transfer_to_sales():return sales_agentagent = Agent(functions=[transfer_to_sales])response = client.run(agent, [{"role":"user", "content":"Transfer me to sales."}])print(response.agent.name)
输出消息:
Sales Agent
它还可以通过返回更完整的 Result 对象来更新 context_variables。如果你希望用单个函数返回一个值、更新智能体并更新上下文变量(或三者中的任何组合),它还可以包含一个 value 和一个 agent。
sales_agent = Agent(name="Sales Agent")def talk_to_sales():print("Hello, World!")return Result(value="Done",agent=sales_agent,context_variables={"department": "sales"})agent = Agent(functions=[talk_to_sales])response = client.run(agent=agent,messages=[{"role": "user", "content": "Transfer me to sales"}],context_variables={"user_name": "John"})print(response.agent.name)print(response.context_variables)
输出消息:
Sales Agent{'department': 'sales', 'user_name': 'John'}
注意:如果一个 Agent 调用了多个交接 Agent 的函数,则仅使用最后一个交接函数。
函数模式
Swarm 会自动将函数转换为 JSON 模式,然后将其传递给聊天补全工具。
文档字符串会转换为函数 description。
没有默认值的参数会设置为 required。
类型提示会映射到参数的 type(默认为 string)。
不明确支持对每个参数进行描述,但如果只是在文档字符串中添加,应该能以相似的方式工作。
def greet(name, age: int, location: str = "New York"):"""Greets the user. Make sure to get their name and age before calling.Args:name: Name of the user.age: Age of the user.location: Best place on earth."""print(f"Hello {name}, glad you are {age} in {location}!"){"type": "function","function": {"name": "greet","description": "Greets the user. Make sure to get their name and age before calling.nnArgs:n name: Name of the user.n age: Age of the user.n location: Best place on earth.","parameters": {"type": "object","properties": {"name": {"type": "string"},"age": {"type": "integer"},"location": {"type": "string"}},"required": ["name", "age"]}}}
流式处理
Swarm 也支持流式处理。
stream = client.run(agent, messages, stream=True)for chunk in stream:print(chunk)
使用了与 Chat Completions API streaming 一样的事件,但添加了两个事件类型:
{“delim”:”start”} 和 {“delim”:”start”},用于在 Agent 每次处理单个消息(响应或函数调用)时发出信号。这有助于识别 Agent 之间的切换。
为方便起见,{“response”: Response} 将在流的末尾返回带有已聚合的(完整)响应的 Response 对象。
核心贡献者
Swarm 的核心贡献者均就职于 OpenAI,他们分别是(右侧为对应的 GitHub 用户名):
Ilan Bigio – ibigio
James Hills – jhills20
Shyamal Anadkat – shyamal-anadkat
Charu Jaiswal – charuj
Colin Jarvis – colin-openai

以上就是OpenAI今天Open了一下:开源多智能体框架Swarm的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/416690.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月7日 01:34:44
下一篇 2025年11月7日 01:37:07

相关推荐

  • Yii框架的CVE漏洞修复与版本升级

    yii框架的cve漏洞可以通过应用补丁或升级版本来修复。具体步骤包括:1. 监控yii官方博客和github仓库的安全公告。2. 及时应用针对特定cve的补丁。3. 考虑升级到包含cve修复的新版本,升级前在测试环境中备份和测试。4. 升级后进行全面功能测试,确保cve已修复。5. 检查和管理第三方…

    2025年12月5日
    500
  • HiDream-I1— 智象未来开源的文生图模型

    hidream-i1:一款强大的开源图像生成模型 HiDream-I1是由HiDream.ai团队开发的17亿参数开源图像生成模型,采用MIT许可证,在图像质量和对提示词的理解方面表现卓越。它支持多种风格,包括写实、卡通和艺术风格,广泛应用于艺术创作、商业设计、科研教育以及娱乐媒体等领域。 HiDr…

    2025年12月5日
    000
  • JS怎么实现平滑页面锚点跳转 4种锚点跳转技巧让页面滚动更优雅

    页面锚点跳转平滑滚动可通过多种方法实现。1. 使用scrollintoview方法,通过设置behavior: ‘smooth’实现简单平滑滚动;2. 利用scrollto方法控制滚动位置并设置行为为平滑;3. 自定义动画函数实现更个性化效果,包含缓动函数控制速度变化;4. …

    2025年12月5日 web前端
    000
  • PHP move_uploaded_file 失败:权限问题解析与解决方案

    本文详细解析了PHP中使用move_uploaded_file函数上传文件时,因Permission denied错误导致文件保存失败的常见问题。教程将深入探讨该错误的根本原因——目标目录的写入权限不足,并提供了针对Linux/Unix系统下文件权限配置的实用解决方案,确保PHP文件上传功能稳定运行…

    2025年12月5日
    000
  • Google My Business API:PHP客户端正确使用readMask获取地点列表

    本教程旨在解决使用Google My Business Business Information API PHP客户端获取地点列表时,因readMask参数格式不正确导致的INVALID_ARGUMENT错误。文章将详细解释readMask字段的正确用法,指出其应指定地点资源的有效属性,而非用户或照…

    2025年12月5日
    100
  • JavaScript数字格式化中意外空格问题的解决方案

    本文旨在解决JavaScript中处理用户输入时,因意外的空白字符导致数字格式化功能出现异常的问题。通过引入String.prototype.trim()方法,我们能够有效地清除输入字符串首尾的空白,确保Intl.NumberFormat等格式化工具能正确处理纯数字内容,从而提升数据处理的准确性和用…

    2025年12月5日
    000
  • 怎么新建Python文件VSCode_VSCode创建Python文件教程

    答案:在VS Code中新建Python文件需打开软件后创建新文件并保存为.py格式,系统将自动启用Python语言服务。可通过快捷键Ctrl+N(Cmd+N)新建文件,再用Ctrl+S(Cmd+S)保存为.py文件以激活语法高亮和代码补全功能;也可通过菜单栏或资源管理器新建文件。为确保正常运行,需…

    2025年12月5日
    000
  • 如何安装和配置ThinkPHP开发环境?

    如何安装和配置thinkphp开发环境?首先,安装php 7.2+和web服务器(如xampp或wamp);其次,使用composer安装thinkphp框架;最后,配置应用和web服务器指向thinkphp的public目录。 在开始我们的ThinkPHP之旅前,让我们先回答一个关键问题:如何安装…

    2025年12月5日
    000
  • Composer如何处理fork的包_使用自定义分支代码库

    Composer优先使用fork包需在repositories中先声明fork的VCS地址,并在require中指定dev-分支名,确保顺序和分支明确,修改后运行composer update即可同步代码。 Composer如何处理fork的包?简单来说,Composer允许你使用fork的包,甚至…

    2025年12月5日
    000
  • 生产环境错误日志的监控与分析

    有效进行错误日志的监控与分析需要以下步骤:1. 使用高效的日志收集系统,如elk stack。2. 实时监控日志,使用kibana dashboard设置警报。3. 分析错误类型、频率和上下文,定位问题。4. 定期回顾和分析日志,积累经验并优化系统。 在生产环境中,错误日志的监控与分析是一项至关重要…

    2025年12月5日
    000
  • PHP一键环境与Docker容器化有什么区别_技术异同分析

    PHP一键环境与Docker本质区别在于封装与隔离方式:前者将服务直接安装于系统,多项目共用环境易冲突,适合新手和简单项目;后者通过容器镜像打包应用及依赖,实现环境隔离与一致,便于迁移和团队协作;一键环境部署直观但可移植性差,Docker学习成本高却支持自动化部署;资源上前者更轻量,后者虽有损耗但利…

    2025年12月5日
    000
  • 如何在Laravel中实现权限管理

    1.spatie/laravel-permission包提供rbac与pbac混合模型,支持角色权限分配、权限检查及与laravel gates/policies无缝集成;2.结合laravel policies可实现基于模型实例的细粒度控制,如限制用户仅能编辑自己的文章;3.blade模板中使用@…

    2025年12月5日
    000
  • PDF批量转Word怎么弄_PDF批量转Word的批量处理方法

    使用专业软件、在线网站或Python脚本可批量将多个PDF转换为Word文档,提升效率并保留排版,操作时需注意文件安全与备份。 如果您需要将多个PDF文件转换为Word文档,手动逐个转换会耗费大量时间。通过批量处理方法,可以高效完成多个PDF文件向Word格式的转换。以下是几种可行的操作方式: 一、…

    2025年12月5日
    000
  • DevDocs— 开源的技术文档爬取和处理工具

    devdocs:程序员和ai开发者的效率利器 DevDocs是一款开源的技术文档爬取与处理工具,专为程序员和AI开发者打造。它利用智能爬虫技术,高效地收集和整理技术文档,将原本需要数周才能完成的任务缩短至数小时。DevDocs支持多线程爬取,速度快,并能自动识别和处理网站链接,支持1-5层深度爬取。…

    2025年12月5日
    000
  • packagist和composer是什么关系_Packagist作为Composer默认仓库的角色解读

    Composer是PHP依赖管理工具,通过composer.json声明依赖并安装;Packagist是其默认包仓库,提供公开库的索引与分发;两者协同工作,支持自定义源和私有仓库配置,实现高效、灵活的项目依赖管理。 如果您在使用PHP进行开发,并希望高效地管理项目依赖,可能会遇到Packagist和…

    2025年12月5日
    000
  • 如何在Laravel中执行数据库迁移

    laravel数据库迁移通过php代码管理数据库结构变更,提供版本控制功能。1. 创建迁移文件:使用artisan命令生成带时间戳的迁移文件并定义up()和down()方法;2. 执行迁移:运行migrate命令按顺序执行未应用的迁移;3. 回滚迁移:使用rollback撤销最近一次迁移,refre…

    2025年12月5日
    000
  • Java中如何实现限流 掌握流量控制

    在java中实现限流的方法主要包括计数器算法、滑动窗口算法、漏桶算法、令牌桶算法以及使用guava ratelimiter。1. 计数器算法通过设定时间窗口和请求数量进行限制,优点是实现简单,缺点是可能存在“突刺”问题;2. 滑动窗口算法将时间窗口细化,避免了“突刺”,效果更平滑但实现较复杂;3. …

    2025年12月5日 java
    000
  • Composer如何降级一个包的版本_回滚到旧版依赖的操作方法

    要回滚Composer包版本,需修改composer.json中对应包的版本约束,执行composer update vendor/package进行降级。直接修改可能因依赖冲突失败,因Composer需确保整体依赖兼容。常见问题包括API不兼容、配置变更、传递性依赖冲突及缓存问题,可用compos…

    2025年12月5日
    000
  • Composer如何管理项目根目录外的依赖_多项目共享本地包的方法

    通过配置composer.json的path类型仓库,Composer可管理项目根目录外的依赖,实现多项目共享本地包。具体做法是将共享代码作为独立包放在外部目录并编写composer.json,然后在主项目中通过repositories指定其路径,再使用require引入。安装时默认创建符号链接(s…

    2025年12月5日
    000
  • VSCode怎么更改鼠标颜色_VSCode自定义鼠标指针颜色与光标样式设置教程

    VSCode无法更改系统鼠标指针颜色,但可自定义编辑器内文本光标样式、颜色及行为。通过修改settings.json文件,可设置光标样式(如line、block、underline)、宽度、闪烁方式(如blink、smooth、solid)、颜色(via workbench.colorCustomi…

    2025年12月5日
    000

发表回复

登录后才能评论
关注微信