月之暗面(moonshot ai)近日推出了一款名为 k2 vendor verifier(k2vv) 的开源工具。该项目专注于帮助开发者更直观地评估各类推理服务提供商在工具调用(tool call)任务中的准确率表现。
团队注意到,尽管多个 API 服务商均宣称基于 Kimi K2 开源模型提供服务,但在实际的工具调用能力上却存在显著差异。为此,月之暗面开展了系统性测试,并决定将测试工具开源,以提升行业透明度。

目前,该工具已接入模型聚合平台 OpenRouter。用户可通过其提供的可视化界面,实时查看各服务商的性能对比数据,并据此选择最符合自身应用需求的后端支持。
AppMall应用商店
AI应用商店,提供即时交付、按需付费的人工智能应用服务
56 查看详情
项目开源地址:https://www.php.cn/link/4992f85f02e4d718826650c96219875d
以上就是月之暗面开源 K2 Vendor Verifier,用于评估 API 供应商的调用能力的详细内容,更多请关注创想鸟其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/216380.html
微信扫一扫
支付宝扫一扫