微软推出 “从错误中学习” 模型训练法，号称可“模仿人类学习过程，改善 AI 推理能力”

程序猿 • 2025年11月8日 06:49:44 • 用户投稿 • 阅读 0

微软亚洲研究院联合北京大学、西安交通大学等高校，最近提出了一种名为“从错误中学习（LeMA）”的人工智能训练方法。该方法声称能够通过模仿人类学习的过程，来提升人工智能的推理能力

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

当下 OpenAI GPT-4 和谷歌 aLM-2 等大语言模型在自然语言处理（NLP）任务，及思维链（chain-of-thought，CoT）推理的数学难题任务中都有不错的表现。

但例如 LLaMA-2 及 Baichuan-2 等开源大模型，在处理相关问题时则有待加强。为了提升开源这些大语言模型的思维链推理能力，研究团队提出了 LeMA 方法。这种方法主要是模仿人类的学习过程，通过“从错误中学习”，以改进模型的推理能力。

▲ 图源相关论文

本站发现，研究人员的方法是使用一对包含“错误解答”与“修正后正确答案”的数据来微调相关模型。为取得相关数据，研究人员收集了 5 个不同大语言模型（包括 LLaMA 及 GPT 系列）的错误答案和推理过程，再以 GPT-4 作为“订正者”，提供修正后的正确答案。

据悉，修正后的正确答案中包含三类信息，分别是原推理过程中错误片段、原推理过程出错的原因、以及如何修正原方法以获得正确答案。

研究人员使用GSM8K和MATH测试了LeMa训练法对5个开源大模型的效果。结果显示，在改进后的LLaMA-2-70B模型中，GSM8K的准确率分别为83.5%和81.4%，而MATH的准确率分别为25.0%和23.6%

目前研究人员已将 LeMA 的相关资料公开在 GitHub 上，感兴趣的小伙伴们可以点此跳转。

以上就是微软推出 “从错误中学习” 模型训练法，号称可“模仿人类学习过程，改善 AI 推理能力”的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/468980.html

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

开发一款普通的app软件需要走哪些流程？

上一篇 2025年11月8日 06:49:38

动态加载列表的结束判断方法

下一篇 2025年11月8日 06:49:47

好文分享

解决GPT-3.5 API生成无关代码的问题：优化模型选择与提示工程

在使用GPT-3.5 API构建应用时，text-davinci-003模型有时会生成不相关或意外的代码片段，尤其是在处理代码或复杂对话任务时。本文旨在解决这一问题，核心在于强调模型选择的重要性，推荐使用更适合此类任务的指令遵循模型（如gpt-3.5-turbo或gpt-4），并深入探讨如何通过精细…

程序猿
2025年12月20日
0000
好文分享

使用Schema文件：无需数据库连接生成SQL的LLM实践

本文旨在探讨如何在不建立实际数据库连接的情况下，利用大型语言模型（LLM）根据数据库Schema生成SQL语句。我们将重点介绍通过直接向LLM提供Schema描述来绕过传统数据库连接依赖的方法，并提供详细的实现步骤和代码示例，帮助开发者在保障安全性和灵活性的同时，实现高效的SQL生成。引言：SQL…

程序猿
2025年12月14日
0000
好文分享

基于Schema文件实现无数据库连接的SQL语句生成

本文探讨了在不直接连接数据库的情况下，如何利用数据库schema文件生成sql语句的方法。我们将重点介绍通过提供详细的数据库概览信息给大型语言模型（llm），实现基于schema的sql查询生成，从而避免实际数据库连接，提升安全性和灵活性。内容涵盖了如何准备schema信息以及其在llm驱动的sql…

程序猿
2025年12月14日
0000
好文分享

LLM驱动的无连接SQL生成：基于数据库模式文件的高效策略

本文探讨如何在不建立实际数据库连接的情况下，利用大型语言模型（LLM）从数据库模式文件生成SQL语句。文章将介绍通过提供详细的数据库概览（如DDL）给LLM进行SQL生成的方法，并讨论相关策略、实现考量及最佳实践，旨在实现安全、高效的SQL语句生成。引言：无连接SQL生成的需求与挑战在软件开发、…

程序猿
2025年12月14日
0000
好文分享

Python SyntaxError深度解析：REPL前缀与代码缩进陷阱

本文深入探讨python中常见的`syntaxerror`，特别是当代码从repl环境复制时，由于包含`>>>`和`…`前缀或不正确的代码缩进所导致的问题。文章将详细解释这些错误产生的原因，并提供清晰的解决方案，包括如何清理代码、修正缩进，以及优化条件逻辑，旨在帮助开发…

程序猿
2025年12月14日
1000
好文分享

使用 OpenAI Assistants API 调用异步函数

本文旨在解决在使用 OpenAI Assistants API 时，如何正确调用异步函数的问题。通过一个实际案例，我们将探讨如何检测函数是否为异步协程，并使用 asyncio.iscoroutinefunction 和 await 关键字来确保异步函数能够被正确执行。同时，提供了一个 execute…

程序猿
2025年12月14日
0000
好文分享

如何优化ChromaDB检索响应的完整性

在使用Langchain结合ChromaDB构建基于文档的问答系统时，用户有时会遇到检索到的响应不完整的情况，尤其是在处理大型或复杂PDF文档时。这通常不是ChromaDB本身的问题，而是文档处理、检索策略或问答链配置不当导致的。本文将详细介绍如何通过优化文档分块、调整检索器参数以及理解问答链机制来…

程序猿
2025年12月14日
0000
好文分享

OpenAI Python客户端迁移指南：解决API弃用问题

本文旨在解决OpenAI Python库中因API弃用导致的常见问题，指导用户将旧版openai.Completion.create和openai.Image.create等调用迁移至新版openai.OpenAI()客户端。教程将详细介绍如何更新文本生成和图像生成功能，并提供完整的代码示例及API…

程序猿
2025年12月14日
0000
好文分享

OpenAI Python API弃用错误及新版客户端迁移教程

本文旨在解决OpenAI Python库中openai.Completion等旧版接口弃用导致的错误。教程详细指导如何将现有代码迁移至最新版本的openai客户端，包括新客户端的初始化、API密钥的推荐管理方式，以及completions.create和images.generate等核心功能的调用…

程序猿
2025年12月14日
0000
用户投稿

理解OpenAI API限速：避免Assistants API中隐藏的请求陷阱

在使用OpenAI Assistants API时，即使看似已通过time.sleep()控制请求频率，用户仍可能遭遇意外的速率限制错误。核心原因在于，不仅主操作（如创建Run）会计入请求限额，连用于轮询Run状态的client.beta.threads.runs.retrieve()调用也同样计入…

程序猿
2025年12月14日
0000
用户投稿

Mira Network(MIRA)币是什么?MIRA代币经济与空投领取指南

币安(官方注册官方下载) Alpha 将成为首个上线9 月 26 日 Mira Network (MIRA)的平台！符合条件的用户可于 Alpha 交易开放后，前往 Alpha 活动页面使用币安 Alpha 积分领取空投。具体详情将另行公布。敬请关注币安官方渠道，及时获取活动最新动态。 Mir…

程序猿
2025年12月11日
0000
用户投稿

什么是 AI 加密货币交易机器人？从进程化到智能化（发展历程介绍）

从早期的规则型机器人到能自我学习的 ai 系统，了解人工智能如何以速度与精准度主导加密交易市场。 Binance币安欧易OKX ️ Huobi火币️ 什么是 AI 加密货币交易机器人？与传统机器人有何不同？ AI 加密货币交易机器人代表着自动化交易的一大转变。这些系统利用机器学习算法与高端数学模型…

程序猿
2025年12月9日
1000
用户投稿

HiDream-I1— 智象未来开源的文生图模型

hidream-i1：一款强大的开源图像生成模型 HiDream-I1是由HiDream.ai团队开发的17亿参数开源图像生成模型，采用MIT许可证，在图像质量和对提示词的理解方面表现卓越。它支持多种风格，包括写实、卡通和艺术风格，广泛应用于艺术创作、商业设计、科研教育以及娱乐媒体等领域。 HiDr…

程序猿
2025年12月5日
1000
AI Video Transcriber— 开源的AI视频转录和总结工具

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 叮当好记-AI音视频转图文 AI音视频转录与总结，内容学习效率 x10！ 193 查看详情 AI Video Transcriber是什么 ai video transcriber 是一款开源的…

程序猿
2025年12月4日 • 用户投稿
0000
RL 是推理神器？清华上交大最新研究指出：RL 让大模型更会“套公式”、却不会真推理

清华和上交的最新论文中，上演了一场“学术打假”的戏码。文中研究者们对当前“纯 rl 有利于提升模型推理能力”的主流观点提出了相反的意见。通过一系列实验，他们证明引入强化学习的模型在某些任务中的表现，竟然不如未使用强化学习的模型。论文批判性地探讨了 RLVR 在提升 LLM 推理能力方面的作用，尤…

程序猿
2025年12月3日 • 用户投稿
2000
DuckDuckGo搜索引擎入口2025 DuckDuckGo引擎无需登录快速访问

DuckDuckGo的官方入口就是其主网站，直接访问即可使用，无需注册或登录。2025年，它在保护隐私的基础上，还推出了AI辅助功能，让搜索更高效。官网地址与快速访问打开浏览器，在地址栏输入 https://duckduckgo.com 就能直达。这个链接是官方唯一主入口，安全可靠。你可以把它添…

程序猿
2025年12月2日 • 用户投稿
0000
DuckDuckGo搜索官方直链入口 DuckDuckGo引擎免费浏览器登录地址

DuckDuckGo 是一个主打隐私保护的搜索引擎和浏览器，它不追踪用户搜索记录、不收集个人数据，也没有复杂的登录系统。因此，不存在传统意义上的“登录地址”或需要账户才能使用的“官方直链入口”。官网主页就是核心入口所有服务都通过其主站提供，直接访问即可使用：官方网站：https://duckd…

程序猿
2025年12月2日 • 用户投稿
0000
DuckDuckGo搜索引擎最新入口无需登录DuckDuckGo引擎官方访问

DuckDuckGo搜索引擎无需登录即可直接使用，主打隐私保护，不会追踪用户搜索记录。最新官方入口始终是其主域名，访问稳定且支持全球用户。官方访问地址 https://duckduckgo.com 是DuckDuckGo搜索引擎的官方网站和主要入口。无论在电脑浏览器还是手机上，输入该网址即可进入，…

程序猿
2025年12月2日 • 用户投稿
0000
DuckDuckGo引擎入口在哪里 DuckDuckGo搜索免费直链快速进入

DuckDuckGo的官方入口是其官网，可以直接访问使用，完全免费且无需注册。这个搜索引擎主打隐私保护，打开链接就能搜，过程简单直接。官方网站地址进入DuckDuckGo最直接的方式就是访问它的官网： https://duckduckgo.com 这是它的主站，所有功能都从这里开始。你可以在手机…

程序猿
2025年12月2日 • 用户投稿
0000
DuckDuckGo搜索引擎官方登录入口 DuckDuckGo引擎2025无需登录链接

DuckDuckGo 搜索引擎本身不需要登录，也没有传统意义上的“官方登录入口”。你访问它的网站或使用其应用时，直接就可以进行搜索，所有操作都是匿名的，不会记录你的个人信息。无需登录的搜索链接 DuckDuckGo 的核心设计就是保护用户隐私，因此它不提供也不需要用户账号系统。你在任何设备上打开下…

程序猿
2025年12月2日 • 用户投稿
2000

发表回复

登录后才能评论

微软推出 “从错误中学习” 模型训练法，号称可“模仿人类学习过程，改善 AI 推理能力”

关于作者

相关推荐

发表回复