follow_第19页

AI学会隐藏思维暗中推理！不依赖人类经验解决复杂任务，更黑箱了

ai做数学题，真正的思考居然是暗中“心算”的？纽约大学团队新研究发现，即使不让AI写步骤，全用无意义的“……”代替，在一些复杂任务上的表现也能大幅提升！一作Jacab Pfau表示：只要花费算力生成额外token就能带来优势，具体选择了什么token无关紧要。 ☞☞☞AI 智能聊天, 问答助手,…

程序猿

2025年11月7日 • 用户投稿

2000

ICLR 2024 Spotlight | NoiseDiffusion: 矫正扩散模型噪声，提高插值图片质量

作者 | pengfei zheng 单位 | USTC, HKBU TMLR Group 近年来，生成AI的迅猛发展为文本到图像生成、视频生成等令人瞩目的领域注入了强大的动力。这些技术的核心在于扩散模型的应用。扩散模型首先通过定义一个不断加噪声的前向过程来将图片逐步变为高斯噪声，再通过逆向过程将高…

程序猿

2025年11月7日 • 用户投稿

2000

爆火后反转？「一夜干掉MLP」的KAN：其实我也是MLP

多层感知器（MLP），也被称为全连接前馈神经网络，是如今深度学习模型的基础构建块。MLP 的重要性无论如何强调都不为过，因为它们是机器学习中用于逼近非线性函数的默认方法。但是最近，来自 MIT 等机构的研究者提出了一种非常有潜力的替代方法 ——KAN。该方法在准确性和可解释性方面表现优于 MLP。…

程序猿

2025年11月7日 • 用户投稿

0000

全球最强开源 MoE 模型来了，中文能力比肩 GPT-4，价格仅为 GPT-4-Turbo 的近百分之一

想象一下，一个人工智能模型，不仅拥有超越传统计算的能力，还能以更低的成本实现更高效的性能。这不是科幻，deepseek-v2[1]，全球最强开源 moe 模型来了。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ DeepSeek-V2 是一…

程序猿

2025年11月7日 • 用户投稿

0000

闭源赶超GPT-4 Turbo、开源击败Llama-3-70B，歪果仁：这中国大模型真香

在发布一周年之际，阿里云通义千问大模型在闭源和开源领域都交上了一份满意的答卷。国内的开发者们或许没有想到，有朝一日，他们开发的 AI 大模型会像出海的网文、短剧一样，让世界各地的网友坐等更新。甚至，来自韩国的网友已经开始反思：为什么我们就没有这样的模型？这个「别人家的孩子」就是阿里云的通义千问（…

程序猿

2025年11月7日 • 用户投稿

2000

快多个数量级，清华更高精度、更泛化的深度学习电子结构计算方法登Nature子刊

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 编辑 | KX 两年前，清华大学物理系徐勇、段文晖研究组开发出高效精确的第一性原理电子结构深度学习方法 DeePH，可极大加速电子结构计算。近日，该团队开发了一种准确而有效的实空间重构方法（r…

程序猿

2025年11月7日 • 用户投稿

0000

OpenAI今天Open了一下：开源多智能体框架Swarm

毫无疑问，多智能体肯定是 openai 未来重要的研究方向之一，前些天 openai 著名研究科学家 noam brown 还在 x 上为 openai 正在组建的一个新的多智能体研究团队招募机器学习工程师。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R…

程序猿

2025年11月7日 • 用户投稿

0000