训练_第3页_创想鸟

陈丹琦团队创新之作：以5%成本取得SOTA，掀起“羊驼剪毛”大法热潮

只用3%的计算量、5%的成本取得sota，统治了1b-3b规模的开源大模型。这一成果来自普林斯顿陈丹琦团队，名为LLM-Shearing大模型剪枝法。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 以羊驼LLaMA 2 7B为基础，通过定…

程序猿

2025年11月26日 • 用户投稿

1000

数学逻辑和计算机程序代码之间的深层联系：互为镜像

一些科学发现被赋予了重要的意义，因为揭示了一些新的东西，比如 DNA 的双螺旋结构或黑洞的存在。但是，揭示出的这些东西还具有更深远的意义，因为它们表明：两个之前看起来大不一样的老旧概念事实上却是一样的。比如詹姆斯・克拉克・麦克斯韦发现的方程组表明，电与磁是同一个现象的两个不同方面，而广义相对论则把引…

程序猿

用户投稿 2025年11月26日

0000

规模小、效率高：DeepMind推出多模态解决方案Mirasol 3B

多模态学习面临的主要挑战之一是需要融合文本、音频、视频等异构的模态，多模态模型需要组合不同来源的信号。然而，这些模态具有不同的特征，很难通过单一模型来组合。例如，视频和文本具有不同的采样率最近，来自 Google DeepMind 的研究团队将多模态模型解耦成多个独立的、专门的自回归模型，根据各种…

程序猿

2025年11月26日 • 用户投稿

0000

让3D编辑像PS一样简单，新算法GaussianEditor在几分钟内完成3D场景增删改

3D 编辑在游戏和虚拟现实等领域中发挥着至关重要的作用，然而之前的 3D 编辑苦于耗时间长以及可控性差等问题，很难应用到实际场景。近日，南洋理工大学联合清华和商汤提出了一种全新的 3D 编辑算法 GaussianEditor，首次实现了在 2-7 分钟完成对 3D 场景可控的多样化的编辑，全面超越了…

程序猿

2025年11月26日 • 用户投稿

0000

创业180天估值20亿美元！欧版OpenAI爆火，Llama主创自立门户，英伟达都入股了

“欧洲版openai”最新估值，逼近20亿美元！总部位于巴黎的大模型初创公司Mistral AI最新一轮融资，4.87亿美元。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 投资方为安德森·霍洛维茨、英伟达、Salesforce等。其中…

程序猿

2025年11月26日 • 用户投稿

7000

新一代注意力机制Lightning Attention-2：无限序列长度、恒定算力开销、更高建模精度

当前大语言模型的应用受到了序列长度限制的制约，这限制了其在人工智能领域中的应用。例如，在多轮对话、长文本理解和多模态数据处理与生成方面存在一定的挑战。造成这种限制的根本原因是目前大语言模型普遍采用的Transformer架构，其计算复杂度与序列长度呈二次关系。因此，随着序列长度的增加，计算资源的需求…

程序猿

2025年11月26日 • 用户投稿

1000

Agent像人一样分工协作，还能“群聊”交换信息

智能体也要有“规范手册”！一项名为MetaGPT的研究，通过对智能体角色进行明确分工，并要求多个智能体在协作中采用统一规范的“交流格式”等方法，让智能体性能大增。目前，这项研究在GitHub上已狂揽33.6k星，并在深度学习顶会ICLR 2024上被收录为Oral论文。 ☞☞☞AI 智能聊天, …

程序猿

2025年11月26日 • 用户投稿

1000

李飞飞揭秘创业方向“空间智能”：视觉化为洞察，看见成为理解，理解导致行动

斯坦福李飞飞创业后，首次揭秘新概念“空间智能”。这不仅是她的创业方向，也是指引她的“北极星”，被她认为是“解决人工智能难题的关键拼图”。视觉化为洞察；看见成为理解；理解导致行动。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 在李飞飞1…

程序猿

2025年11月26日 • 用户投稿

2000

特斯拉 Optimus 机器人训练新进展 : 通过摄像头采集数据

11 月 3 日，有消息指出，特斯拉正在加速推进其 optimus 人形机器人项目的训练进程，并为此专门成立了一支数据采集小组，目标是让 optimus 能够实现与人类相似的自然、流畅动作。特斯拉 Optimus 机器人据 CNMO 获悉，在每次长达 8 小时的工作班次中，数据采集人员需反复执行…

程序猿

2025年11月24日 • 用户投稿

1000

用户投稿

华为推出准万亿参数盘古 Ultra MoE 模型全流程在昇腾 AI 平台训练

5 月 30 日，华为推出了全新的 AI 模型——盘古 Ultra MoE，该模型的参数量达到了 7180 亿。作为一款接近万亿参数的 MoE ( Mixture of Experts ) 模型，它在整个训练过程中完全基于华为的昇腾 AI 平台完成，标志着华为在超大规模模型训练方面取得了重要进展。 …

程序猿

2025年11月17日

1000