模型
-
Python团队还没解散完,谷歌又对Flutter、Dart动手了
上周,「谷歌解雇 Python 基础团队」的消息引发热议。 “谷歌 Python 指导委员会成员 Thomas Wouters 的一条动态让所有人感到惊讶:「当与你直接共事的每个人,包括你的主管,都被裁员——哦,是职位被削减,而你被要求安排他们的替代者入职,这些人被告知在不同的国家担任同样的职位,但…
-
「非常接近GPT-4」的WizardLM-2被微软紧急撤回,有什么内幕?
前段时间,微软搞了个乌龙:隆重地开源了 WizardLM-2,又在不久后撤回得干干净净。 目前可查询的 WizardLM-2 发布信息,这是一个“真正媲美 GPT-4”的开源大模型,在复杂聊天、多语言、推理和代理方面的性能得到了提高。 该系列包括三个模型:WizardLM-2 8x22B、Wizar…
-
史上最大重建25km²!NeRF-XL:真正有效利用多卡联合训练!
原标题:nerf-xl: scaling nerfs with multiple gpus 论文链接:https://research.nvidia.com/labs/toronto-ai/nerfxl/assets/nerfxl.pdf 项目链接:https://research.nvidia.c…
-
GitHub版Devin上线,会打字就能开发应用,微软CEO:重新定义IDE
微软的“github版devin”——copilot workspace,终于上线了! WorkSpace是一种“Copilot原生”的全新开发环境,目的是让所有开发者都可以用自然语言,把脑海里的创意转化成应用。 也就是说,只要有想法,而且会打字,就可以搞软件开发了。 ☞☞☞AI 智能聊天, 问答助…
-
小红书让智能体们吵起来了!联合复旦推出大模型专属群聊工具
语言,不仅仅是文字的堆砌,更是表情包的狂欢,是梗的海洋,是键盘侠的战场(嗯?哪里不对)。 语言如何塑造我们的社会行为? 我们的社会结构又是如何在不断的言语交流中演变的? 近期,来自复旦大学和小红书的研究者们通过引入一种名为AgentGroupChat的模拟平台,对这些问题进行了深入探讨。 Whats…
-
AI学会隐藏思维暗中推理!不依赖人类经验解决复杂任务,更黑箱了
ai做数学题,真正的思考居然是暗中“心算”的? 纽约大学团队新研究发现,即使不让AI写步骤,全用无意义的“……”代替,在一些复杂任务上的表现也能大幅提升! 一作Jacab Pfau表示:只要花费算力生成额外token就能带来优势,具体选择了什么token无关紧要。 ☞☞☞AI 智能聊天, 问答助手,…
-
LeCun上月球?南开、字节开源StoryDiffusion让多图漫画和长视频更连贯
两天前,图灵奖得主 Yann LeCun 转载了「自己登上月球去探索」的长篇漫画,引起了网友的热议。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 在《Story Diffusion:Consistent Self-Attention fo…
-
特斯拉机器人进厂打工,马斯克:手的自由度今年将达到22个!
特斯拉机器人Optimus最新视频出炉,已经可以在厂子里打工了。 正常速度下,它分拣电池(特斯拉的4680电池)是这样的: ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 官方还放出了20倍速下的样子——在小小的“工位”上,拣啊拣啊拣: 这次…
-
爆火后反转?「一夜干掉MLP」的KAN:其实我也是MLP
多层感知器(MLP),也被称为全连接前馈神经网络,是如今深度学习模型的基础构建块。MLP 的重要性无论如何强调都不为过,因为它们是机器学习中用于逼近非线性函数的默认方法。 但是最近,来自 MIT 等机构的研究者提出了一种非常有潜力的替代方法 ——KAN。该方法在准确性和可解释性方面表现优于 MLP。…
-
全球最强开源 MoE 模型来了,中文能力比肩 GPT-4,价格仅为 GPT-4-Turbo 的近百分之一
想象一下,一个人工智能模型,不仅拥有超越传统计算的能力,还能以更低的成本实现更高效的性能。这不是科幻,deepseek-v2[1],全球最强开源 moe 模型来了。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ DeepSeek-V2 是一…