模型_第16页

视觉AI能力大一统！自动化图像检测分割，还能可控文生图，华人团队出品

本文经AI新媒体量子位（公众号ID:QbitAI）授权转载，转载请联系出处。现在AI圈确实到了拼手速的时候啊。这不，Meta的SAM刚刚推出几天，就有国内程序猿来了波buff叠加，把目标检测、分割、生成几大视觉AI功能all in one！比如基于Stable Diffusion和SAM，就能…

程序猿

2025年11月10日 • 用户投稿

0000

让大模型的训练和推理，比更快还更快！谷歌2022年终总结第四弹

虽然谷歌的Bard翻车了，但谷歌的AI实力仍然不容小觑。自开年以来，由Jeff Dean领衔的Google Research年终总结系列「Google Research, 2022 & beyond」一直在持续更新，最近也是更新到了第四期。本期以「提升模型效率」为主题，一起看看谷歌工程师…

程序猿

2025年11月10日 • 用户投稿

1000

ChatGPT爆火，LeCun心态崩了！称大语言模型是邪路，Meta模型3天惨遭下线

这两天，图灵奖得主Yann LeCun心态有些崩了。自从ChatGPT大火之后，微软凭着OpenAI腰板挺得很直。被啪啪打脸的谷歌，也不说什么「声誉风险」了。所有旗下的语言模型，无论是LaMDA，还是DeepMind的Sparrow，以及Apprentice Bard，是能加快的加快，能上架的…

程序猿

2025年11月10日 • 用户投稿

2000

与生成模型相比，为何机器人研究还在用几年前的老方法？

目前机器人领域取得了显著进展，这些进展预示着未来机器人可以做更多事情。但是也有让人困扰的事情，因为与生成模型相比，机器人的进展还是有点逊色，尤其是 GPT-3 等模型的出现，这一差距更加突出。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ …

程序猿

2025年11月10日 • 用户投稿

0000

上线仅两天，AI大模型写论文网站光速下架：不负责任的胡编乱造

几天前，Meta AI 联合 Papers with Code 发布了大型语言模型 Galactica，该模型的一大特点就是解放你的双手，代笔帮你写论文，写的论文有多完整呢？摘要、介绍、公式、参考文献等统统都有。就像下面这样，Galactica 生成的文本看起来就是一篇论文的配置： ☞☞☞A…

程序猿

2025年11月10日 • 用户投稿

1000

颠覆三观！谷歌最新研究：用性能差的模型计算「相似度」反而更准？

计算图像之间的相似度是计算机视觉中的一个开放性问题。在图像生成火遍全球的今天，如何定义「相似度」，也是评估生成图像真实度的关键问题。虽然当下有一些相对直接的方法来计算图像相似度，比如测量像素上的差异（如FSIM, SSIM），但这种方法获得的相似性差异和人眼感知到的差异相去深远。深度学习兴起后…

程序猿

2025年11月10日 • 用户投稿

1000

一块GPU，每秒20个模型！英伟达新玩具用GET3D造元宇宙

Abracadabra！在2D生成3D模型上，英伟达亮出了自称「世界级」研究：GET3D。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 通过2D图像训练后，该模型可生成具有高保真纹理和复杂几何细节的3D形状。究竟有多厉害？形状、纹理…

程序猿

2025年11月10日 • 用户投稿

2000

用户投稿

回顾60多种 Transformer 研究，一文总结遥感领域最新进展

遥感成像技术在过去几十年取得显着进步。现代机载传感器在空间、光谱和分辨率上的不断提升，已经能覆盖地球表面大部分范围，因此遥感技术在生态学、环境科学、土壤科学、水污染、冰川学、土地测量和分析等众多研究领域发挥着至关重要的作用。由于遥感数据通常是多模态的、位于地理空间（地理定位）中，并且尺度通常是全球范…

程序猿

2025年11月10日

2000

模块化MoE将成为视觉多任务学习基础模型

多任务学习（MTL）存在很多挑战，因为不同任务之间的梯度可能矛盾。为了利用任务之间的关联，作者引入了 Mod-Squad 模型，它是多个专家组成的模块化模型。模型可以灵活优化任务和专家的匹配，针对任务选择部分专家。模型让每一个专家只对应部分任务，每一个任务只对应部分专家，以此最大化利用任务之间的正向…

程序猿

2025年11月10日 • 用户投稿

2000