模型
-
视觉AI能力大一统!自动化图像检测分割,还能可控文生图,华人团队出品
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。 现在AI圈确实到了拼手速的时候啊。 这不,Meta的SAM刚刚推出几天,就有国内程序猿来了波buff叠加,把目标检测、分割、生成几大视觉AI功能all in one! 比如基于Stable Diffusion和SAM,就能…
-
让大模型的训练和推理,比更快还更快!谷歌2022年终总结第四弹
虽然谷歌的Bard翻车了,但谷歌的AI实力仍然不容小觑。 自开年以来,由Jeff Dean领衔的Google Research年终总结系列「Google Research, 2022 & beyond」一直在持续更新,最近也是更新到了第四期。 本期以「提升模型效率」为主题,一起看看谷歌工程师…
-
ChatGPT爆火,LeCun心态崩了!称大语言模型是邪路,Meta模型3天惨遭下线
这两天,图灵奖得主Yann LeCun心态有些崩了。 自从ChatGPT大火之后,微软凭着OpenAI腰板挺得很直。 被啪啪打脸的谷歌,也不说什么「声誉风险」了。 所有旗下的语言模型,无论是LaMDA,还是DeepMind的Sparrow,以及Apprentice Bard,是能加快的加快,能上架的…
-
与生成模型相比,为何机器人研究还在用几年前的老方法?
目前机器人领域取得了显著进展,这些进展预示着未来机器人可以做更多事情。但是也有让人困扰的事情,因为与生成模型相比,机器人的进展还是有点逊色,尤其是 GPT-3 等模型的出现,这一差距更加突出。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ …
-
上线仅两天,AI大模型写论文网站光速下架:不负责任的胡编乱造
几天前,Meta AI 联合 Papers with Code 发布了大型语言模型 Galactica,该模型的一大特点就是解放你的双手,代笔帮你写论文,写的论文有多完整呢?摘要、介绍、公式、参考文献等统统都有。 就像下面这样,Galactica 生成的文本看起来就是一篇论文的配置: ☞☞☞A…
-
颠覆三观!谷歌最新研究:用性能差的模型计算「相似度」反而更准?
计算图像之间的相似度是计算机视觉中的一个开放性问题。 在图像生成火遍全球的今天,如何定义「相似度」,也是评估生成图像真实度的关键问题。 虽然当下有一些相对直接的方法来计算图像相似度,比如测量像素上的差异(如FSIM, SSIM),但这种方法获得的相似性差异和人眼感知到的差异相去深远。 深度学习兴起后…
-
一块GPU,每秒20个模型!英伟达新玩具用GET3D造元宇宙
Abracadabra! 在2D生成3D模型上,英伟达亮出了自称「世界级」研究:GET3D。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 通过2D图像训练后,该模型可生成具有高保真纹理和复杂几何细节的3D形状。 究竟有多厉害? 形状、纹理…
-
回顾60多种 Transformer 研究,一文总结遥感领域最新进展
遥感成像技术在过去几十年取得显着进步。现代机载传感器在空间、光谱和分辨率上的不断提升,已经能覆盖地球表面大部分范围,因此遥感技术在生态学、环境科学、土壤科学、水污染、冰川学、土地测量和分析等众多研究领域发挥着至关重要的作用。由于遥感数据通常是多模态的、位于地理空间(地理定位)中,并且尺度通常是全球范…
-
模块化MoE将成为视觉多任务学习基础模型
多任务学习(MTL)存在很多挑战,因为不同任务之间的梯度可能矛盾。为了利用任务之间的关联,作者引入了 Mod-Squad 模型,它是多个专家组成的模块化模型。模型可以灵活优化任务和专家的匹配,针对任务选择部分专家。模型让每一个专家只对应部分任务,每一个任务只对应部分专家,以此最大化利用任务之间的正向…
-
Meta「分割一切」超进化版来了!IDEA领衔国内顶尖团队打造:检测、分割、生成一切,狂揽2k星
Meta的「分割一切」模型横空出世后,已经让圈内人惊呼CV不存在了。 就在SAM发布后一天,国内团队在此基础上搞出了一个进化版本「Grounded-SAM」。 注:项目的logo是团队用Midjourney花了一个小时做的 Grounded-SAM把SAM和BLIP、Stable Diffusion…