模型
-
“中国人民大学研究员卢志武提出ChatGPT对多模态生成模型的重要影响”
天工大模型 中国首个对标ChatGPT的双千亿级大语言模型 115 查看详情 以下为卢志武教授在机器之心举办的 ChatGPT 及大模型技术大会上的演讲内容,机器之心进行了不改变原意的编辑、整理: ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜…
-
谷歌将视觉迁移模型参数扩展到220亿,自ChatGPT火爆后研究者集体行动
与自然语言处理类似,对预训练视觉主干的迁移提高了模型在各种视觉任务上的性能。更大的数据集、可扩展的架构和新的训练方法都推动了模型性能的提升。 然而,视觉模型仍然远远落后于语言模型。具体来说,迄今为止最大的视觉模型 ViT 只有 4B 参数,而入门级语言模型通常超过 10B 参数,更别说具有 540B…
-
谷歌下场优化扩散模型,三星手机运行Stable Diffusion,12秒内出图
Stable Diffusion 在图像生成领域的知名度不亚于对话大模型中的 ChatGPT。其能够在几十秒内为任何给定的输入文本创建逼真图像。由于 Stable Diffusion 的参数量超过 10 亿,并且由于设备上的计算和内存资源有限,因而这种模型主要运行在云端。 在没有精心设计和实施的情况…
-
MiniGPT-4看图聊天、还能草图建网站;视频版Stable Diffusion来了
目录 Align your Latents: High-Resolution Video Synthesis with Latent Diffusion Models MiniGPT-4:Enhancing Vision-language Understanding with Advanced La…
-
有事您说话!谷歌机器人「吃了」语言大模型后,会自学和思考了
「上得厅堂,下得厨房」,这句对理想型贤内助的赞许,以后很可能要对谷歌的机器人说了。 自带大型语言模型,会自学的机器人,见过吗?不会做?可以学! 现在不会没关系,过一会儿学完了就会了。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 比起…
-
逆转特征让re-id模型从88.54%到0.15%
这篇文章初版2018年5月就写好了,最近2022年12月才中。四年中得到了老板们的很多支持和理解。 (这段经历也希望给在投稿的同学们一点鼓舞,paper写好肯定能中的,不要轻易放弃!) arXiv早期版本为:Query Attack via Opposite-Direction Feature:To…
-
大语言模型的进化树,这是一份超详细ChatGPT「食用」指南
而在实际探索的过程中,实践者可能会苦于寻找适合自己应用的 AI 模型:是选择 LLM 还是微调模型?如果用 LLM,又该选择哪一种? 近日,来自亚马逊、德州农工大学、莱斯大学等机构的学者对 ChatGPT 等语言模型的发展历程进行了一番讨论,其文章也得到了 Yann LeCun 的转推。 ☞☞☞AI…
-
UC伯克利发布大语言模型排行榜!Vicuna夺冠,清华ChatGLM进前5
最近,来自LMSYS Org(UC伯克利主导)的研究人员又搞了个大新闻——大语言模型版排位赛! 顾名思义,「LLM排位赛」就是让一群大语言模型随机进行battle,并根据它们的Elo得分进行排名。 然后,我们就能一眼看出,某个聊天机器人到底是「嘴强王者」还是「最强王者」。 划重点:团队还计划把国内和…
-
生成多语种文本与图片的全能工具AltDiffusion-m18
当前,非英文文图生成模型选择有限,用户往往要将 prompt 翻译成英语再输入模型。这样不仅会造成额外的操作负担,并且翻译过程中的语言文化误差,会影响生成图片的准确性。 智源研究院 FlagAI 团队首创高效训练方式,使用多语言预训练模型和 Stable Diffusion 结合,训练多语言文图生成…
-
AI通灵模型成功解码大脑信息,准确率达到82%
神经网络之父Geoffrey Hinton离职谷歌,直言对毕生工作感到后悔。 现在看来,他对AI的害怕,不是没有道理。 因为,一种类ChatGPT模型已经学会了读心术,准确率高达82%! 来自德克萨斯大学奥斯汀分校的研究者开发了一种基于GPT的语言解码器。 它能通过非侵入性的MRI/fMRI收集大脑…