模型
-
击败OpenAI,权重、数据、代码全开源,能完美复现的嵌入模型Nomic Embed来了
一周前,OpenAI给用户送出福利。他们解决了GPT-4变懒的问题,并推出了5个新模型,其中包括text-embedding-3-small嵌入模型,它更小巧高效。 嵌入是用来表示自然语言、代码等内容中的概念的数字序列。它们帮助机器学习模型和其他算法更好地理解内容之间的关联,也更容易执行聚类或检索等…
-
Agent像人一样分工协作,还能“群聊”交换信息
智能体也要有“规范手册”! 一项名为MetaGPT的研究,通过对智能体角色进行明确分工,并要求多个智能体在协作中采用统一规范的“交流格式”等方法,让智能体性能大增。 目前,这项研究在GitHub上已狂揽33.6k星,并在深度学习顶会ICLR 2024上被收录为Oral论文。 ☞☞☞AI 智能聊天, …
-
谷歌官宣TensorFlow-GNN 1.0发布!动态和交互采样,大规模构建图神经网络
2005年,划时代之作「The Graph Neural Network Model」的问世,将图神经网络带到每个人面前。 在此之前,科学家处理图数据的方式是,在数据预处理阶段,将图转换为一组「向量表示」。 而CNN的出现彻底改变这种信息丢失的弊端,近20年来,一代又一代模型不断演变,推动ML领域进…
-
可控图像生成最新综述!北邮开源20页249篇文献,包揽Text-to-Image Diffusion领域各种「条件」
在视觉生成领域迅速发展的进程中,扩散模型已经完全改变了这一领域的发展态势,其引入的文本引导生成功能标志着能力方面的深刻变革。 然而,仅依赖文本来调节这些模型并不能完全满足不同应用和场景的多样化和复杂需求。 鉴于这种不足,许多研究旨在控制预训练文本到图像(T2I)模型以支持新条件。 北京邮电大学的研究…
-
牛津大学最新!Mickey:3D中的2D图像匹配SOTA!(CVPR’24)
写在前面 项目链接:https://nianticlabs.github.io/mickey/ 给定两张图片,可以通过建立图片之间的对应关系来估计它们之间的相机姿态。通常,这些对应关系是二维到二维的,而我们估计的姿态在尺度上是不确定的。一些应用,例如随时随地实现即时增强现实,需要尺度度量的姿态估计,…
-
MIT最新!多模态LLM真的无所不能吗?大模型能解决一切难题吗?
写在前面&笔者的个人理解 本文对自动驾驶领域内多模态大型语言模型(MLLMs)的应用进行了审慎的审视,并对一些常见的假设提出了质疑/验证,重点关注它们通过闭环控制环境中的图像/帧序列推理和解释动态驾驶场景的能力。尽管GPT-4V等MLLMs取得了显著的进步,但它们在复杂、动态的驾驶环境中的性…
-
无需OpenAI数据,跻身代码大模型榜单!UIUC发布StarCoder-15B-Instruct
在软件技术的前沿,UIUC张令明组携手BigCode组织的研究者,近日公布了StarCoder2-15B-Instruct代码大模型。 这一创新成果在代码生成任务取得了显著突破,成功超越CodeLlama-70B-Instruct,登上代码生成性能榜单之巅。 ☞☞☞AI 智能聊天, 问答助手, AI…
-
李飞飞揭秘创业方向“空间智能”:视觉化为洞察,看见成为理解,理解导致行动
斯坦福李飞飞创业后,首次揭秘新概念“空间智能”。 这不仅是她的创业方向,也是指引她的“北极星”,被她认为是“解决人工智能难题的关键拼图”。 视觉化为洞察;看见成为理解;理解导致行动。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 在李飞飞1…
-
开源!V2Xverse:上交发布首个面向V2X的仿真平台与端到端模型
车路协同的同步驾驶数据 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 车路协同辅助的自动驾驶V2X-AD(Vehicle-to-everything-aided autonomous driving)在提供更安全的驾驶策略方面具有巨大潜力。…
-
众包新玩法!LLM竞技场诞生基准测试,严格分离学渣学霸
大模型排行榜哪家强?还看LLM竞技场~ 截至此刻,已有共计90名LLM加入战斗,用户总投票数超过了77万。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 图片 然而,在网友们吃瓜调侃新模型冲榜、老模型丧失尊严的同时, 人家竞技场背后的组织L…