b12
-
SpatialLM— 群核科技开源的空间理解多模态模型
spatiallm:赋能机器人和智能系统空间认知能力的开源多模态模型 SpatialLM是群核科技开源的一款空间理解多模态模型,它能够赋予机器人和智能系统类似人类的空间认知能力。只需普通手机拍摄的视频,SpatialLM就能重建出详细的3D场景布局,精确标注房间结构、家具摆放、通道宽度等关键信息。该…
-
EmbodiedGen— 用于具身智能应用的生成式3D世界引擎
EmbodiedGen简介 embodiedgen 是面向具身智能(embodied ai)应用的生成式 3d 环境引擎与开发工具集。它能够高效创建高质量、低成本并具备合理物理特性的三维资产和交互空间,助力研究人员与开发者搭建用于测试具身智能体的虚拟环境。该系统整合了多个功能模块,包括从图像或文本生…
-
【快速上手ERNIE 3.0】法律文本多标签分类实战
本项目将介绍如何基于PaddleNLP对ERNIE 3.0预训练模型微调完成法律文本多标签分类预测。本项目主要包括“什么是多标签文本分类预测”、“ERNIE 3.0模型”、“如何使用ERNIE 3.0中文预训练模型进行法律文本多标签分类预测”等三个部分。 ☞☞☞AI 智能聊天, 问答助手, AI 智…
-
Vid2World— 清华联合重庆大学推出视频模型转为世界模型的框架
vid2world 是由清华大学携手重庆大学共同研发的一项创新框架,其核心在于能够将全序列、非因果的被动视频扩散模型(vdm)转化为自回归、交互式且动作条件化的世界模型。该模型依托视频扩散因果化以及因果动作引导两大关键技术,有效弥补了传统vdm在因果生成及动作条件化上的缺陷。在机器人操控和游戏仿真等…
-
怎么用豆包AI帮我生成HTTP客户端代码 HTTP客户端代码的AI生成指南
使用豆包ai生成http客户端代码的关键在于提供清晰具体的指令。1. 明确请求方式和目标url,例如指定get或post请求及对应地址;2. 提供查询参数、请求头及认证信息,如token或headers;3. 指定编程语言及框架,如python的requests、node.js的axios等;4. …
-
最懂医疗的国产推理大模型,果然来自百川智能
年末将至,全球ai大模型竞争骤然白热化。本周,kimi模型开启强化学习新范式,deepseek r1以开源姿态“接棒”openai,谷歌则将gemini 2.0 flash thinking的上下文长度扩展至百万级。种种迹象表明,各大玩家正试图在近期决出胜负。 1月24日,百川智能重磅发布国内首个全…
-
ICRA 2025|清华x光轮:自驾世界模型生成和理解事故场景
aixiv专栏持续报道全球顶尖ai研究成果,已收录2000余篇来自高校和企业实验室的学术技术文章,助力学术交流与传播。欢迎投稿或联系报道,邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, …