follow
-
MIT韩松团队长上下文LLM推理高效框架DuoAttention:单GPU实现330万Token上下文推理
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@ji…
-
真·赛博菩萨!最大的开源视频模型来了,我们实测:有点东西,但不多
ai好好用报道 编辑:杨文 目前发布的最大的开源视频生成模型。 Genmo 当了一回「赛博菩萨」。 昨晚,AI 视频生成公司 Genmo 推出了最新的视频生成模型 Mochi 1 ,并且大手一挥,直接给开源了 。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek…
-
魔法填充+无限扩图,Ideogram推出AI画板工具Canvas
今天是个好日子,至少对 ai 来说是如此。过去 24 小时内发布或更新的 ai 服务包括但不限于 stable diffusion 3.5 最强模型全家桶、能操作用户电脑的 claude 3.5 sonnet、genmo 开源的可商用的 mochi 1 dit、runway 推出的一款生成式角色表演…
-
国产最强语音大模型诞生,MaskGCT宣布开源,声音效果媲美人类
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@ji…
-
导航、采矿、建造,北大这个新智能体把《我的世界》玩透了
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢…
-
全自动打工「人」!波士顿动力Atlas进厂视频火了,不断电不下班
波士顿动力atlas进厂打工,不靠远程操控,转身动作像惊悚电影。 波士顿动力的人形机器人,进厂了。 本周三,波士顿动力发来一条喜讯。其最新披露的视频展示了机器人在工厂环境中的任务完成能力。机器人现在已经可以全自动干活了,它可以在储物柜之间搬动汽车发动机零件: ☞☞☞AI 智能聊天, 问答助手, AI…
-
ECCV 2024|牛津大学&港科提出毫秒级文生图安全检测框架Latent Guard
最近的文本到图像生成器由文本编码器和扩散模型组成。如果在没有适当安全措施的情况下部署,它们会产生滥用风险(左图)。我们提出了潜在保护方法(右图),这是一种旨在阻止恶意输入提示的安全方法。我们的想法是在文本编码器的基础上,检测学习的潜在空间中黑名单概念的存在。这使我们能够检测到超出其确切措辞的黑名单概…
-
实测国内首个AI播客!有点意思,但NotebookLM还是大爷
ai好好用报道 编辑:杨文 谷歌NotebookLM 这座高峰仍不可逾越。 一个月前,谷歌推出了一款免费强大的工具 ——NotebookLM 。 其中最出圈的一个功能就是音频概览,俗称 AI 播客。 仅需一个链接或文档,它几分钟就能转成接地气的男女对谈。 (查看详情,请移步:NotebookLM 新…
-
杨笛一团队:一个弹窗,就能把AI智能体操控电脑整懵了
弹窗攻击很有效,控制计算机的智能体根本顶不住。 前些天,Anthropic 为 Claude 带来一个极具变革意义的功能:Computer Use,也就是控制用户的计算机。当时,Anthropic 在博客中写到:「在 OSWorld 这项测试模型使用计算机的能力的评估基准上,Claude 当前的准确…
-
聚焦「视听触感官」协同配合的具身精细操纵,人大胡迪团队领衔探索机器人模态时变性挑战
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢…