随时随地,追踪每个像素,连遮挡都不怕的「追踪一切」视频算法来了

前段时间,Meta 发布「分割一切(SAM)」AI 模型,可以为任何图像或视频中的任何物体生成 mask,让计算机视觉(CV)领域研究者惊呼:「CV 不存在了」。之后,CV 领域掀起了一阵「二创」狂潮,一些工作陆续在分割的基础上结合目标检测、图像生成等功能,但大部分研究是基于静态图像的。

现在,一项称为「追踪一切」的新研究为动态视频中的运动估计提出了新方法,能够准确、完整地追踪物体的运动轨迹。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

随时随地,追踪每个像素,连遮挡都不怕的「追踪一切」视频算法来了

该研究由来自康奈尔大学、谷歌研究院和 UC 伯克利的研究者共同完成。他们联合提出了一种完整且全局一致的运动表征 OmniMotion,并提出一种新的测试时(test-time)优化方法,对视频中每个像素进行准确、完整的运动估计。 

随时随地,追踪每个像素,连遮挡都不怕的「追踪一切」视频算法来了

论文地址:https://arxiv.org/abs/2306.05422项目主页:https://omnimotion.github.io/

有网友在推特上转发了这项研究,仅一天时间就收获了 3500 + 的点赞量,研究内容大受好评。

随时随地,追踪每个像素,连遮挡都不怕的「追踪一切」视频算法来了

从该研究发布的 demo 看,运动追踪的效果非常好,例如追踪跳跃袋鼠的运动轨迹:

随时随地,追踪每个像素,连遮挡都不怕的「追踪一切」视频算法来了

荡秋千的运动曲线:

随时随地,追踪每个像素,连遮挡都不怕的「追踪一切」视频算法来了

还能交互式查看运动追踪情况:

随时随地,追踪每个像素,连遮挡都不怕的「追踪一切」视频算法来了

即使物体被遮挡也能追踪运动轨迹,如狗在跑动的过程中被树遮挡:

随时随地,追踪每个像素,连遮挡都不怕的「追踪一切」视频算法来了

在计算机视觉领域,常用的运动估计方法有两种:稀疏特征追踪和密集光流。但这两种方法各有缺点,稀疏特征追踪不能建模所有像素的运动;密集光流无法长时间捕获运动轨迹。

该研究提出的 OmniMotion 使用 quasi-3D 规范体积来表征视频,并通过局部空间和规范空间之间的双射(bijection)对每个像素进行追踪。这种表征能够保证全局一致性,即使在物体被遮挡的情况下也能进行运动追踪,并对相机和物体运动的任何组合进行建模。该研究通过实验表明所提方法大大优于现有 SOTA 方法。

方法概述

该研究将帧的集合与成对的噪声运动估计(例如光流场)作为输入,以形成整个视频的完整、全局一致的运动表征。然后,该研究添加了一个优化过程,使其可以用任何帧中的任何像素查询表征,以在整个视频中产生平滑、准确的运动轨迹。值得注意的是,该方法可以识别画面中的点何时被遮挡,甚至可以穿过遮挡追踪点。

omnimotion 表征

传统的运动估计方法(例如成对光流),当物体被遮挡时会失去对物体的追踪。为了在遮挡的情况下也能提供准确、一致的运动轨迹,该研究提出全局运动表征 OmniMotion。

该研究试图在没有显式动态 3D 重建的情况下准确追踪真实世界的运动。OmniMotion 表征将视频中的场景表示为规范的 3D 体积,通过局部规范双射(local-canonical bijection)映射成每个帧中的局部体积。局部规范双射被参数化为神经网络,并在不分离两者的情况下捕获相机和场景运动。基于此种方法,视频可以被视为来自固定静态相机局部体积的渲染结果。

随时随地,追踪每个像素,连遮挡都不怕的「追踪一切」视频算法来了

由于 OmniMotion 没有明确区分相机和场景运动,所以形成的表征不是物理上准确的 3D 场景重建。因此,该研究称其为 quasi-3D 表征。

OmniMotion 保留了投影到每个像素的所有场景点的信息,以及它们的相对深度顺序,这让画面中的点即使暂时被遮挡,也能对其进行追踪。

随时随地,追踪每个像素,连遮挡都不怕的「追踪一切」视频算法来了

实验及结果

定量比较

研究者将提出的方法与 TAP-Vid 基准进行比较,结果如表 1 所示。可以看出,在不同的数据集上,他们的方法始终能实现最佳的位置准确性、遮挡准确性和时序一致性。他们的方法可以很好地处理来自 RAFT 和 TAP-Net 的不同的成对对应输入,并且在这两种基准方法上提供了一致的改进。

随时随地,追踪每个像素,连遮挡都不怕的「追踪一切」视频算法来了

定性比较

知了追踪 知了追踪

AI智能信息助手,智能追踪你的兴趣资讯

知了追踪 64 查看详情 知了追踪

如图 3 所示,研究者对他们的方法和基线方法进行了定性比较。新方法在(长时间)遮挡事件中显示出了出色的识别和追踪的能力,同时在遮挡期间为点提供合理的位置,并处理很大的摄像机运动视差。

随时随地,追踪每个像素,连遮挡都不怕的「追踪一切」视频算法来了

消融实验与分析

研究者利用消融实验来验证他们设计决策的有效性,结果如表 2 所示。

随时随地,追踪每个像素,连遮挡都不怕的「追踪一切」视频算法来了

在图 4 中,他们展示了由他们的模型生成的伪深度图,以展示学习到的深度排序。

随时随地,追踪每个像素,连遮挡都不怕的「追踪一切」视频算法来了

需要注意的是,这些图并不对应于物理深度,然而,它们展示了仅使用光度和光流信号时,新方法能够有效地确定不同表面之间的相对顺序,这对于在遮挡中进行追踪至关重要。更多的消融实验和分析结果可以在补充材料中找到。

以上就是随时随地,追踪每个像素,连遮挡都不怕的「追踪一切」视频算法来了的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/523104.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月9日 06:37:22
下一篇 2025年11月9日 06:38:24

相关推荐

  • 如何使用纯CSS实现在容器中反弹的小球(附源码)

    本篇文章给大家带来的内容是关于如何使用纯css实现在容器中反弹的小球(附源码),有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。 效果预览 源代码下载 https://github.com/comehope/front-end-daily-challenges 代码解读 定义 dom,…

    2025年12月24日
    000
  • 如何使用纯CSS实现菱形loader效果(附源码)

    本篇文章给大家带来的内容是关于如何使用纯css实现菱形loader效果(附源码),有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。 效果预览 源代码下载 https://github.com/comehope/front-end-daily-challenges 代码解读 定义 dom…

    2025年12月24日
    000
  • html中如何加入视频_在HTML页面嵌入视频播放器【播放】

    HTML提供五种视频嵌入方法:一、用标签嵌入本地视频,支持多格式与备用提示;二、用iframe嵌入YouTube视频;三、JavaScript动态创建控制;四、自动播放需静音配合用户交互;五、移动端需playsinline等属性适配。 如果您希望在网页中展示视频内容,HTML 提供了原生的 标签来直…

    2025年12月23日
    000
  • HTML5 视频画廊中动态管理封面图的实现

    本文提供了一份关于在html5视频画廊中实现动态封面图管理的全面指南。它解决了管理多个视频元素及其对应封面图的常见问题,演示了如何利用javascript、css和正确的html结构,在视频播放时隐藏封面图,并在暂停时重新显示,以提供无缝的用户体验。 在现代网页设计中,视频画廊是常见的交互元素,用于…

    2025年12月23日 好文分享
    000
  • 怎么用html5看视频_HTML5视频播放器使用与故障排除

    HTML5通过标签实现原生视频播放,支持controls、尺寸设置及多格式兼容;需注意浏览器格式支持差异、服务器MIME类型配置、CORS跨域限制及自动播放策略,可通过JavaScript检测格式支持、添加poster封面图等提升体验。 在现代网页中,HTML5 提供了原生支持视频播放的能力,无需依…

    2025年12月23日
    000
  • html视频poster属性怎么用_html视频封面图设置方法

    poster属性用于设置video元素的封面图,提升美观与体验;2. 用法为在标签添加poster=”图片地址”,推荐配合controls和使用;3. 封面图建议尺寸匹配视频、格式选JPG或PNG、大小适中,并可截取视频关键帧;4. 注意路径正确,未设置时显示首帧,部分移动端…

    2025年12月23日
    000
  • html视频playsinline属性作用_html视频内联播放功能

    playsinline属性用于视频内联播放,避免移动设备自动全屏;添加playsinline和webkit-playsinline可提升兼容性,适用于短视频嵌入等场景,需注意安卓厂商实现差异及autoplay时需静音。 在HTML中,playsinline 是一个用于 标签的布尔属性,主要作用是**…

    2025年12月22日
    000
  • 视频在HTML里怎么设置自动播放_HTML视频设置autoplay属性方法详解

    答案:HTML视频自动播放需结合autoplay和muted属性以提高成功率。1. 添加autoplay实现自动播放;2. 配合muted避免浏览器拦截;3. 不同浏览器策略不同,静音播放兼容性更好;4. 可用JavaScript检测播放状态并处理失败情况。 在HTML中让视频自动播放,主要通过au…

    2025年12月22日
    000
  • HTML视频字幕怎么添加_视频字幕可访问性实现方法

    答案:HTML视频字幕通过标签和WebVTT文件实现,确保路径正确、格式合规并用CSS或播放器库自定义样式,WebVTT因标准支持优于SRT和ASS。 HTML视频字幕的添加,本质上是为了提升视频的可访问性,让更多人能理解视频内容,包括听力障碍人士和使用不同语言的观众。实现方式主要依赖于 标签,配合…

    2025年12月22日
    000
  • HTML如何嵌入视频?video标签的用法是什么?

    最核心且直接的html视频嵌入方式是使用标签,通过src属性或标签指定视频源以确保兼容性,结合controls、preload、poster等属性优化播放体验与加载性能,并利用javascript api实现自定义控制、字幕支持、全屏及画中画等高级功能,最终通过提供多格式视频源(如mp4和webm)…

    2025年12月22日
    000
  • 怎么嵌入HTML视频?媒体播放新手入门

    在html中嵌入视频的关键是使用标签并正确设置相关属性。1. 使用标签作为容器,定义width和height设置播放器尺寸;2. 添加controls属性以启用默认播放控制条;3. 通过多个标签提供不同格式的视频源(如mp4和webm),确保浏览器兼容性;4. 设置回退文本提示不支持html5视频的…

    2025年12月22日 好文分享
    000
  • 怎样在HTML里放视频

    在HTML里添加视频的方法是,在html代码中添加一个标签,然后在标签内部添加需要的视频就可以了,例如【】。 本文操作环境:windows10系统、html 5、thinkpad t480电脑。 要在html中插入一段视频是非常简单的,因为我们有现成的video标签,通过该标签我们可以很方便地实现插…

    2025年12月21日
    000
  • html怎么加视频

    html添加视频的方法:1、使用“”语句;2、使用“”语句;3、使用“”语句。 本教程操作环境:windows7系统、HTML5版、Dell G3电脑。 在 HTML 中播放视频的方法有很多种。 1、使用 标签 是 HTML 5 中的新标签。 立即学习“前端免费学习笔记(深入)”; 标签的作用是在 …

    2025年12月21日
    000
  • 如何在HTML中插入视频

    在HTML中,可以使用video标签插入视频,语法格式“”;video标签可以定义视频,支持MP4、WebM、Ogg三种视频格式。 本教程操作环境:windows7系统、CSS3&&HTML5版、Dell G3电脑。 视频是通过插件(比如 Flash)来显示的。然而,并非所有浏览器都…

    2025年12月21日
    000
  • html中怎么放视频

    在html中,可以使用“”标签来插入视频,语法格式“”。video标签元素支持三种视频格式:MP4、WebM、Ogg。 本教程操作环境:windows7系统、HTML5版、Dell G3电脑。 html插入视频 您的浏览器不支持 HTML5 video 标签。 效果图: 立即学习“前端免费学习笔记(…

    2025年12月21日
    000
  • 怎么在html中插入视频和音频

    插入视频的理想解决方法: HTML5 + + @@@###@@@ (视频教程推荐:html视频教程) 代码如下: @@@###@@@ 插入音频的理想解决方法: 立即学习“前端免费学习笔记(深入)”; @@@###@@@ 下面的例子使用了两个不同的音频格式。Html5  元素会尝试以 mp3 或 og…

    2025年12月21日
    000
  • 如何在html页面中插入视频

    video标签的使用 Video标签含有src、poster、preload、autoplay、loop、controls、width、height等几个属性, 以及一个内部使用的标签。Video标签内除了可以包含标签外,还可以包含当指定的视频都不能播放时,返回的内容。 (1) src属性和post…

    2025年12月21日
    100
  • 实现简易html视频播放器的方法

    这篇文章主要介绍了实现简易html视频播放器的方法,h5创建视频播放器很简单,您只需要添加一些h5的标签即可创建出炫酷的播放器 本文介绍了实现简易html视频播放器的方法,分享给大家,具体如下: 文件列表 root@tianshl:/data/video# lshch.mp4 test.mp4 xy…

    2025年12月21日
    000
  • 使用HTML5捕捉音频与视频信息概述及实例

    这篇文章主要介绍了关于使用html5捕捉音频与视频信息概述及实例,有着一定的参考价值,现在分享给大家,有需要的朋友可以参考一下 音频与视频信息的捕捉一直是Web开发中的一个难点,下面为大家介绍一种新的API,该API通过使用navigatior.getUserMedia()方法来让Web应用程序拥有…

    好文分享 2025年12月21日
    000
  • 在html里怎么添加flash视频格式(flv、swf)文件

    这次给大家带来在html里怎么添加flash视频格式(flv、swf)文件,在html里添加flash视频格式(flv、swf)文件的注意事项有哪些,下面就是实战案例,一起来看一下。 flash文件的格式:.FLV 和 .SWF flash视频格式有两种扩展名可以使用:.flv和.swf。他们有什么…

    好文分享 2025年12月21日
    000

发表回复

登录后才能评论
关注微信