warp
-
数字图像处理的图像操作
在计算机视觉和图像处理中,图像操作起着至关重要的作用。这些操作对于预处理、提升图像质量和启用高级算法等任务至关重要。在计算机视觉领域,调整大小、裁剪、调整亮度/对比度/伽玛和几何变换等操作是基础操作。它们能够进行高效计算、提取感兴趣区域、规范化图像强度和几何校准。在图像处理方面,这些操作对于降低采样…
-
SD社区的I2V-Adapter:无需配置,即插即用,完美兼容图生视频插件
图像到视频生成(I2V)任务是计算机视觉领域的一项挑战,旨在将静态图像转化为动态视频。这个任务的难点在于从单张图像中提取并生成时间维度的动态信息,同时保持图像内容的真实性和视觉上的连贯性。现有的I2V方法通常需要复杂的模型架构和大量的训练数据来实现这一目标。 近期,快手主导的一项新研究成果《I2V-…
-
生成速度快SDXL一倍,9GB GPU也能运行,Stable Cascade来搞性价比了
硬件要求越来越低,生成速度越来越快。 stability ai 作为文本到图像的先驱,不仅引领潮流,也不断在模型质量上取得新突破。这次,它实现了性价比的突破。 就在前几天,Stability AI 又有新动作了:Stable Cascade 的研究预览版被推出。这款文本到图像模型进行了创新,它引入了…
-
朱玉可团队新作:看一眼就能模仿,大模型让机器人轻松学会撒盐
在人形机器人领域,有一个非常值钱的问题:既然人形机器人的样子与人类类似,那么它们能使用网络视频等数据进行学习和训练吗? 如果可以,那考虑到网络视频的庞大规模,机器人就再也不用担心没有学习资源了。 近日,德克萨斯大学奥斯汀分校和 NVIDIA Research 的朱玉可团队公布了他们的一篇 CoRL …
-
Paddle2.0案例: 人体姿态关键点检测
本文介绍基于Paddle2.0实现人体姿态关键点检测的案例。先说明关键点检测的意义与两类方法,强调人体姿态检测的特殊性及常用热力图回归法。接着讲解环境设置、COCO数据集处理、数据集定义与抽样展示,还构建了基于ResNet的PoseNet模型,阐述训练过程与预测结果,展示不同训练程度模型的效果差异。…
-
基于PP-OCRv3的车牌检测和识别
本项目主要基于PaddleOCR套件中的PP-OCR进行车牌的检测与识别,PP-OCR是PaddleOCR自研的实用的超轻量OCR系统,本次使用的模块为PP-OCRv3。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 背景介绍 车牌识别技术…
-
Runway 生成动态视频?关键帧控制与转场技巧
runway 通过提示词动画实现关键帧控制,用户可在时间轴上设置不同提示词及强度以生成动态效果;例如在第 0 秒使用 “a cat”、第 5 秒使用 “a dog” 并调整强度实现渐变过渡;同时支持相机运动设置,如平移、缩放与旋转;由于其关键帧功能有限…
-
ByteQC:通往大规模实用化量子化学计算的曙光
字节跳动研发并开源了基于gpu加速的大规模量子化学计算工具集byteqc,显著提升了量子化学计算效率。该工具集针对真实化学体系中大量微观粒子的精确计算难题,利用gpu强大的算力,大幅加速了常用量子化学算法,并结合量子嵌入方法,在“黄金标准”精度下模拟大规模量子化学体系。 ☞☞☞AI 智能聊天, 问答…