warp_第2页_创想鸟

数字图像处理的图像操作

在计算机视觉和图像处理中，图像操作起着至关重要的作用。这些操作对于预处理、提升图像质量和启用高级算法等任务至关重要。在计算机视觉领域，调整大小、裁剪、调整亮度/对比度/伽玛和几何变换等操作是基础操作。它们能够进行高效计算、提取感兴趣区域、规范化图像强度和几何校准。在图像处理方面，这些操作对于降低采样…

程序猿

2025年11月7日 • 用户投稿

0000

SD社区的I2V-Adapter：无需配置，即插即用，完美兼容图生视频插件

图像到视频生成（I2V）任务是计算机视觉领域的一项挑战，旨在将静态图像转化为动态视频。这个任务的难点在于从单张图像中提取并生成时间维度的动态信息，同时保持图像内容的真实性和视觉上的连贯性。现有的I2V方法通常需要复杂的模型架构和大量的训练数据来实现这一目标。近期，快手主导的一项新研究成果《I2V-…

程序猿

2025年11月7日 • 用户投稿

1000

生成速度快SDXL一倍，9GB GPU也能运行，Stable Cascade来搞性价比了

硬件要求越来越低，生成速度越来越快。 stability ai 作为文本到图像的先驱，不仅引领潮流，也不断在模型质量上取得新突破。这次，它实现了性价比的突破。就在前几天，Stability AI 又有新动作了：Stable Cascade 的研究预览版被推出。这款文本到图像模型进行了创新，它引入了…

程序猿

2025年11月7日 • 用户投稿

1000

朱玉可团队新作：看一眼就能模仿，大模型让机器人轻松学会撒盐

在人形机器人领域，有一个非常值钱的问题：既然人形机器人的样子与人类类似，那么它们能使用网络视频等数据进行学习和训练吗？如果可以，那考虑到网络视频的庞大规模，机器人就再也不用担心没有学习资源了。近日，德克萨斯大学奥斯汀分校和 NVIDIA Research 的朱玉可团队公布了他们的一篇 CoRL …

程序猿

2025年11月7日 • 用户投稿

2000

Paddle2.0案例：人体姿态关键点检测

本文介绍基于Paddle2.0实现人体姿态关键点检测的案例。先说明关键点检测的意义与两类方法，强调人体姿态检测的特殊性及常用热力图回归法。接着讲解环境设置、COCO数据集处理、数据集定义与抽样展示，还构建了基于ResNet的PoseNet模型，阐述训练过程与预测结果，展示不同训练程度模型的效果差异。…

程序猿

2025年11月5日 • 用户投稿

0000

基于PP-OCRv3的车牌检测和识别

本项目主要基于PaddleOCR套件中的PP-OCR进行车牌的检测与识别，PP-OCR是PaddleOCR自研的实用的超轻量OCR系统，本次使用的模块为PP-OCRv3。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 背景介绍车牌识别技术…

程序猿

2025年11月5日 • 用户投稿

3000

Runway 生成动态视频？关键帧控制与转场技巧

runway 通过提示词动画实现关键帧控制，用户可在时间轴上设置不同提示词及强度以生成动态效果；例如在第 0 秒使用 “a cat”、第 5 秒使用 “a dog” 并调整强度实现渐变过渡；同时支持相机运动设置，如平移、缩放与旋转；由于其关键帧功能有限…

程序猿

2025年11月3日 • 用户投稿

2000

ByteQC：通往大规模实用化量子化学计算的曙光

字节跳动研发并开源了基于gpu加速的大规模量子化学计算工具集byteqc，显著提升了量子化学计算效率。该工具集针对真实化学体系中大量微观粒子的精确计算难题，利用gpu强大的算力，大幅加速了常用量子化学算法，并结合量子嵌入方法，在“黄金标准”精度下模拟大规模量子化学体系。 ☞☞☞AI 智能聊天, 问答…

程序猿

2025年11月1日 • 用户投稿

0000