基于PaddlePaddle的PredNet模型

本文介绍基于PaddlePaddle实现的PredNet视频预测模型,其基于预测性编码原理,采用层级结构。使用转换为hdf5格式的KITTI数据集训练,设置特定参数(batch size 4、epoch 150等),复现精度达0.006900,优于原始代码。还提及复现注意事项及代码结构等内容。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

基于paddlepaddle的prednet模型 - 创想鸟

基于PaddlePaddle实现的PredNet模型

1. 简介

PredNet是一个利用神经生物学中的预测性编码(Predictive Coding)原理所构建的视频预测模型,预测过程自顶向下,感知过程自底向上,对于其本身原理更感兴趣的同学可以参考Wikipedia。PreNet为该原理在视频数据上的一个实现,结构如下所示。网络为层级结构,每一层都会通过R来计算A_hat以预测输入A,两者的差异E再作为输入传递给下一层。其中R为每一层的表征,由一个LSTM来完成对时序信息的整合。特别的是R的输入除了由当前层的误差E外,还包含高层的表征,从而使得顶层的语义信息可以向底层传递。

基于PaddlePaddle的PredNet模型 - 创想鸟        

以下给出两张官方参数的预测结果,第一行为真实图像,第二行为预测图像,第一个时间步网络处于初始化状态,没有外部输入,故输出为0。

基于PaddlePaddle的PredNet模型 - 创想鸟        

基于PaddlePaddle的PredNet模型 - 创想鸟        

论文: Lotter, William, Gabriel Kreiman, and David Cox. “Deep predictive coding networks for video prediction and unsupervised learning.” arXiv preprint arXiv:1605.08104 (2016).

参考repo: prednet

2. 数据集

本项目使用KITTI数据集进行训练。KITTI是一个自动驾驶领域常用的数据集,其由配置了传感器的汽车于德国卡尔斯鲁厄采集,数据中包含了双目彩色图像、深度图像、雷达点云等传感数据,并提供目标检测、实例分割等常见CV任务的标签。

按照论文中的设置,将RGB图像降采样至128×160。由于原始KITTI数据过大(~165G),作者在DropBox上提供了处理过的版本。又由于处理过后的数据为.hkl格式,只能在python2中使用hickle 2.1.0进行加载,所以我将数据集转换为hdf5格式,上传至AI Studio

数据分为train,val,test三个数据集,分别包含41396,154,832张图像。每个文件中包含两个变量,images为所有图像帧,sources是每帧图像 的来源,用于判断帧之间的连续性。本项目已挂载数据集,位于/home/aistudio/data/data119650。

3. 复现精度

采用与原文代码一致的训练参数:batch size 4,epoch 150,samples per epoch 500,优化器Adam,初始学习率1e-3,75个epoch后减小为1e-4。保存验证集loss最低的模型为最优模型。

数据集 复现精度要求 原始代码库精度 本项目精度

KITTI0.0070000.0069950.006900

训练日志链接:log 权重文件链接:weight

4. 环境依赖

硬件:

x86 cpuNVIDIA GPU

框架:

PaddlePaddle==2.2.0

其他依赖项:

matplotlibh5pytqdm

5. 快速开始

Step 1 准备环境

In [ ]

%cd ~/work/prednet-paddle!pip install -r requirements.txt

   

Step 2 使用官方预训练模型,验证模型(可选)

In [ ]

!python kitti_evaluate.py --weight_file model_data_keras2/tensorflow_weights/prednet_kitti_weights.hdf5 --data_dir ~/data/data119650/!cat kitti_results/prediction_scores.txt

   

Step 3 训练模型

In [14]

# 注:使用V100训练需2h左右!python kitti_train.py --data_dir ~/data/data119650/

   

Step 4 验证模型

In [17]

### 验证!python kitti_evaluate.py --data_dir ~/data/data119650/!cat kitti_results/prediction_scores.txt

   In [18]

### 可视化结果import matplotlib.pyplot as pltplot_dir = 'kitti_results/prediction_plots/'plot_names = os.listdir(plot_dir)img = plt.imread(os.path.join(plot_dir, plot_names[0])) # 可以修改index查看不同结果plt.imshow(img)plt.show()

   

6. 代码结构

├── LICENSE├── README.md├── data.py # 数据集定义├── kitti_data # 数据文件夹│   ├── test.h5 # 测试数据│   ├── train.h5 # 训练数据│   └── val.h5 # 验证数据├── kitti_evaluate.py # 评估脚本├── kitti_results│   ├── prediction_plots/ # 测试集预测可视化│   └── prediction_scores.txt # 测试集指标├── kitti_settings.py # 路径定义├── kitti_train.py # 训练脚本├── prednet.py # 网络定义├── requirements.txt # 依赖包└── utils.py # 功能函数

       

7. 复现心得

PredNet作为2016年的模型,与现在的模型相比更加纯粹一些,没有各种花式trick,复现起来相对容易。

原始代码是使用keras实现的,所以在复现时有几个小细节需要注意:

默认初始化方式:keras的默认初始化方式为XavierUniform,而paddle的默认初始化方式为XavierNormal,本项目通过传入weight_attr进行修改。HardSigmoid表达式:keras为clip(x/5+0.5, 0, 1),而paddle为clip(x/6+0.5, 0, 1),本项目通过重写HardSigmoid进行对齐。

       

以上就是基于PaddlePaddle的PredNet模型的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/46047.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月7日 16:23:07
下一篇 2025年11月7日 16:27:23

相关推荐

  • 比特币反弹后市场趋谨慎,鲸鱼大额做空,GameFi 板块领涨

    比特币(BTC)在经历短暂反弹后,市场整体情绪趋于谨慎。大型鲸鱼账户开始出现大额做空迹象,表明资金对短期行情仍保持防御态度。然而,与此同时,GameFi 板块逆势领涨,成为今日市场的亮点。 市场行情概况 当前比特币价格在11.1 万美元附近波动,部分主流资金选择观望。以太坊与索拉纳等主流币种涨幅有限…

    2025年12月9日
    000
  • 精准把握市场脉搏!10大比特币实时价格APP全新评测

    在瞬息万变的加密货币市场,实时掌握比特币价格是做出明智决策的关键。本文将为您全面评测市面上最顶尖的10款比特币实时价格app,帮助您找到最适合自己需求的工具,精准把握每一个投资机会。 比特币实时价格APP排行榜 以下是我们根据数据实时性、功能全面性、用户体验和市场影响力综合评选出的十大APP。 1.…

    2025年12月9日
    000
  • 2025年最受好评的10款比特币实时行情工具

    在快节奏的加密货币市场,实时、准确的行情数据是做出明智决策的关键。无论是资深交易员还是新手投资者,选择一款强大的行情工具都至关重要。本文为您精选了2025年最受市场好评的10款比特币实时行情工具,它们在数据深度、图表功能和用户体验方面各有千秋。 2025年十大比特币行情工具推荐 1、币安 (Bina…

    2025年12月9日
    000
  • 2025年加密货币空投新趋势:积分空投与代币经济模型解析

    Binance币安 欧易OKX ️ Huobi火币️ 2025年,加密货币空投已经不再是简单的“发钱”活动。项目方为了筛选真实用户、防止机器人和女巫攻击,同时激励长期生态参与,普遍转向了更精细化的策略——积分空投与精心设计的代币经济模型成为主流。 积分空投:从机械交互到深度参与 过去的空投模式依赖用…

    2025年12月9日
    000
  • 加密货币是怎么赚钱的?币圈10种常见的赚钱方式

    Binance币安 欧易OKX ️ Huobi火币️ 加密货币赚钱的核心是利用技术、市场波动和项目激励来获取收益。以下10种方式覆盖了从新手到进阶的不同路径,各有特点和适用人群。 空投与任务奖励 这是成本最低的入门方式。项目方为了推广新链或应用,会向早期用户免费发放代币。你只需要用钱 包参与测试网交…

    2025年12月9日
    000
  • 币圈自保指南:2025年十大加密货币社交工程骗局及防范介绍

    Binance币安 欧易OKX ️ Huobi火币️ 2025年,加密货币领域的社交工程骗局持续升级,攻击者不再只盯着代码漏洞,而是精准利用人性弱点。这些骗局往往发生在Discord、Telegram或X等社群中,通过伪装身份、建立信任后诱导用户操作钱 包或泄露信息。了解最新套路并建立防御习惯,是保…

    2025年12月9日
    000
  • 空投是什么意思?加密货币空投类型分析

    Binance币安 欧易OKX ️ Huobi火币️ 空投在加密货币领域指的是项目方免费向用户钱 包地址发放代币的行为。这并非随机撒钱,而是一种有明确目标的策略。项目通过空投来推广新代币、快速建立活跃的社区,并奖励早期参与者,以此激励网络效应和用户增长。理解其运作机制和潜在风险,是参与的前提。 常见…

    2025年12月9日
    000
  • 加密货币空投是什么?一文看懂如何获得加密货币空投!

    Binance币安 欧易OKX ️ Huobi火币️ 加密货币空投,简单说就是项目方免费向用户钱 包发送代币。这不仅是“天上掉馅饼”,更是项目推广、回馈早期支持者的重要手段。搞懂它,普通人也有机会低成本参与新项目。 空投的本质与目的 空投是区块链项目为了快速建立社区、提升知名度而采取的营销策略。项目…

    2025年12月9日
    000
  • Yei Finance(CLO)币是什么?值得投资吗?CLO代币经济与空投领取指南

    目录 Yei Finance (CLO) 最新动态Yei Finance是什么产品定位Yei Finance核心模块YeiBridge:跨链入账与结算YeiLend:借贷和流动性协调YeiSwap:交易和做市产品用途及路径典型的用户旅程预存款和积分生态系统进展和交易里程碑上市及衍生品社区和外部消息传…

    2025年12月9日
    000
  • 稳定币市场动态分析:监管趋严与市场震荡中的新机遇

    截至2025年10月,稳定币总市值正式突破3000亿美元,相较年初增幅接近50%,标志着其在全球金融生态中的地位进一步提升。然而,伴随规模扩张而来的是监管趋严与市场波动的双重压力。 美国于2025年7月通过《GENIUS法案》(68票支持,30票反对),为美元支付型稳定币设立联邦层面的监管标准,要求…

    2025年12月9日
    000
  • 比特币的最小单位:聪

    你是否曾好奇,当我们在谈论比特币(bitcoin)这种颠覆性数字货币时,它最小的组成部分究竟是什么?人们常说比特币昂贵,动辄数万甚至数十万美元一枚,这让许多人望而却步,认为参与比特币投资需要巨额资金。但事实真的如此吗?今天,我们就将深入探索比特币的“细胞”——那个被称为“聪”(satoshi)的最小…

    好文分享 2025年12月9日
    000
  • 比特币:点对点交易

    在数字货币的世界中,比特币无疑是那颗最耀眼的明星。它不仅仅是一种支付工具,更代表着一种颠覆性的金融理念——去中心化。然而,对于许多初次接触者而言,“点对点交易”这个词汇,可能仍旧带着一层神秘的面纱。它究竟意味着什么?又如何在实际操作中发生?本文将深入剖析比特币的点对点交易机制,揭示其背后的技术原理、…

    好文分享 2025年12月9日
    000
  • 12个10 月的计划 TGE 项目有哪些?一文汇总介绍

    目录 Monad ($MON) | 高性能的第 1 层区块链Enso(ENSO)| 跨链流动性协议Yei Finance(CLO)| Sei 网络上的货币市场Fleek ($FLK) | 轻松构建开放式网站和应用进程LAB ($LAB) | 多链交易终端Novastro ($XNL) | AI 驱动…

    2025年12月9日 好文分享
    000
  • 比特币的供应量

    比特币的供应量是一个经常被讨论的话题,它不仅仅是一个简单的数字,更是一个涉及到经济学、计算机科学和哲学深层含义的复杂系统。理解比特币的供应量,对于任何希望深入了解这种革命性数字货币的人来说都至关重要。它的稀缺性是其价值主张的核心,也是其区别于传统法定货币的关键特征之一。正是这种精心设计的稀缺性,使得…

    好文分享 2025年12月9日
    000
  • Enso(ENSO)币是什么?怎么样?ENSO代币经济与未来发展介绍

    Enso(ENSO)最新动态 币安(官方注册 官方下载)Alpha 将于10月14日率先上线 Enso (ENSO)! 符合条件的用户可在 Alpha 交易开放后,前往活动页面使用币安 Alpha 积分领取空投奖励。具体规则将后续公布。 请密切关注币安官方渠道,获取最新活动信息。 Enso是什么 E…

    2025年12月9日
    000
  • Enso(ENSO)币是什么?如何领取?ENSO代币经济与未来发展介绍

    目录 Enso(ENSO)最新动态Enso是什么Enso核心能力快捷引擎和原子执行统一 API/SDK 和多链读写实际用例和规模开发人员入职和集成路径三步快速集成何时选择 EnsoENSO币是什么ENSO代币经济基本面和通货膨胀跨链和可用性分配生态系统进展风险和限制路线图常问问题关键要点 enso …

    2025年12月9日 好文分享
    000
  • Polyhedra Network (ZKJ) 币是什么?ZKJ价格预测2025年、2026年和2030年

    目录 什么是Polyhedra Network(ZKJ)?Polyhedra Network(ZKJ)如何工作?ZKJ代币是什么?ZKJ 代币经济学Polyhedra Network(ZKJ)2025年、2026年和2030年价格预测Polyhedra Network (ZKJ) 2025 年价格预…

    2025年12月9日 好文分享
    000
  • Synthetix Network Token(SNX)币:未来走势如何? 2025-2031年价格预测

    Synthetix 项目概述 Synthetix 是一个去中心化%ignore_a_1%(DeFi)协议,致力于为全球用户提供更便捷的衍生品交易和流动性获取方式。与传统交易市场不同,Synthetix 基于共享资金池机制,允许用户无需直接买卖对手,即可交易多种金融资产,如合成资产、稳定币等。 该平台…

    2025年12月9日
    000
  • 十大值得关注的AI概念币是什么?2025最完整AI加密货币攻略、购买教程

    目录 什么是AI概念币?AI概念币面临的挑战AI概念币价格影响因素AI应用普及市场炒作其他虚拟货币市场十大AI概念币排名AI概念币介绍1、NEAR Protocol2、Fetch.ai3、Internet Computer4、Render5、The Graph6、Bittensor7、Singula…

    2025年12月9日 好文分享
    000
  • 狗狗币价格预测:多头能否引发 0.25 美元的突破?一文分析

    狗狗币(Dogecoin)是什么?值得投资吗? ‍ 狗狗币(Dogecoin)诞生于2013年12月,由软件开发者Billy Markus与Jackson Palmer共同推出,是迷因币(Meme Coin)的鼻祖。 当时两人认为加密货币氛围过于严肃,于是以轻松幽默的心态创造了狗狗币,并采用网络爆红…

    2025年12月9日 好文分享
    000

发表回复

登录后才能评论
关注微信