自己动手使用AI技术实现数字内容生产

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

自己动手使用AI技术实现数字内容生产

背景

今年以来以chatgpt为代表的大模型的惊艳表现彻底点燃了AICG这个领域的。各类gpt,各种AI作图产品如雨后春笋般出现。每个成功产品的背后都是一个个精妙的算法,本篇文章给大家详细介绍下如何使用一个手机拍摄若干张同一场景的照片,然后合成新视角,生成视频的流程与代码。本文使用的技术是NeRF(Neural Radiance Fields),它是2020年以来出现的一种基于深度学习的3D重建方法,它通过学习场景的光线传输和辐射传递,能够生成高质量的场景渲染图像和3D模型。关于它的原理与文献,我在最后有一个参考列表供大家学习。本文主要从代码使用以及环境搭建的新角度介绍它。

环境搭建

environment.yml修改

本文使用的硬件环境是 GPU RTX3090,操作系统是windows 10.采用的软件是开源的NeRF实现(https://github.com/cjw531/nerf_tf2)。由于RTX 3090需要CUDA 11.0及以上版本的支持,TensorFlow-gpu 需要2.4.0以及以上的支持,所以我们没有选择官方的https://github.com/bmild/nerf,因为bmild这个的环境使用的tensorflow-gpu==1.15,版本太久了。跑起来会有下面的问题https://github.com/bmild/nerf/issues/174#issue-1553410900,我在这个tt中也回复指出了需要升级到2.8。但是即便是使用https://github.com/cjw531/nerf_tf2,它的环境也是有点问题。首先由于它连接的国外的conda的channel,所以速度很慢。其次它的环境使用的是tensorflow==2.8没有指明tensorflow-gpu的版本。针对这两个问题。我们对environment.yml进行了修改。

# To run: conda env create -f environment.ymlname: nerf_tf2channels:- https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/- conda-forgedependencies:- python=3.7- pip- cudatoolkit=11.0- cudnn=8.0- numpy- matplotlib- imageio- imageio-ffmpeg- configargparse- ipywidgets- tqdm- pip:- tensorflow==2.8- tensorflow-gpu==2.8- protobuf==3.19.0- -i https://pypi.tuna.tsinghua.edu.cn/simple

启动conda环境

打开cmd,然后输入下面的命令。

conda env create -f environment.yml

将nerf_tf2加入到jupyter中,这样使用jupyter能很方便的查看系统的运行结果。

// 安装ipykernelconda install ipykernel
//是该conda环境在jupyter中显示python -m ipykernel install --user --name 环境名称 --python -m ipykernel install --user --name 环境名称 --display-name "jupyter中显示名称"display-name "jupyter中显示名称"
//切换到项目目录cd 到项目目录//激活conda环境activate nerf_tf2//在cmd启动jupyterjupyter notebook

至此conda环境以及jupyter准备就绪。

数据准备

下载并安装colmap,我的环境是windows(https://demuc.de/colmap/#download)使用https://github.com/fyusion/llff提供的imgs2poses.py实现自己相机拍摄的图片的相机内外参数的获取,比如我们的拍摄了10张图片,它们放置的目录位置很讲究,D:/LanJing/AI/LLFF/data/images,也就是说一定要放在images子目录下面。而你传入的参数是python imgs2poses.py D:/LanJing/AI/LLFF/data。因为它的代码里面的images_path的写法是这个样子(https://github.com/Fyusion/LLFF/blob/master/llff/poses/colmap_wrapper.py#L28)

自己动手使用AI技术实现数字内容生产

手机拍摄的图片样例

feature_extractor_args = ['colmap', 'feature_extractor','--database_path', os.path.join(basedir, 'database.db'),'--image_path', os.path.join(basedir, 'images'),'--ImageReader.single_camera', '1',# '--SiftExtraction.use_gpu', '0',]

自己动手使用AI技术实现数字内容生产

python imgs2poses.py

运行完imgs2poses.py文件后,生成了sparse目录、colmap_out.txt、database.db、poses_bounds.npy,然后我们在nerf_tf2项目下创建新目录data/nerf_llff_data/ll,将上面的sparse目录以及poses_bounds.npy复制到这个目录下。最后我们再配置个新文件config_ll.txt。至此我们的数据准备工作完成了。

expname = ll_testbasedir = ./logsdatadir = ./data/nerf_llff_data/lldataset_type = llfffactor = 8llffhold = 8N_rand = 1024N_samples = 64N_importance = 64use_viewdirs = Trueraw_noise_std = 1e0

训练

将开源软件迁移到windows平台上。

由于此开源软件主要是支持mac和linux,它无法在windows运行,需要对load_llff.py的修改。

自己动手使用AI技术实现数字内容生产

load_llff代码迁移

运行300000次批量训练。

activate nerf_tf2python run_nerf.py --config config_ll.txt

测试

自己动手使用AI技术实现数字内容生产

render_demo的运行

效果

由于我们使用的输入图片有些少,只有10张,所以运行出来的效果不是很好,但是整体的流程是一样。tips:官方的代码里面使用的一半都是30,甚至100张图片。

我们的效果

自己动手使用AI技术实现数字内容生产

一个新视角的渲染

官方效果

自己动手使用AI技术实现数字内容生产

fern官方合成新视角效果

参考资料

https://zhuanlan.zhihu.com/p/554093703。

https://arxiv.org/pdf/2003.08934.pdf。

https://zhuanlan.zhihu.com/p/593204605。

怪兽AI数字人 怪兽AI数字人

数字人短视频创作,数字人直播,实时驱动数字人

怪兽AI数字人 44 查看详情 怪兽AI数字人

https://inst.eecs.berkeley.edu/~cs194-26/fa22/Lectures/nerf_lecture1.pdf。

以上就是自己动手使用AI技术实现数字内容生产的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/520317.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月9日 05:15:29
下一篇 2025年11月9日 05:18:47

相关推荐

  • Mira Network(MIRA)币是什么?MIRA代币经济与空投领取指南

    币安(官方注册 官方下载) Alpha 将成为首个上线9 月 26 日 Mira Network (MIRA)的平台! 符合条件的用户可于 Alpha 交易开放后,前往 Alpha 活动页面使用币安 Alpha 积分领取空投。具体详情将另行公布。 敬请关注币安官方渠道,及时获取活动最新动态。 Mir…

    2025年12月11日
    000
  • USDT vs USDC:稳定币的终极对决,一文差异介绍

    目录 USDT 与 USDC 的历史:从先驱到挑战者Tether 与 USDT 的起源早期成长与争议Circle 与 USDC 的崛起USDT 与 USDC 背后的人物USDT 与 USDC 的根本差异Tether 的财务优势与盈利模式Circle 的上市策略与华尔街集成GENIUS 法案究竟带来了…

    2025年12月11日 好文分享
    000
  • Bittensor(TAO) 币是什么?去中心化人工智能、代币经济及未来介绍

    目录 什么是 Bittensor TAO,它是如何运作的?Bittensor 去中心化 AI 网络背后的技术TAO 代币经济与分配模式Root Network 与其在 TAO 分配中的角色动态 TAO 更新与市场驱动奖励Bittensor 开发时间表和关键里程碑现实应用与活跃子网Bittensor …

    2025年12月11日 好文分享
    000
  • 华尔街专家Tom Lee:比特币(BTC)和以太坊(ETH)可能在未来3个月出现”巨幅上

    目录 以太坊交易如同1971年的华尔街 BitMine持续增持ETH ‍ Fundstrat的Tom Lee预测,随着美联储降息及流动性环境转暖,比特币与以太坊有望在2024年第四季度迎来强劲上涨。 BitMine董事长兼Fundstrat联合创始人Tom Lee指出,美国货币政策转向宽松将为比特币…

    2025年12月11日
    000
  • AI与区块链融合:未来科技发展趋势

    在数字经济浪潮中,人工智能(ai)与区块链技术的深度融合,正成为一股不可逆转的洪流,塑造着未来科技发展的全新格局。这种融合不仅是技术层面的简单叠加,更是理念与实践的交织,有望解决当前数字世界面临的诸多挑战,例如数据信任、隐私保护、效率提升等。想象一下,一个由智能合约驱动的供应链,每个环节的数据都由a…

    好文分享 2025年12月11日
    000
  • 用五千元如何在币圈牛市赚到百万

    在加密货币的牛市周期中,市场情绪高涨,资金大量涌入,为小额资本创造了实现指数级增长的理论可能性。将五千元的初始本金增值至百万,意味着需要实现近两百倍的回报。这并非一个简单的押注游戏,而是一场涉及策略、信息、情绪控制和时机把握的综合性博弈。 2025主流数字货币交易所: 1、欧易OKX: 注册入口: …

    2025年12月11日
    000
  • 探索加密货币市场的高频交易策略

    探索加密货币市场的高频交易策略,无疑是当下金融科技领域最令人振奋的话题之一。在这个24/7不间断运作的数字资产世界里,速度与效率成为了决定成败的关键。高频交易(hft)并非仅仅是快速买卖那么简单,它是一门集成了先进算法、复杂数学模型和尖端技术的艺术,旨在利用市场中稍纵即逝的微小机会。从市场微结构的不…

    好文分享 2025年12月11日
    000
  • 加密货币能长期投资吗?加密货币哪些是真的哪些是假的?

    随着人工智能技术的飞速发展,AI绘画已成为创意领域的一大热点。本文将为您盘点并详细介绍2024年最受瞩目的五款AI绘画工具,帮助您无论新手还是专业人士,都能快速找到最适合自己的创作利器,开启无限的想象力之旅。 一、Midjourney 1、图像质量的标杆:midjourney以其生成图像的惊人艺术感…

    2025年12月11日
    000
  • 什么是 Sahara AI(SAHARA币)?SAHARA未来前景及价格预测

    目录 什么是 Sahara AI?Sahara AI 如何运作?公司概况与内核愿景1. 关键发展历程2. 市场定位内核技术优势1. 去中心化网络架构2. 自主知识代理(Sahara KA)3. 数据服务(Sahara Data)产品体系与商业模式1. 内核产品矩阵2. 代币经济模型3. 企业级合作案…

    2025年12月11日
    000
  • 以太坊、加密货币与市场动态:究竟发生了什么?

    以太坊gas上限上调,xrp、solana与狗狗币强势一周,以及柴犬币的销毁机制。带你掌握加密货币市场的最新变化。 以太坊、加密资产与市场趋势:到底发生了哪些变化? 加密货币市场持续波动,近期以太坊及其他数字资产出现了值得关注的动态。我们一起来看看最新的市场走势,并分析其背后的原因。 以太坊Gas上…

    2025年12月11日
    000
  • 比特币、山寨币与小额代币:穿越加密货币丛林

    深入探索比特币、瑞波币与波场币的奇妙世界,同时挖掘那些价格低廉却潜力巨大的加密资产,并关注市场中的新兴动向与潜在机会。 加密货币市场真可谓风云变幻,对吧?比特币持续上涨,不断刷新历史高点,而其他替代币也紧随其后。此外,还有一类低价币种,正以高回报的诱惑吸引着敢于冒险的投资者。我们不妨以纽约客的笔调,…

    2025年12月11日
    000
  • 手把手教你用PHP和ChatGPT生成个性化简历网站

    用PHP和ChatGPT打造个性化简历网站,首先准备PHP环境、编辑器及OpenAI API Key;创建项目结构并配置API;封装ChatGPT接口函数;通过清晰指令生成自我介绍、技能列表等内容;结合CSS美化页面;利用ChatGPT获取设计建议实现风格独特;优化Prompt、验证内容准确性并人工…

    2025年12月11日 好文分享
    000
  • 自由职业者神器 PHP加ChatGPT自动回复客户邮件

    答案:PHP结合ChatGPT可实现客户邮件自动回复,提升自由职业者效率。通过IMAP收取邮件,调用OpenAI API生成专业回复,再通过SMTP自动发送,核心在于合理设计Prompt以提升回复质量,并配合定时任务执行。需注意垃圾邮件、信息泄露、上下文理解偏差、API安全与调用成本等风险。建议结合…

    2025年12月11日 好文分享
    000
  • 2025年哪些AI代币值得关注?

    2025年AI加密市场迎来爆发,总市值达295亿美元,AI代币在去中心化应用中占比18.6%,Bittensor、ASI、NEAR、Render等项目推动基础设施、公链性能与算力网络发展,AI代理预计执行90%链上交易,但需警惕泡沫风险、代理错误及区块链最终性矛盾。 随着人工智能与区块链技术的深度融…

    2025年12月10日
    000
  • 分析师Jordi Visser分析:预计比特币(BTC)表现将如英伟达一样,在创新高前出现重大

    市场分析师Jordi Visser指出,比特币未来的表现或将复刻英伟达的走势,在冲击新高过程中经历数次幅度达20%甚至更大的回调。 Visser认为,尽管第四季度通常是加密资产表现强劲的时期,但比特币迈向历史新高的途中仍不可避免地会出现显著调整,其中部分回调可能超过20%。 他强调,比特币正日益融入…

    2025年12月10日
    000
  • ​​ChatGPT玩转加密货币!从基础概念到实战操作的完整指南​

    随着人工智能技术的飞速发展,强大的语言模型正成为我们探索新领域的得力助手。对于复杂且信息密集的加密世界而言,善用AI工具可以极大地提升认知效率和决策质量。本文将全面介绍如何利用ChatGPT,从零开始理解加密资产,并逐步深入到实战操作的各个环节。 加密货币全球主流交易所官方地址 1、币安Binanc…

    2025年12月10日
    000
  • 如何使用ChatGPT 进行加密货币?功能用法指南

    目录 如何利用AI 助手构建你的加密交易日程1. 在开启图表前发展一个交易前例行公事2. 标出高冲击事件3. 扫描主要涨幅/跌幅4. 建立早晨清单如何生成和验证加密货币交易设置与ChatGPT?1. 多情境交易规划多头情境:从50-SMA反弹空头情境:跌破50-SMA2. 订单流程解释与重新评估BT…

    2025年12月10日 好文分享
    000
  • Ultiverse(ULTI币)是什么?ULTI代币经济学、价格预测及购买流程

    目录 什么是Ultiverse?Ultiverse团队背景Ultiverse的特点什么是ULTI代币?ULTI代币的应用/用途Ultiverse 如何运作?ULTI币的优势与劣势ULTI代币经济学ULTI分配ULTI币值得投资吗?Ultiverse价格预测Ultiverse 2025 年价格预测Ul…

    2025年12月10日 好文分享
    000
  • ChatGPT助力加密货币交易!详解如何用它分析市场趋势与制定策略

    ChatGPT可作为加密投资的智能辅助工具,但不能替代独立决策。1、它是OpenAI开发的语言模型,能回答问题、生成文本并进行逻辑推理;2、用户可通过官网注册使用,以自然对话形式提问;3、其核心是信息处理助手,不提供投资建议。在市场分析中,1、可用于快速整合与摘要新闻或白皮书内容;2、帮助通俗解读“…

    2025年12月10日
    000
  • ChatGPT与加密货币结合!探索AI在区块链投资中的创新应用

    人工智能与区块链技术的结合,正在为加密货币投资领域带来全新的玩法与机遇。借助ChatGPT等先进AI工具,投资者可以更快获取信息、优化策略,并提升决策效率。以下榜单汇总了AI在加密货币投资中的十大创新应用,涵盖主流交易所、分析工具与实用入口,帮助投资者在瞬息万变的市场中占据先机。 AI+加密货币投资…

    2025年12月10日
    000

发表回复

登录后才能评论
关注微信