udio
-
0.5秒,无需GPU,Stability AI与华人团队VAST开源单图生成3D模型TripoSR
最近,文生视频模型 sora 掀起了新一轮生成式 ai 模型浪潮,模型的多模态能力引起广泛关注。 现在,AI 模型在 3D 内容生成方面又有了新突破。 在成功推出图片生成和视频生成项目之后,以视觉内容生成为专长的 Stability AI 现在正致力于拓展到3D领域。最新消息显示,该公司已与华人团队…
-
paddle实现食物分类
该项目用PaddlePaddle训练CNN实现food-11数据集的11类食物分类。先解压含训练、验证、测试集的数据集,制作标签文档,继承Dataset类生成数据集。构建含3个卷积层、池化层等的CNN,用Adam优化器等训练,训练5轮后保存模型,最后测试单张图片,虽准确率不高但跑通流程。 ☞☞☞AI…
-
Up主已经开始鬼畜,腾讯开源「AniPortrait」让照片唱歌说话
aniportrait 模型是开源的,可以自由畅玩。 「小破站鬼畜区的新质生产力工具。」 近日,腾讯开源发布的一个新项目在推上获得了如此评价。这个项目是 AniPortrait,其可基于音频和一张参考图像生成高质量动画人像。 话不说多,我们先看看可能会被律师函警告的 demo: 动漫图像也能轻松开口…
-
GenAI如何改变企业对数据的处理方式
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 2024年3月,将发布claude 3系列模型及其在众多基准测试中的成功表现,对企业来说是个好消息。看起来企业客户将能够从更多供应商那里获得更多高质量的ai和genai工具,以便评估和选择最好的…
-
六年种方式快速体验最新发布的 Llama 3!
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 昨晚meta发布了 llama 3 8b 和 70b 模型,llama 3 指令调整模型针对对话/聊天用例进行了微调和优化,在常见基准测试中优于许多现有的开源聊天模型。比如,gemma 7b 和…
-
DreamBooth:3步完成AIGC自由绘画创作
最近发飞桨更新了个比较好玩的模型DreamBooth,可以通过输入提示文本和图片实现自动切换主题背景,然后该模型也可以通过调整预训练模型来实现自定义的图片背景切换,类似一键切换背景,这个功能十分有趣,所以就想着可以自己导入图片让DreamBooth模型训练来生成一些相关有趣的新图片 ☞☞☞AI 智能…
-
车牌识别LPRNet
该项目为v1.0版本的车牌识别项目,对数据集做了更新,先对车牌矫正再识别,降低任务难度,40个epoch训练达验证集98.4%精度。实现模型与batch解耦,保证推理精度不受batch影响,可与车牌检测项目搭配。包含完整训练推理过程、模型转onnx及检查推理、数据集构建等内容。 ☞☞☞AI 智能聊天…
-
【金融风控系列】_[2]_欺诈识别
本文围绕IEEE-CIS欺诈检测赛题展开,目标是识别欺诈交易。介绍了训练集和测试集数据情况,含交易和身份数据字段。阐述了关键策略,如构建用户唯一标识、聚合特征等,还涉及特征选择、编码、验证策略及模型训练,最终线上评分为0.959221,旨在学习特征构建。 ☞☞☞AI 智能聊天, 问答助手, AI 智…
-
Monodepth2-基于自监督学习的单目深度估计模型
Monodepth2是ICCV2019发表的自监督单目深度估计方法,为Monodepth升级版。其结合双目图像与单目序列自监督方法,含深度预测和位姿变换预测网络,引入多种优化策略获当时SOTA。本文介绍其复现过程,用KITTI数据集,经640×192训练及1024×320微调,a…
-
基于PaddleNLP的智能文本纠错
本次赛题聚焦智能文本纠错,针对智媒与文化领域文本的语法、拼写等错误检测与纠正。介绍了数据集情况,初赛、决赛训练集含id、语句及修改后语句,测试集字段有差异。还阐述了基于百度ACL 2021相关策略的模型,包括文件结构、训练、预测、部署步骤及参考文献,模型在SIGHAN测试集有一定效果。 ☞☞☞AI …