Tensorflow 音乐预测

tensorflow 音乐预测

在本文中,我展示了如何使用张量流来预测音乐风格。
在我的示例中,我比较了电子音乐和古典音乐。

你可以在我的github上找到代码:
https://github.com/victordalet/sound_to_partition

i – 数据集

第一步,您需要创建一个数据集文件夹,并在里面添加一个音乐风格文件夹,例如我添加一个 techno 文件夹和 classic 文件夹,其中放置我的 wav 歌曲。

ii – 火车

我创建一个训练文件,参数 max_epochs 需要完成。

修改构造函数中与数据集文件夹中您的目录对应的类。

在加载和处理方法中,我从不同的目录检索wav文件并获取频谱图。

出于训练目的,我使用 keras 卷积和模型。

import osimport sysfrom typing import listimport librosaimport numpy as npfrom tensorflow.keras.layers import input, conv2d, maxpooling2d, flatten, densefrom tensorflow.keras.models import modelfrom tensorflow.keras.optimizers import adamfrom sklearn.model_selection import train_test_splitfrom tensorflow.keras.utils import to_categoricalfrom tensorflow.image import resizeclass train:    def __init__(self):        self.x_train = none        self.x_test = none        self.y_train = none        self.y_test = none        self.data_dir: str = 'dataset'        self.classes: list[str] = ['techno','classic']        self.max_epochs: int = int(sys.argv[1])    @staticmethod    def load_and_preprocess_data(data_dir, classes, target_shape=(128, 128)):        data = []        labels = []        for i, class_name in enumerate(classes):            class_dir = os.path.join(data_dir, class_name)            for filename in os.listdir(class_dir):                if filename.endswith('.wav'):                    file_path = os.path.join(class_dir, filename)                    audio_data, sample_rate = librosa.load(file_path, sr=none)                    mel_spectrogram = librosa.feature.melspectrogram(y=audio_data, sr=sample_rate)                    mel_spectrogram = resize(np.expand_dims(mel_spectrogram, axis=-1), target_shape)                    data.append(mel_spectrogram)                    labels.append(i)        return np.array(data), np.array(labels)    def create_model(self):        data, labels = self.load_and_preprocess_data(self.data_dir, self.classes)        labels = to_categorical(labels, num_classes=len(self.classes))  # convert labels to one-hot encoding        self.x_train, self.x_test, self.y_train, self.y_test = train_test_split(data, labels, test_size=0.2,                                                                                random_state=42)        input_shape = self.x_train[0].shape        input_layer = input(shape=input_shape)        x = conv2d(32, (3, 3), activation='relu')(input_layer)        x = maxpooling2d((2, 2))(x)        x = conv2d(64, (3, 3), activation='relu')(x)        x = maxpooling2d((2, 2))(x)        x = flatten()(x)        x = dense(64, activation='relu')(x)        output_layer = dense(len(self.classes), activation='softmax')(x)        self.model = model(input_layer, output_layer)        self.model.compile(optimizer=adam(learning_rate=0.001), loss='categorical_crossentropy', metrics=['accuracy'])    def train_model(self):        self.model.fit(self.x_train, self.y_train, epochs=self.max_epochs, batch_size=32,                       validation_data=(self.x_test, self.y_test))        test_accuracy = self.model.evaluate(self.x_test, self.y_test, verbose=0)        print(test_accuracy[1])    def save_model(self):        self.model.save('weight.h5')if __name__ == '__main__':    train = train()    train.create_model()    train.train_model()    train.save_model()

iii-测试

为了测试和使用模型,我创建了这个类来检索权重并预测音乐的风格。

不要忘记将正确的类添加到构造函数中。

from typing import Listimport librosaimport numpy as npfrom tensorflow.keras.models import load_modelfrom tensorflow.image import resizeimport tensorflow as tfclass Test:    def __init__(self, audio_file_path: str):        self.model = load_model('weight.h5')        self.target_shape = (128, 128)        self.classes: List[str] = ['techno','classic']        self.audio_file_path: str = audio_file_path    def test_audio(self, file_path, model):        audio_data, sample_rate = librosa.load(file_path, sr=None)        mel_spectrogram = librosa.feature.melspectrogram(y=audio_data, sr=sample_rate)        mel_spectrogram = resize(np.expand_dims(mel_spectrogram, axis=-1), self.target_shape)        mel_spectrogram = tf.reshape(mel_spectrogram, (1,) + self.target_shape + (1,))        predictions = model.predict(mel_spectrogram)        class_probabilities = predictions[0]        predicted_class_index = np.argmax(class_probabilities)        return class_probabilities, predicted_class_index    def test(self):        class_probabilities, predicted_class_index = self.test_audio(self.audio_file_path, self.model)        for i, class_label in enumerate(self.classes):            probability = class_probabilities[i]            print(f'Class: {class_label}, Probability: {probability:.4f}')        predicted_class = self.classes[predicted_class_index]        accuracy = class_probabilities[predicted_class_index]        print(f'The audio is classified as: {predicted_class}')        print(f'Accuracy: {accuracy:.4f}')

以上就是Tensorflow 音乐预测的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1349448.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
php代码如何操作JSON数据_php代码解析和生成JSON的方法
上一篇 2026年5月10日 11:26:12
Python代码如何实现定时任务 Python代码使用Schedule模块的配置
下一篇 2026年5月10日 11:26:12

相关推荐

  • 开源免费PHP工具 PHP开发效率提升利器

    推荐开源免费PHP开发工具以提升效率:VS Code、Sublime Text轻量高效,PhpStorm专业强大;调试用Xdebug、Kint、Ray;依赖管理选Composer;代码质量工具包括PHPStan、Psalm、PHP_CodeSniffer;数据库管理可用%ignore_a_1%MyA…

    2026年5月10日
    000
  • Python官网用户调查的参与方式_Python官网反馈提交详细教程

    答案是通过访问Python官网新闻页面、邮件邀请链接或GitHub仓库提交反馈。具体为:访问官网查找用户调查公告,或点击邮件中的专属链接参与,在GitHub的cpython仓库提交技术建议,并注意如实填写问卷与保护隐私。 如果您希望参与Python官网的用户调查并提交反馈,可以通过官方指定的渠道完成…

    2026年5月10日
    000
  • Go语言连接外部MySQL数据库:DSN配置与常见错误解析

    本文详细阐述了go语言使用`go-sql-driver/mysql`驱动连接外部mysql数据库的正确方法。重点介绍了数据源名称(dsn)的规范格式,特别是主机地址部分的配置,以避免常见的“getaddrinfow: the specified class was not found.”等网络解析错…

    2026年5月10日
    000
  • 学习了Python的Flask后,Go语言的Web框架该选Gin还是Beego?

    学习编程时,选择合适的框架至关重要。许多开发者在掌握Python Flask后,转向Go语言Web开发时,常常在Gin和Beego之间难以抉择。本文将深入分析,助您做出明智选择。 虽然网上搜索结果多建议使用Go原生标准库http,但实际上所有框架都是对http的封装。虽然使用http开发灵活,但工作…

    2026年5月10日
    000
  • JavaScript动态下拉菜单:实现日期选项与价格计算关联

    在现代web应用中,动态生成表单元素并使其具备交互逻辑是常见的需求。特别是在需要根据用户选择调整价格或服务参数的场景下,下拉菜单()常被用来展示一系列选项。本教程将指导您如何利用javascript动态生成一个包含日期选项的下拉菜单,并为每个选项关联一个具体的数值(如剩余天数),进而实现一个基于用户…

    2026年5月10日
    000
  • 如何在不暴露密钥的情况下,在客户端创建 Stripe Payment Link

    本文介绍了在纯静态网站环境下,如何利用 Stripe Payment Link 实现商品售卖,并着重讨论了在不暴露 Stripe 密钥的前提下,客户端创建 Payment Link 的可行性。分析了直接在客户端使用密钥的风险,并提出了预先生成 Payment Link 或使用后端服务动态生成 Pay…

    2026年5月10日
    000
  • 解决Go语言中GOPATH未设置错误及工作区配置指南

    本文旨在解决go语言开发中常见的“gopath not set”错误,并提供详细的go工作区配置指南。内容涵盖`gopath`环境变量的设置、go项目目录结构、`path`变量的扩展,以及一些高级配置技巧,旨在帮助开发者建立一个高效、规范的go开发环境,确保包的下载、编译和运行顺利进行。 Go语言在…

    2026年5月10日
    000
  • 掌握 JavaScript 中的高阶函数

    现代 javascript 开发严重依赖函数式编程,掌握其基本思想将极大提高你的编码能力。 高阶函数是这个范式最有力的武器之一。为了帮助您掌握它们,本文将介绍它们的定义、应用程序和独特的实现。 1. 函数式编程 函数式编程是一种编程范式,强调: 纯函数:没有副作用的函数,对于相同的输入返回相同的输出…

    2026年5月10日
    000
  • Golang使用assert库简化测试断言

    使用testify/assert库可提升Go测试代码的可读性和效率,通过go get github.com/stretchr/testify/assert安装后导入包,用assert.Equal等函数替代冗长的手动判断,支持丰富断言方法如Equal、True、Nil、Contains等,并可添加自定…

    2026年5月10日
    100
  • 如何处理在线编辑HTML时外部链接验证的处理方法

    在线编辑HTML时需验证外部链接以保障安全与可用性,可通过自动检测标记外链并添加rel属性提升安全性;2. 实时验证链接有效性,利用HEAD请求检查状态码并在编辑界面提示结果;3. 配置可信域名白名单控制高风险链接输入,适用于合规要求高的场景;4. 提供友好反馈机制,对无效或可疑链接弹出提示并支持新…

    2026年5月10日
    000
  • 怎样为C++配置嵌入式AI开发环境 TensorFlow Lite Micro移植指南

    怎样为C++配置嵌入式AI开发环境 TensorFlow Lite Micro移植指南怎样为C++配置嵌入式AI开发环境 TensorFlow Lite Micro移植指南怎样为C++配置嵌入式AI开发环境 TensorFlow Lite Micro移植指南怎样为C++配置嵌入式AI开发环境 TensorFlow Lite Micro移植指南

    要在c++++项目中使用tensorflow lite micro进行嵌入式ai开发,关键步骤包括:1. 确定mcu平台并安装对应的交叉编译工具链;2. 配置python环境并安装必要的依赖包;3. 获取并裁剪tflm源码,保留核心模块;4. 将tflm静态库集成到c++工程中;5. 按照模型加载、…

    2026年5月10日 用户投稿
    000
  • Golang图片处理技巧 imaging库裁剪缩放

    答案:使用Go语言的imaging库可高效实现图片裁剪与缩放,其API简洁易用,支持多种缩放算法(如Lanczos、CatmullRom)以平衡质量与性能,提供Crop和CropAnchor两种裁剪方式实现精确区域控制,并建议通过算法选择、内存管理、并发处理和错误校验等策略优化性能与稳定性。 在Go…

    2026年5月10日
    000
  • 如何通过GitHub API高效获取超过100个用户列表(分页教程)

    本教程旨在解决使用GitHub API获取用户列表时遇到的默认100个用户限制问题。我们将详细介绍两种主要的分页策略:利用Octokit库内置的paginate方法实现自动化分页,以及手动实现基于since参数的循环分页逻辑。文章将提供清晰的代码示例,并强调在不同场景下选择合适方法的注意事项,特别是…

    2026年5月10日
    000
  • c语言里面字符是什么意思

    字符在 C 语言中以单个字节存储于 char 变量中,用单引号括起表示常量,例如 ‘A’。字符变量用于存储字符值,可使用函数如 putchar() 输出、getchar() 输入、toupper() 转换大小写。字符数组存储多个字符,如 char name[10]。字符串是带…

    2026年5月10日
    000
  • Go语言集成SQLite3数据库:使用go-sqlite3库的实践指南

    本文旨在为Go语言开发者提供一套完整的SQLite3数据库集成指南。我们将重点介绍如何使用广受欢迎的github.com/mattn/go-sqlite3库,涵盖其安装、数据库连接、表创建、数据插入、查询、更新及删除等核心操作,并提供实用的代码示例和注意事项,助您高效地在Go应用中实现SQLite3…

    2026年5月10日
    000
  • 它的未来:自动化和人工智能如何改变发展

    自动化与人工智能:IT领域的未来发展 自动化和人工智能(AI)正在深刻地改变着软件开发和IT专业人员的工作方式。从自动化重复性任务到将AI工具融入开发流程,这些技术为IT行业带来了新的机遇和挑战。 1. DevOps中的自动化:简化开发流程 自动化正在彻底改变开发人员管理开发和部署流程的方式。持续集…

    2026年5月10日
    000
  • 实时加密深度分析平台盘点?3款开源数据源

    CryptoWatch开源接口提供高频更新的全球交易所深度数据,支持多语言调用与可视化渲染;2. TradingView开源脚本集成Pine Script模板,可自定义订单簿深度分析并设置买卖压力警报;3. OpenBB Terminal支持本地部署,结合命令行拉取加密资产深度数据,实现技术指标叠加…

    2026年5月10日
    000
  • Go应用中基于gorilla/mux的模块化路由管理策略

    本文探讨了在go应用中使用`gorilla/mux`实现模块化路由的有效策略。针对大型应用中路由配置日益复杂的问题,我们提出了一种去中心化的解决方案:通过在各个模块的`init()`函数中注册其专属路由到全局路由表,`main`函数统一加载,从而实现路由的清晰分离与高效管理,提升代码可维护性。 在构…

    2026年5月10日
    000
  • PHP大型配置管理:结构化数据与外部文件实践

    本文旨在探讨在php项目中高效管理大量配置项的最佳实践。我们将摒弃直接创建数百个独立php变量或在配置文件中混合代码的低效方式,转而介绍如何利用php数组以及ini、json、yaml等外部结构化数据格式来组织和加载配置,并结合业务逻辑进行处理,从而提升代码的可维护性、可扩展性和专业性。 在PHP应…

    2026年5月10日
    100
  • Go 版本升级后依赖编译错误解决方案

    本文旨在解决 Go 语言版本升级(如从 1.1.1 到 1.1.2)后,由于依赖包编译缓存导致的项目编译错误。我们将深入探讨错误原因,并提供包括 `go clean -i` 和 `go install -a` 在内的有效清理和重建策略,确保您的 Go 项目在升级后能顺利编译运行。同时,文章也将强调 …

    2026年5月10日
    000

发表回复

登录后才能评论
关注微信