使用 Streamlit 将机器学习模型部署为 Web 应用程序

介绍

机器学习模型本质上是一组用于进行预测或查找数据模式的规则或机制。简单地说(不用担心过于简单化),在 excel 中使用最小二乘法计算的趋势线也是一个模型。然而,实际应用中使用的模型并不那么简单——它们常常涉及更复杂的方程和算法,而不仅仅是简单的方程。

在这篇文章中,我将首先构建一个非常简单的机器学习模型,并将其作为一个非常简单的 Web 应用程序发布,以了解该过程。

在这里,我将只关注流程,而不是 ML 模型本身。 Alsom 我将使用 Streamlit 和 Streamlit Community Cloud 轻松发布 Python Web 应用程序。

长话短说:

使用 scikit-learn(一种流行的机器学习 Python 库),您可以快速训练数据并创建模型,只需几行代码即可完成简单任务。然后可以使用 joblib 将模型保存为可重用文件。这个保存的模型可以像 Web 应用程序中的常规 Python 库一样导入/加载,从而允许应用程序使用经过训练的模型进行预测!

应用网址:https://yh-machine-learning.streamlit.app/
GitHub:https://github.com/yoshan0921/yh-machine-learning.git

技术栈

PythonStreamlit:用于创建 Web 应用程序界面。scikit-learn:用于加载和使用预先训练的随机森林模型。NumPy 和 Pandas:用于数据操作和处理。Matplotlib 和 Seaborn:用于生成可视化。

我做了什么

此应用程序允许您检查在帕尔默企鹅数据集上训练的随机森林模型所做的预测。 (有关训练数据的更多详细信息,请参阅本文末尾。)

具体来说,该模型根据各种特征来预测企鹅物种,包括物种、岛屿、喙长、鳍状肢长度、体型和性别。用户可以导航应用程序以查看不同的特征如何影响模型的预测。

预测屏幕
使用 Streamlit 将机器学习模型部署为 Web 应用程序

学习数据/可视化屏幕
使用 Streamlit 将机器学习模型部署为 Web 应用程序

开发步骤

步骤1.创建模型

Feature and Target Definition: Features (X_raw) are separated from the target variable (y_raw).One-hot Encoding: Categorical variables island and sex are converted into numerical format using one-hot encoding (X_encoded). The target variable species is mapped to numerical values (y_encoded).Data Splitting: The dataset is split into training (70%) and testing (30%) sets using train_test_split.Model Training: A RandomForestClassifier is trained on the training data (x_train, y_train).Model Evaluation: The accuracy of the model is calculated and displayed for both the training and testing sets.Model Saving: The trained model is saved to a file named penguin_classifier_model.pkl using joblib.

Step2. Building the Web App and Integrating the Model

特征和目标定义:特征(X_raw)与目标变量(y_raw)分离。One-hot 编码:分类变量 island 和 sex 使用 one-hot 编码 (X_encoded) 转换为数字格式。目标变量物种映射为数值(y_encoded)。数据分割:使用train_test_split将数据集分割成训练集(70%)和测试集(30%)。模型训练:随机森林分类器在训练数据(x_train,y_train)上进行训练。模型评估:计算并显示训练集和测试集的模型准确性。模型保存:训练好的模型使用 joblib 保存到名为 penguin_classifier_model.pkl 的文件中。

步骤2。构建 Web 应用程序并集成模型

使用 Streamlit 将机器学习模型部署为 Web 应用程序

用于输入特征的 Streamlit 接口:代码使用 Streamlit 创建一个交互式界面,用户可以在其中输入性别、岛屿、bill_length_mm、bill_depth_mm、flipper_length_mm 和 body_mass_g 等特征以用于预测。

数据编码和准备:用户输入被转换为 DataFrame,并对分类变量(岛屿、性别)进行 one-hot 编码。该代码通过添加模型训练期间存在的任何缺失列来确保输入数据与预期格式匹配。模型加载:使用 joblib 从名为 penguin_classifier_model.pkl 的文件加载预训练的机器学习模型。这使模型准备好根据用户输入进行预测。预测执行:模型根据编码的输入特征预测企鹅种类,计算每次预测的概率并转换为百分比。结果展示:预测结果,包括预测的物种和每个物种的概率,都显示在Streamlit界面上,用进度条直观地表示预测的置信度。 关于数据集@allison_horst 的艺术作品 (https://github.com/allisonhorst)该模型是使用 Palmer Penguins 数据集进行训练的,这是一个广泛认可的用于练习机器学习技术的数据集。该数据集提供了来自南极洲帕尔默群岛的三种企鹅(阿德利企鹅、帽带企鹅和巴布亚企鹅)的信息。主要功能包括:

种类:企鹅的种类(阿德利企鹅、帽带企鹅、巴布亚企鹅)。?岛屿:观察到企鹅的特定岛屿(Biscoe、Dream、Torgersen)。??Bill Length:企鹅的嘴的长度(毫米)。??Bill Depth:企鹅喙的深度(毫米)。??鳍状肢长度:企鹅鳍状肢的长度(毫米)。??体重:企鹅的质量(克)。??性别:企鹅的性别(雄性或雌性)。???该数据集源自 Kaggle,可以在此处访问。特征的多样性使其成为构建分类模型和了解每个特征在物种预测中的重要性的绝佳选择。? ? ?

以上就是使用 Streamlit 将机器学习模型部署为 Web 应用程序的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1349536.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年12月13日 12:55:01
下一篇 2025年12月13日 12:55:14

相关推荐

  • 模拟 Python 类

    最近,我必须使用 pytest 为 python 模块编写单元测试。该模块包含一个类,其他类在其构造函数中初始化。 像往常一样,我为此类创建了一个固定装置,以便轻松为每个类方法编写测试。此时,当我尝试模拟构造函数中启动的不同类时,我遇到了一些问题。模拟不起作用,这些类的实例仍在创建中。 经过一些研究…

    2025年12月13日
    000
  • 为 Shutil 添加多线程?!

    讨论shutil.copytree添加多线程 ** 我在 python 上写的讨论:https://discuss.python.org/t/add-multithreading-to-shutil-copytree/62078 ** 背景 shutil 是 python 中一个非常有用的模块。你可…

    2025年12月13日
    000
  • Python 元组、集合和字典 || #f #daysofMiva 日

    今天是 #100daysofmiva 的第 5 天 – 请参阅 github 项目。 我深入研究了 python 中的三种基本数据结构:元组、集合和字典。这些结构对于有效组织和访问数据至关重要,每个结构都具有独特的特征和用例。这是我所学到的详细报告,包括流程、技术细节和代码示例。 1.元…

    2025年12月13日
    000
  • 由于源冻结期导致 AWS DMS 表失败

    我们正在将AWS DMS与db2连接以迁移数据。在源中,我们有大约 8 小时的冻结期,因此我们将停止并恢复 DMS 服务。 一旦我们恢复 DMS,大多数表将恢复,但由于某些更改,某些表仍将被锁定,从而导致“表错误”状态。此后我们无法恢复表,唯一的选项是重新加载。 我们无法定义牌桌列表或这些牌桌的发布…

    2025年12月13日
    000
  • Python 技巧:将列表推导式与条件逻辑结合使用

    python 中的列表推导式是一种创建列表并允许条件逻辑根据特定条件过滤或修改元素的简洁方法。 这可以带来更干净、更易读的代码。 示例:过滤和修改列表项 # Original list of numbersnumbers = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]# Use …

    2025年12月13日
    000
  • Python——一种机器语言

    python python 是一种高级解释型编程语言,以其易用性和可读性而闻名。其设计理念强调代码的可读性,使用显着的缩进,帮助开发人员编写清晰简洁的代码。 python 支持多种编程范例,包括过程式编程、面向对象编程和函数式编程。这种多功能性使其适用于广泛的应用,从 web 开发和数据分析到自动化…

    2025年12月13日
    000
  • Python 连接器版本中的新增功能:Microsoft Excel 集成和更新的订阅模型支持

    Devart 是一家为各种数据连接技术和框架提供世界级数据连接解决方​​案的公认供应商,提供了新版本的 Python Connectors 并进行了大量更新。 在此版本中,Devart 推出了新的适用于 Microsoft Excel 的 Python 连接器。它使用户能够对其 Microsoft …

    2025年12月13日
    000
  • 使用 OpenAI Assistants API 创建控制台机器人所需的帮助

    大家好, 我在使用 OpenAI Assistants API 创建控制台机器人时遇到困难,希望得到您的帮助。问题是这样的: 我通过 Playground 创建了一个助手并拥有它的 ID。我现在的目标是创建一个与该助手交互的控制台机器人。助手仅使用指令,不使用任何工具。主要任务是确保机器人根据指令做…

    2025年12月13日
    000
  • CSV – 在 Python 中处理本地和远程文件

    编码员们大家好! 本文介绍了一个开源工具,它能够处理本地和远程 csv 文件、加载和打印信息,然后将列映射到 django 类型。当数据集变大、excel不支持自定义报告或通过数据表进行完整数据操作时,通常需要处理csv文件,并且需要api。 当前的功能列表可以进一步扩展,以将 csv 文件映射到数…

    2025年12月13日
    000
  • 使用 FastAPI 构建 Todo API 的部分:分步指南

    使用 fastapi 构建 todo api:分步指南 代码可以在这里找到:github – jamesbmour/blog_tutorials: 一、简介 在上一篇文章中,我们介绍了fastapi并建立了基本的项目结构。现在,我们将更进一步,构建一个功能性的 todo api。在本教程…

    2025年12月13日
    000
  • Python-Jira 票证管理

    您好,我刚刚发现了 jira lib,我决定对其进行测试,以找到获得最多门票的人。 我的github中的代码:https://github.com/victordalet/jira_python_test 一、安装 你只需要python并安装jira lib。 pip install jira 二 …

    2025年12月13日
    000
  • 如何使用一个 API 创建 AI 聊天机器人来访问多个 LLM

    最初由 liz acosta 发表在 streamlit 博客上 还记得第一次使用人工智能图像生成器有多酷吗?那两千万根手指和噩梦般的吃意大利面的画面不仅仅是有趣,它们在不经意间透露了哎呀!人工智能模型的智能程度与我们一样。和我们一样,他们也很难画手。 人工智能模型很快变得更加复杂,但现在的模型数量…

    2025年12月13日
    000
  • 使用 pip-abandoned 识别废弃的 PyPI 包

    我们通常要避免在应用程序中依赖废弃和弃用的软件包。 pip-abandoned 可以帮助解决这个问题。在某些打包生态系统中,注册表允许您将包标记为已弃用或放弃。例如在 npm 中: 和Packagist: 这还允许包管理器使用此元数据在安装时提供警告: PyPI没有这个概念。注册表不提供任何方法来放…

    2025年12月13日 好文分享
    000
  • 感觉没有动力

    感觉自己像个菜鸟,放弃了几次。 我第一次开始考虑编码是在我还是个孩子的时候,但我选择成为一名社交蝴蝶,现在我已经 26 岁了,尝试了很多次学习编码 python、JS、React、DB 等等,但是最后,我感到不知所措,放弃了。 现在,正因为如此,我感觉自己像个失败的松手,我想解决这个问题。关于如何做…

    2025年12月13日
    000
  • 掌握 Django:从头开始构建安全的用户身份验证 API

    “## 第四天#100daysofMiva 编码挑战赛已经进行四天了。 ??? ? 深入了解 django:从头开始构建安全的用户身份验证 api! 您准备好将您的 Django 技能提升到新水平了吗? ? 在本教程中,我将指导您使用 Django 创建强大的用户身份验证 API。无论您…

    2025年12月13日 好文分享
    000
  • Python 教程 – 简介

    python 是目前最流行的编程语言之一,尤其是随着人工智能技术的兴起。 python 是一种多用途编程语言,用于开发 web 应用程序、后端服务、数据科学和机器学习等许多东西。 设置 这些是使用 python 编码的准备工作: 下载python然后安装。您可以使用任何文本编辑器来编写 python…

    2025年12月13日
    000
  • 每周挑战

    穆罕默德·s·安瓦尔 (mohammad s. anwar) 每周都会发出“每周挑战”,为我们所有人提供了为两周任务提出解决方案的机会。我的解决方案首先用python编写,然后转换为perl。这对我们所有人来说都是练习编码的好方法。 挑战,我的解决方案 任务 1:唯一编号 任务 给你一个整数数组@i…

    2025年12月13日
    000
  • 如何使用 Python 自动下载图像:综合指南

    在当今的数字时代,以编程方式管理和处理图像可以为您节省大量的时间和精力。如果您希望自动化从网络下载图像的过程,那么您来对地方了。在本文中,我们将深入研究一个使用 pexels api(高质量库存照片的流行来源)来完成此操作的 python 脚本。 概述此处提供的 python 脚本允许您根据查询在 …

    2025年12月13日
    000
  • 硒 python 和 docker

    嗨,我展示了如何在 docker 容器中使用 selenium (或 undetected_chromedriver)。 我——dockerfile 我正在使用 docker python 图像并添加 chromdriver 和 chromium 来浏览网站。 第一步是创建requirements.…

    2025年12月13日
    000
  • 矢量视觉:改变您的本地图像搜索

    Vector Vision 是一款桌面应用程序,旨在简化用户搜索和管理本地图像集合的方式,利用技术提供直观、高效的体验,而无需互联网连接。该应用程序采用Python和Qt5作为其核心功能,而ChromaDB则增强了其图像搜索功能。 核心特性和技术见解 Vector Vision 的主要功能之一是其多…

    2025年12月13日
    000

发表回复

登录后才能评论
关注微信