亚马逊产品数据集

嗨,我在 kaggle 中找到了亚马逊产品的数据集,并决定找到价格和星级之间的关系。

完整代码:
https://github.com/victordalet/kaggle_analysis/tree/feat/amazon_products

i-准备数据

为此,我使用 sqlalchemy 将 csv 文件转换为一个小型数据库,并以绘图方式显示信息。

pip install sqlalchemypip install plotly

在下面的脚本中,我提取数据并获得:

价格与星星数量的比率最终评分和星星数量价格和星星数量

import pandas as pdfrom sqlalchemy import create_engine, textimport plotly.express as pxclass Main:    def __init__(self):        self.result = None        self.connection = None        self.engine = create_engine("sqlite:///my_database.db", echo=False)        self.df = pd.read_csv("amazon_product.csv")        self.df.to_sql("products", self.engine, index=False, if_exists="append")        self.get_data()        self.transform_data()        self.display_graph()        self.get_data_number_start_and_price()        self.transform_data()        self.display_graph()        self.get_data_number_start_and_start()        self.display_graph()    def get_data(self):        self.connection = self.engine.connect()        query = text(            "SELECT product_price, product_star_rating FROM products where product_price != '$0.00'"        )        self.result = self.connection.execute(query).fetchall()    def get_data_number_start_and_price(self):        query = text(            "SELECT product_price, product_num_ratings FROM products where product_price != '$0.00'"        )        self.result = self.connection.execute(query).fetchall()    def get_data_number_start_and_start(self):        query = text(            "SELECT product_star_rating, product_num_ratings FROM products where product_price != '$0.00'"        )        self.result = self.connection.execute(query).fetchall()        for i in range(len(self.result)):            self.result[i] = [self.result[i][0], self.result[i][1]]    def transform_data(self):        for i in range(len(self.result)):            self.result[i] = [float(self.result[i][0].split("$")[1]), self.result[i][1]]    def display_graph(self):        fig = px.scatter(            self.result, x=0, y=1, title="Amazon Product Price vs Star Rating"        )        fig.show()Main()

ii – 结果

价格和符号

亚马逊产品数据集

价格和符号数量

亚马逊产品数据集

注释和意见数量

亚马逊产品数据集

三、结论

我们可以看到,价格和评分之间没有必然的关系,但是价格越高,评分越低,评论越多,评分越高。
这似乎很合乎逻辑,因为如果一种产品被购买很多,就意味着它很受欢迎。

以上就是亚马逊产品数据集的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1349450.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年12月13日 12:53:05
下一篇 2025年12月10日 06:38:28

相关推荐

  • Tensorflow 音乐预测

    在本文中,我展示了如何使用张量流来预测音乐风格。在我的示例中,我比较了电子音乐和古典音乐。 你可以在我的github上找到代码:https://github.com/victordalet/sound_to_partition i – 数据集 第一步,您需要创建一个数据集文件夹,并在里面…

    2025年12月13日
    000
  • ROBOFLOW – 使用 python 进行训练和测试

    roboflow 是一个用于注释图像以用于对象检测 ai 的平台。 我将这个平台用于 c2smr c2smr.fr,我的海上救援计算机视觉协会。 在本文中,我将向您展示如何使用这个平台并使用 python 训练您的模型。 您可以在我的github上找到更多示例代码:https://github.co…

    2025年12月13日
    000
  • Ansible 入门 – 初学者指南:日复一日的 DevOps 工具系列

    欢迎来到“50 天 50 个 devops 工具”系列的第 30 天!今天,我们将探索 ansible,它是 devops 工具包中最重要的工具之一。本博客将向您介绍 ansible 的基础知识,分解其关键组件并向您展示如何从简单的示例开始。我们会让事情简单明了,使其成为初学者的完美起点。 什么是 …

    2025年12月13日
    000
  • 释放 Claude AI:用于经济实惠且灵活的 AI 集成的非官方 API

    Anthropic 开发的 Claude AI 以其令人印象深刻的能力在 AI 社区中掀起波澜。然而,官方 API 对于许多开发人员和小型企业来说可能过于昂贵。这就是我们的非官方 Claude AI API 的用武之地,它提供了一个更实惠、更灵活的解决方案,用于将 Claude 的力量集成到您的项目…

    2025年12月13日
    000
  • 可视化项目

    我目前正在开发 TanaMobility,这是一个使用 Dash 和 Python 开发的交互式平台。该项目旨在通过利用地理空间数据对马达加斯加塔那那利佛的交通流进行建模和可视化,以更好地了解人口流动和交通动态。我非常感谢社区的反馈,以帮助改进这个平台并使可视化更加富有洞察力。欢迎您的帮助和建议。您…

    2025年12月13日
    000
  • 在 Pandas 中使用 DataFrame

    天哪!? 今天我带着一个新笔记本回来了,它演示了在 Jupyter 中处理数据的方法。 源文件 我从下载了数据集Kaggle 是一个查找真实世界数据并与其他数据爱好者联系的平台。在那里您会发现令人难以置信的数据集和项目集合,您还可以参加比赛。 工作的简短证据 返回数据框的简明摘要后,我执行了数据清理…

    2025年12月13日
    000
  • API 设计的艺术:使用 Nodejs 创建有效的 RESTful API

    在 Web 开发的动态世界中,可扩展且高效的应用程序必须建立在 API 设计的坚实基础上。随着对 RESTful API 的需求不断增加,Node.js 现已成为构建高性能、事件驱动的 API 来服务大量并发请求的强大力量。以下部分实际上深入研究了使用 Node.js 进行有效 API 设计的原则,…

    2025年12月13日
    000
  • 逻辑和编程练习:方法和优化

    鉴于此练习:(来自 codewars.com) 创建一个返回数字每位数字的平方的函数。 例如,输入函数时,数字702应该返回4904,因为7的平方是49, 0的平方是0,2的平方是4。如果函数接收到零,则必须返回 0. 此练习的根本挑战是逐位遍历整数并返回结果作为另一个整数。 就像编程中的一切一样,…

    2025年12月13日
    000
  • DevOps 中的高级脚本场景:日复一日的 DevOps 工具系列

    欢迎来到“50 天 50 个 devops 工具”系列的第 28 天!今天,在“50 天 50 个 devops 工具”系列的旅程中,我们探索了 bash 和 python 等基本脚本语言,涵盖了基础和生产级示例。今天,我们将深入探讨以前未涉及的高级脚本编写场景。这些场景对于自动化复杂任务和提高 d…

    2025年12月13日
    000
  • 为什么你应该更多地使用 attrs

    介绍 python 的 attrs 库对于希望简化类创建和减少样板代码的开发人员来说是一个游戏规则改变者。这个库甚至受到 nasa 的信任。attrs 由 hynek schlawack 于 2015 年创建,因其能够自动生成特殊方法并提供干净、声明式的方式来定义类,而迅速成为 python 开发人…

    2025年12月13日
    000
  • python3.4爬虫教程 pdf

    Python 3.4 爬虫教程 PDF 可从 [Python爬虫教程](https://morvanzhou.github.io/tutorials/scraping) 和 [电子工业出版社](https://www.ep.com.cn/product/4735/3611000009) 下载。教程内…

    2025年12月13日
    000
  • 小电影推荐码

    这个新项目是关于数据结构以及如何使用它们的。最近刚刚了解了“bfs”和“dfs”,所以做了一个使用两者的项目。它是寻找以某种方式相互关联的电影标题。下面我列出了终端的屏幕截图以及 git hub 上项目的链接。让我知道你们会怎么想。 https://github.com/Zoobob5/Movie-…

    2025年12月13日
    000
  • 将数据加载到 Neo4j 中

    在上一篇博客中,我们了解了如何使用 2 个插件 apoc 和图形数据科学库 – gds 在本地安装和设置 neo4j。在这篇博客中,我将获取一个玩具数据集(电子商务网站中的产品)并将其存储在 neo4j 中。   为 neo4j 分配足够的内存 在开始加载数据之前,如果您的用例中有大量数…

    2025年12月13日 好文分享
    000
  • python爬虫免费教程视频

    免费学习 Python 爬虫的途径包括:在线课程与教程(Coursera、Udemy、YouTube、DataCamp、Codecademy)书籍与文档(Python 爬虫手册、Scrapy、Beautiful Soup、Requests、Twisted 文档)社区与论坛(Stack Overflo…

    2025年12月13日
    000
  • python爬虫教程资源下载

    如何下载 Python 爬虫教程资源?这里有六种途径:1. 官方文档;2. 视频教程;3. 书籍;4. 在线课程;5. 开源项目;6. 博客和论坛。 Python 爬虫教程资源下载 如何下载 Python 爬虫教程资源? 1. 官方文档 [Python 官方爬虫教程](https://docs.py…

    2025年12月13日
    000
  • python爬虫实战入门教程pdf

    网络抓取是使用 Python 从网站自动提取数据的过程。Python 爬虫实战入门教程 PDF 提供了全面指南,涵盖网络抓取基础、BeautifulSoup 解析、Scrapy 构建、数据处理和项目示例。可通过官方网站、GitHub 或 Google Scholar 获取 PDF 教程。其他学习资源…

    2025年12月13日
    000
  • 从带印记到干净:将带水印的图像转变为清晰的视觉效果

    您是否想知道如何使用python从图像中去除水印?很简单!如果您有兴趣,您应该了解 python 并具备 cnn 和 tensorflow dl 框架等计算机视觉模型的基本知识,以便遵循架构!在运行代码之前,请确保您阅读了要去除水印的图像的版权法。 遵循的步骤 – 创建一个新google…

    2025年12月13日
    000
  • 【分享阅读】学习Python基础书籍——快速易懂

    一、简介 第8至18页。 python是一门流行语言,易于使用,易于阅读,功能多样(web、数据分析、桌面、后端等)。 python 目前处于版本 3,这是接收更新的版本。 python 的 anaconda 发行版有几个用于科学编程、数据分析等的包。它还具有 ide(集成开发环境)和其他一些功能。…

    2025年12月13日
    000
  • python爬虫实战入门教程pdf python爬虫入门教程pdf下载步骤

    答案: 要下载 Python 爬虫实战入门教程 PDF,请遵循以下步骤:查找教程 PDF 文件选择权威来源下载 PDF 文件验证 PDF 文件学习爬虫基础进行实际操作继续深入研究 Python 爬虫实战入门教程 PDF 下载指南 第一步:找到教程 PDF 文件 前往 Python 爬虫相关平台或论坛…

    2025年12月13日
    000
  • 谁有python爬虫教程pdf python爬虫高级教程pdf

    Python 爬虫学习资源分为入门级和高级级。入门级资源有:Python官方文档中的网络爬虫教程PDFScrapy框架官方指南PDFBeautiful Soup库官方文档PDF高级级资源有:Udacity提供的Python爬虫高级教程PDFMichael Abrash的《网络爬虫的艺术》PDFScr…

    2025年12月13日
    000

发表回复

登录后才能评论
关注微信