使用 FastAPI 和机器学习构建实时信用卡欺诈检测系统

使用 fastapi 和机器学习构建实时信用卡欺诈检测系统

介绍

信用卡欺诈对金融业构成重大威胁,每年造成数十亿美元的损失。为了解决这个问题,人们开发了机器学习模型来实时检测和防止欺诈交易。在本文中,我们将逐步介绍使用 fastapi(python 的现代 web 框架)以及在 kaggle 流行的信用卡欺诈检测数据集上训练的随机森林分类器构建实时信用卡欺诈检测系统的过程。

项目概况

该项目的目标是创建一个 web 服务来预测信用卡交易欺诈的可能性。该服务接受交易数据,对其进行预处理,然后返回预测以及欺诈概率。该系统设计快速、可扩展且易于集成到现有的金融系统中。

关键部件

机器学习模型:经过训练以区分欺诈交易和合法交易的随机森林分类器。数据预处理:交易特征标准化,确保模型达到最佳性能。api:使用 fastapi 构建的 restful api,用于实时处理预测请求。

第 1 步:准备数据集

本项目使用的数据集是来自 kaggle 的信用卡欺诈检测数据集,其中包含 284,807 笔交易,其中只有 492 笔是欺诈交易。这种类别不平衡带来了挑战,但可以通过对少数类别进行过采样来解决。

数据预处理

首先使用 scikit-learn 的 standardscaler 对这些功能进行标准化。然后将数据集分为训练集和测试集。鉴于不平衡,在训练模型之前应用 randomoversampler 技术来平衡类别。

from sklearn.preprocessing import standardscalerfrom imblearn.over_sampling import randomoversampler# standardize featuresscaler = standardscaler()x_scaled = scaler.fit_transform(x)# balance the datasetros = randomoversampler(random_state=42)x_resampled, y_resampled = ros.fit_resample(x_scaled, y)

第 2 步:训练机器学习模型

我们训练了一个随机森林分类器,它非常适合处理不平衡的数据集并提供可靠的预测。该模型在过采样数据上进行训练,并使用准确度、精确度、召回率和 auc-roc 曲线来评估其性能。

from sklearn.ensemble import randomforestclassifierfrom sklearn.metrics import classification_report, roc_auc_score# train the modelmodel = randomforestclassifier(n_estimators=100, random_state=42)model.fit(x_resampled, y_resampled)# evaluate the modely_pred = model.predict(x_test_scaled)print(classification_report(y_test, y_pred))print("auc-roc:", roc_auc_score(y_test, model.predict_proba(x_test_scaled)[:, 1]))

第 3 步:构建 fastapi 应用程序

使用 joblib 保存训练好的模型和缩放器后,我们继续构建 fastapi 应用程序。选择 fastapi 是因为它的速度和易用性,使其成为实时应用程序的理想选择。

创建 api

fastapi 应用程序定义了一个 post 端点 /predict/,它接受交易数据、处理数据并返回模型的预测和概率。

from fastapi import fastapi, httpexceptionfrom pydantic import basemodelimport joblibimport pandas as pd# load the trained model and scalermodel = joblib.load("random_forest_model.pkl")scaler = joblib.load("scaler.pkl")app = fastapi()class transaction(basemodel):    v1: float    v2: float    # include all other features used in your model    amount: float@app.post("/predict/")def predict(transaction: transaction):    try:        data = pd.dataframe([transaction.dict()])        scaled_data = scaler.transform(data)        prediction = model.predict(scaled_data)        prediction_proba = model.predict_proba(scaled_data)        return {"fraud_prediction": int(prediction[0]), "probability": float(prediction_proba[0][1])}    except exception as e:        raise httpexception(status_code=400, detail=str(e))

第 4 步:部署应用程序

要在本地测试应用程序,您可以使用 uvicorn 运行 fastapi 服务器并向 /predict/ 端点发送 post 请求。该服务将处理传入的请求,扩展数据,并返回交易是否存在欺诈。

本地运行 api

uvicorn main:app --reload

然后您可以使用curl或postman等工具测试api:

curl -X POST http://127.0.0.1:8000/predict/ -H "Content-Type: application/json" -d '{"V1": -1.359807134, "V2": -0.072781173, ..., "Amount": 149.62}'

api 将返回一个 json 对象,其中包含欺诈预测和相关概率。

结论

在本文中,我们构建了一个实时信用卡欺诈检测系统,该系统将机器学习与现代 web 框架相结合。 github 链接在这里。该系统旨在处理实时交易数据并提供即时预测,使其成为金融机构打击欺诈的宝贵工具。

通过使用 fastapi 部署此模型,我们确保服务不仅快速而且可扩展,能够同时处理多个请求。该项目可以通过更复杂的模型、改进的特征工程或与生产环境的集成来进一步扩展。

下一步

要进一步增强系统,请考虑以下事项:

模型改进:尝试更高级的模型,如 xgboost 或神经网络。特征工程:探索可能提高模型准确性的其他功能。真实世界部署:将应用程序部署在 aws 或 gcp 等云平台上以供生产使用。

以上就是使用 FastAPI 和机器学习构建实时信用卡欺诈检测系统的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1348912.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
Jupyter Notebooks 作为端到端分析解决方案
上一篇 2025年12月13日 12:25:58
精通编码之路初学者指南
下一篇 2025年12月13日 12:26:16

相关推荐

  • 开源免费PHP工具 PHP开发效率提升利器

    推荐开源免费PHP开发工具以提升效率:VS Code、Sublime Text轻量高效,PhpStorm专业强大;调试用Xdebug、Kint、Ray;依赖管理选Composer;代码质量工具包括PHPStan、Psalm、PHP_CodeSniffer;数据库管理可用%ignore_a_1%MyA…

    2026年5月10日
    000
  • Matplotlib 地图中多类型图例的创建与优化

    Matplotlib 地图中多类型图例的创建与优化Matplotlib 地图中多类型图例的创建与优化Matplotlib 地图中多类型图例的创建与优化Matplotlib 地图中多类型图例的创建与优化

    本教程旨在解决matplotlib地图可视化中,如何在一个图例中同时展示颜色块(如区域分类)和自定义标记(如特定兴趣点)的问题。文章详细介绍了当传统`patch`对象无法正确显示标记时,如何利用`matplotlib.lines.line2d`创建标记图例句柄,并将其与颜色块图例句柄合并,从而生成一…

    2026年5月10日 用户投稿
    100
  • 利用海象运算符简化条件赋值:Python教程与最佳实践

    本文旨在探讨Python中海象运算符(:=)在条件赋值场景下的应用。通过对比传统if/else语句与海象运算符,以及条件表达式,分析海象运算符在简化代码、提高可读性方面的优势与局限性。并通过具体示例,展示如何在列表推导式等场景下合理使用海象运算符,同时强调其潜在的复杂性及替代方案,帮助开发者更好地掌…

    2026年5月10日
    000
  • RichHandler与Rich Progress集成:解决显示冲突的教程

    在使用rich库的`richhandler`进行日志输出并同时使用`progress`组件时,可能会遇到显示错乱或溢出问题。这通常是由于为`richhandler`和`progress`分别创建了独立的`console`实例导致的。解决方案是确保日志处理器和进度条组件共享同一个`console`实例…

    2026年5月10日
    000
  • 使用 Jupyter Notebook 进行探索性数据分析

    Jupyter Notebook通过单元格实现代码与Markdown结合,支持数据导入(pandas)、清洗(fillna)、探索(matplotlib/seaborn可视化)、统计分析(describe/corr)和特征工程,便于记录与分享分析过程。 Jupyter Notebook 是进行探索性…

    2026年5月10日
    000
  • Python命令怎样使用profile分析脚本性能 Python命令性能分析的基础教程

    使用Python的cProfile模块分析脚本性能最直接的方式是通过命令行执行python -m cProfile your_script.py,它会输出每个函数的调用次数、总耗时、累积耗时等关键指标,帮助定位性能瓶颈;为进一步分析,可将结果保存为文件python -m cProfile -o ou…

    2026年5月10日
    000
  • Python递归函数追踪与性能考量:以序列打印为例

    本文深入探讨了Python中一种递归打印序列元素的方法,并着重演示了如何通过引入缩进参数来有效追踪递归函数的执行流程和参数变化。通过实际代码示例,文章揭示了递归调用可能带来的潜在性能开销,特别是对调用栈空间的需求,以及Python默认递归深度限制可能导致的错误,为读者提供了理解和优化递归算法的实用见…

    2026年5月10日
    000
  • python中zip函数详解 python多序列压缩zip函数应用场景

    zip函数的应用场景包括:1) 同时遍历多个序列,2) 合并多个列表的数据,3) 数据分析和科学计算中的元素运算,4) 处理csv文件,5) 性能优化。zip函数是一个强大的工具,能够简化代码并提高处理多个序列时的效率。 在Python中,zip函数是一个非常有用的工具,它能够将多个可迭代对象打包成…

    2026年5月10日
    000
  • 谷歌浏览器如何截图 谷歌浏览器页面截图技巧

    谷歌浏览器如何截图 谷歌浏览器页面截图技巧谷歌浏览器如何截图 谷歌浏览器页面截图技巧谷歌浏览器如何截图 谷歌浏览器页面截图技巧谷歌浏览器如何截图 谷歌浏览器页面截图技巧

    使用谷歌浏览器的开发者工具截图步骤:1. 按ctrl+shift+i(windows/linux)或cmd+option+i(mac)打开开发者工具。2. 点击右上角三个点,选择”更多工具”,再选择”截图”。3. 选择截取整个页面。推荐的谷歌浏览器扩展…

    2026年5月10日 用户投稿
    100
  • Python中怎样使用pymongo?

    在python中使用pymongo可以轻松地与mongodb数据库进行交互。1)安装pymongo:pip install pymongo。2)连接到mongodb:from pymongo import mongoclient; client = mongoclient(‘mongod…

    2026年5月10日
    000
  • JavaScript计算器开发:解决数值显示与初始化问题

    本教程深入探讨了使用JavaScript构建计算器时常见的数值显示异常问题,特别是由于类属性未初始化导致的`Cannot read properties of undefined`错误。我们将详细分析问题根源,并通过在构造函数中调用初始化方法来解决该问题,同时优化显示逻辑,确保计算器功能稳定且界面显…

    2026年5月10日
    000
  • Python 函数参数类型:如何使用可变参数和动态参数?

    python 中的参数类型:关键词参数、可变参数和动态参数 在 python 中,函数的参数可以分为以下几种类型: 关键词参数(kw)**:这些参数具有名称,并且在调用函数时明确指定。可变参数(*args):这些参数没有名称,允许函数接受任意数量的位置参数。它们将被收集到一个元组中。动态参数(kwa…

    2026年5月10日
    000
  • NextAuth getToken 在服务端返回 null 的问题排查与解决

    问题描述 在使用 Next.js 和 NextAuth 构建应用程序时,有时需要在服务端获取用户的身份验证信息。getToken 函数是 NextAuth 提供的一个便捷方法,用于从请求中提取 JWT (JSON Web Token)。然而,在某些情况下,尤其是在使用 getServerSidePr…

    2026年5月10日
    000
  • pycharm解析器怎么添加 解析器添加详细流程

    在pycharm中添加解析器的步骤包括:1) 打开pycharm并进入设置,2) 选择project interpreter,3) 点击齿轮图标并选择add,4) 选择解析器类型并配置路径,5) 点击ok完成添加。添加解析器后,选择合适的类型和版本,配置环境变量,并利用解析器的功能提高开发效率。 在…

    2026年5月10日
    000
  • python中numpy的用法

    NumPy是Python中用于科学计算的强大库,它提供了以下功能:多维数组处理矩阵运算快速傅里叶变换(FFT)线性代数随机数生成 NumPy在Python中的强大功能 NumPy是Python中用于科学计算的一个强大且灵活的库。它提供了用于处理多维数组和矩阵的一组高效工具,是数据分析和机器学习项目的…

    2026年5月10日
    100
  • HTML文档如何工作?如何编辑HTML格式文件?

    HTML文档如何工作?如何编辑HTML格式文件?HTML文档如何工作?如何编辑HTML格式文件?HTML文档如何工作?如何编辑HTML格式文件?HTML文档如何工作?如何编辑HTML格式文件?

    浏览器解析和渲染html的过程包括:1. 解析html构建dom树;2. 结合css构建渲染树;3. 布局计算元素位置;4. 绘制像素到屏幕。编辑html可使用记事本、vs code、sublime text等文本或代码编辑器,其中vs code因语法高亮、自动补全和插件生态成为主流选择。标准htm…

    2026年5月10日 用户投稿
    000
  • GolangWeb项目异常捕获与日志记录

    答案:通过中间件使用defer和recover捕获panic,结合zap等结构化日志库记录请求链路信息,为每个请求生成trace ID,实现异常捕获与可追踪日志,提升系统稳定性与可观测性。 在Go语言Web项目中,异常捕获与日志记录是保障系统稳定性和可维护性的关键环节。Go本身没有像其他语言那样的t…

    2026年5月10日
    000
  • python如何捕获所有类型的异常_python try except捕获所有异常的方法

    答案:捕获所有异常推荐使用except Exception as e,可捕获常规错误并记录日志,避免影响程序正常退出;需拦截系统信号时才用except BaseException as e。 在Python中,要捕获所有类型的异常,最常见且推荐的方法是使用 except Exception as e…

    2026年5月10日
    000
  • python中f怎么用

    f-字符串是 Python 3.6 中引入的格式化字符串语法糖,提供了简洁且安全的方式来插入表达式和变量。f-字符串以字符串前缀 f 为标志,使用大括号包含表达式或变量。f-字符串支持条件表达式和格式规范符,提供了更大的灵活性、安全性、可读性和易维护性。 在 Python 中使用 f-字符串 f-字…

    2026年5月10日
    100
  • 怎么在手机上把XML文件转换为PDF?

    不可能直接在手机上用单一应用完成 XML 到 PDF 的转换。需要使用云端服务,通过两步走的方式实现:1. 在云端转换 XML 为 PDF,2. 在手机端访问或下载转换后的 PDF 文件。 怎么在手机上把XML文件转换为PDF? 这问题问得好,比直接问“怎么转换”有深度多了!因为它触及了移动端环境的…

    2026年5月10日
    000

发表回复

登录后才能评论
关注微信