NumPy高效处理分层库存分配与客户平均价格计算

程序猿 • 2025年12月14日 09:39:12 • 用户投稿 • 阅读 0

本文介绍如何使用NumPy高效解决多价库存按先进先出原则分配给客户订单的问题，并计算每位客户的平均购买价格。通过利用np.repeat和np.add.reduceat等向量化操作，避免了创建大型中间数组，显著提升了处理大规模数据的性能和内存效率。

1. 问题描述

在库存管理和订单处理场景中，我们经常会遇到需要将不同价格的商品分配给多个客户订单的情况。一个典型的场景是，商品以不同的批次或在不同时间点采购，导致其成本（或售价）存在差异。当客户下订单时，通常会遵循“先进先出”或“成本最低优先”的原则进行分配。我们的目标是，在满足客户订单需求的同时，计算出每位客户为其所购商品支付的平均价格。

假设我们有以下数据：

orders: 一个NumPy数组，表示每位客户的订单数量。例如 [21, 6, 3] 表示第一个客户需要21单位，第二个6单位，第三个3单位。quantity: 一个NumPy数组，表示在特定价格下可用的商品数量。例如 [16, 14] 表示有16单位商品以某个价格出售，另有14单位商品以另一个价格出售。price: 一个NumPy数组，与 quantity 对应，表示每批商品的单价。例如 [30.5, 35.5] 表示16单位商品单价为30.5，14单位商品单价为35.5。

关键约束和条件：

所有客户订单的总量 (np.sum(orders)) 始终等于所有可用商品的总量 (np.sum(quantity))。orders 数组通常按客户需求量降序排列（尽管这不是解决问题的严格要求，但反映了常见场景）。quantity 和 price 数组是关联的，且 price 数组按升序排列，这意味着我们总是优先分配价格最低的商品。

我们的任务是计算出每位客户的平均购买价格。

2. 低效的解决方案及其局限性

一种直观但低效的方法是创建一个巨大的数组，将所有商品的单价“展开”到这个数组中，然后根据客户订单的起始和结束索引来计算平均值。

import numpy as nporders = np.array([21, 6, 3], dtype=np.int64)quantity = np.array([16, 14], dtype=np.int64)price = np.array([30.5, 35.5], dtype=np.double)# 步骤1: 创建一个包含所有商品单价的“扁平化”数组start = 0total_supply_units = np.sum(quantity)supply_prices_flat = np.zeros(total_supply_units, dtype=np.double)for i, quant in enumerate(quantity):    idx = start + quant    supply_prices_flat[start:idx] = price[i]    start = idxprint("扁平化商品价格数组:", supply_prices_flat)# 步骤2: 根据客户订单计算平均价格fin_avg_prices = []current_pos = 0for order_size in orders:    idx = current_pos + order_size    fin_avg_prices.append(np.mean(supply_prices_flat[current_pos:idx]))    current_pos = idxprint("每位客户的平均价格 (低效方法):", fin_avg_prices)

输出示例：

扁平化商品价格数组: [30.5 30.5 30.5 30.5 30.5 30.5 30.5 30.5 30.5 30.5 30.5 30.5 30.5 30.5 30.5 30.5 35.5 35.5 35.5 35.5 35.5 35.5 35.5 35.5 35.5 35.5 35.5 35.5 35.5 35.5]每位客户的平均价格 (低效方法): [31.69047619047619, 35.5, 35.5]

局限性：当商品总数量 np.sum(quantity) 非常大时，supply_prices_flat 数组会变得极其庞大，导致严重的内存消耗和性能问题。这种方法在处理大规模数据集时是不可接受的。

3. 高效的NumPy解决方案

NumPy提供了强大的向量化操作，可以避免显式循环和创建大型中间数组。我们可以利用 np.repeat 和 np.add.reduceat 来高效地解决这个问题。

import numpy as nporders = np.array([21, 6, 3], dtype=np.int64)quantity = np.array([16, 14], dtype=np.int64)price = np.array([30.5, 35.5], dtype=np.double)# 步骤1: 使用 np.repeat 展开价格# np.repeat(price, quantity) 会根据 quantity 中指定的次数重复 price 中的每个元素。# 例如，如果 price=[P1, P2] 和 quantity=[Q1, Q2]，结果将是 [P1, ..., P1 (Q1次), P2, ..., P2 (Q2次)]repeated_prices = np.repeat(price, quantity)# 结果: [30.5, ..., 30.5 (16次), 35.5, ..., 35.5 (14次)]# 步骤2: 计算 reduceat 的索引# np.cumsum(orders) 计算订单数量的累积和，用于确定每个客户订单在 repeated_prices 中的结束位置。# np.r_[0, ...] 会在累积和数组前添加一个0，表示第一个客户订单的起始位置。# [:-1] 移除最后一个元素，因为 reduceat 的索引是每个段的起始位置。# 例如，orders=[21, 6, 3]，cumsum=[21, 27, 30]，indices=[0, 21, 27]indices = np.r_[0, np.cumsum(orders)][:-1]# 步骤3: 使用 np.add.reduceat 计算每个客户订单的总成本# np.add.reduceat(array, indices) 会在指定索引处“切分” array，并对每个切分段进行求和。# 这将直接计算出每个客户订单的总成本。total_cost_per_customer = np.add.reduceat(repeated_prices, indices)# 步骤4: 计算平均价格# 将每个客户的总成本除以其订单数量，得到平均价格。average_price_per_customer = total_cost_per_customer / ordersprint("每位客户的平均价格 (高效NumPy方法):", average_price_per_customer)

输出：

每位客户的平均价格 (高效NumPy方法): [31.69047619 35.5        35.5       ]

4. 核心NumPy函数详解

4.1 numpy.repeat(a, repeats)

此函数用于重复数组 a 中的元素。repeats 可以是一个整数（所有元素重复相同次数），也可以是一个与 a 形状相同的数组（每个元素重复不同次数）。在本例中，np.repeat(price, quantity) 的作用是根据 quantity 数组中每个对应的数量，将 price 数组中的价格值进行重复。这有效地模拟了将所有单独的商品单位及其价格平铺在一个数组中的过程，但它是通过NumPy的底层优化实现的，避免了显式创建巨大的中间列表。

4.2 numpy.add.reduceat(a, indices)

ufunc.reduceat 是一个非常强大的NumPy函数，它允许在指定索引处对数组进行“分段”操作。np.add.reduceat(array, indices) 的功能是：

在 indices 数组中指定的每个位置开始一个新的“段”。对每个段内的元素执行 add 操作（即求和）。返回一个数组，其中包含每个段的求和结果。

例如，如果 repeated_prices 是 [P1, P1, P1, P2, P2, P2] 且 indices 是 [0, 3]：

第一个段从索引0开始，到索引3之前结束：[P1, P1, P1]，求和为 3*P1。第二个段从索引3开始，到数组末尾结束：[P2, P2, P2]，求和为 3*P2。结果将是 [3*P1, 3*P2]。

在我们的解决方案中，indices 数组 np.r_[0, np.cumsum(orders)][:-1] 精确地标记了每个客户订单在 repeated_prices 数组中的起始位置。np.add.reduceat 随后对每个客户所购买的商品价格进行求和，直接得到每个客户的总成本。

5. 浮点数精度问题考量

在进行浮点数计算时，精度问题是普遍存在的。NumPy在内部使用IEEE 754标准来表示浮点数，这在大多数科学和工程计算中是足够的。对于本例中的平均价格计算：mean_prices * quantity == original_prices * quantities

由于浮点数的特性，直接比较两个浮点数是否“相等”通常是不可靠的。更好的做法是比较它们之间的绝对差是否小于一个很小的容忍值（epsilon）。

# 示例：验证总成本的准确性# 计算高效方法得到的总成本calculated_total_costs = average_price_per_customer * ordersprint("高效方法计算的总成本:", calculated_total_costs)# 原始的总供应成本original_total_supply_cost = np.sum(price * quantity)print("原始总供应成本:", original_total_supply_cost)# 高效方法计算的所有客户总成本之和sum_calculated_total_costs = np.sum(calculated_total_costs)print("所有客户总成本之和:", sum_calculated_total_costs)# 比较（考虑浮点精度）tolerance = 1e-9 # 设置一个小的容忍值if np.abs(sum_calculated_total_costs - original_total_supply_cost) < tolerance:    print("总成本在浮点精度范围内一致。")else:    print("总成本存在显著差异。")

输出示例：

高效方法计算的总成本: [665.5 213.  106.5]原始总供应成本: 985.0所有客户总成本之和: 985.0总成本在浮点精度范围内一致。

可以看到，在合理的浮点精度范围内，总成本是匹配的。对于极度严格的金融计算，可能需要考虑使用decimal模块或专门的定点数库，但对于大多数业务场景，NumPy的float64精度已足够。

6. 总结与注意事项

通过利用NumPy的np.repeat和np.add.reduceat函数，我们能够以高度优化的方式解决多价库存分配和客户平均价格计算问题。这种方法具有以下显著优点：

内存效率高: 避免了创建可能非常庞大的中间数组，显著降低了内存消耗。计算速度快: 利用NumPy底层C语言实现，通过向量化操作极大地提升了计算速度，尤其适用于大规模数据集。代码简洁: 相比于基于循环的实现，代码更加紧凑和易读。

注意事项：

数据预处理: 确保 price 数组与 quantity 数组严格对应，并且 price 数组已按升序排列，以保证“最低价优先”的分配原则。总量匹配: 务必确认 np.sum(orders) 和 np.sum(quantity) 相等，否则分配逻辑会出错。浮点数精度: 虽然NumPy通常表现良好，但在对结果进行精确比较或在金融等对精度要求极高的领域使用时，应注意浮点数的固有特性，并考虑使用适当的容忍值进行比较。

这种高效的NumPy方法是处理类似库存分配和成本计算问题的推荐实践，它充分体现了NumPy在数据处理方面的强大能力。

以上就是NumPy高效处理分层库存分配与客户平均价格计算的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/1369419.html

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

将Anscombe数据从长格式转换为宽格式的Pandas教程

上一篇 2025年12月14日 09:39:06

使用 NumPy 高效计算不同价格商品的客户平均购买价格

下一篇 2025年12月14日 09:39:21

Matplotlib 地图中多类型图例的创建与优化

本教程旨在解决matplotlib地图可视化中，如何在一个图例中同时展示颜色块（如区域分类）和自定义标记（如特定兴趣点）的问题。文章详细介绍了当传统`patch`对象无法正确显示标记时，如何利用`matplotlib.lines.line2d`创建标记图例句柄，并将其与颜色块图例句柄合并，从而生成一…

程序猿
2026年5月10日 • 用户投稿
1000
用户投稿

RichHandler与Rich Progress集成：解决显示冲突的教程

在使用rich库的`richhandler`进行日志输出并同时使用`progress`组件时，可能会遇到显示错乱或溢出问题。这通常是由于为`richhandler`和`progress`分别创建了独立的`console`实例导致的。解决方案是确保日志处理器和进度条组件共享同一个`console`实例…

程序猿
2026年5月10日
0000
用户投稿

Python命令怎样使用profile分析脚本性能 Python命令性能分析的基础教程

使用Python的cProfile模块分析脚本性能最直接的方式是通过命令行执行python -m cProfile your_script.py，它会输出每个函数的调用次数、总耗时、累积耗时等关键指标，帮助定位性能瓶颈；为进一步分析，可将结果保存为文件python -m cProfile -o ou…

程序猿
2026年5月10日
0000
用户投稿

使用 WebCodecs VideoDecoder 实现精确逐帧回退

本文档旨在解决在使用 WebCodecs VideoDecoder 进行视频解码时，实现精确逐帧回退的问题。通过比较帧的时间戳与目标帧的时间戳，可以避免渲染中间帧，从而提高用户体验。本文将提供详细的解决方案和示例代码，帮助开发者实现精确的视频帧控制。在使用 WebCodecs VideoDecod…

程序猿
2026年5月10日
0000
用户投稿

html5怎么画实线_HTML5用CSS border-style:solid画元素实线边框【绘制】

可通过CSS的border-style属性设为solid添加实线边框：一、内联样式用border:2px solid #000；二、内部样式表统一设置如div{border:1px solid #333}；三、外部CSS文件定义.my-box{border:3px solid red}并引入；四、单…

程序猿
2026年5月10日
2000
用户投稿

JS如何实现迭代器？迭代器协议

JavaScript中实现迭代器需遵循可迭代协议和迭代器协议，通过定义[Symbol.iterator]方法返回具备next()方法的迭代器对象，从而支持for…of和展开运算符；该机制统一了数据结构的遍历接口，实现惰性求值，适用于自定义对象、树、图及无限序列等复杂场景，提升代码通用性与…

程序猿
2026年5月10日
1000
用户投稿

使用 Pydantic v2 实现条件性必填字段

本文介绍了如何在 Pydantic v2 模型中实现条件性必填字段。通过自定义验证器，可以根据模型中其他字段的值来动态地控制某些字段是否为必填项，从而满足 API 交互中数据验证的复杂需求。本文提供了一个具体的示例，展示了如何确保模型中至少有一个字段被赋值。在 Pydantic v2 中，虽然没有…

程序猿
2026年5月10日
0000
用户投稿

如何讲html和css_讲解HTML与CSS结合使用基础【基础】

需将HTML与CSS结合使用以实现网页结构与样式的分离：HTML定义标题、段落等语义结构，CSS控制颜色、字体等外观；可通过内联样式、内部样式表或外部CSS文件引入样式，并利用类选择器和ID选择器精准应用。如果您希望网页不仅展示内容，还能具备基本的样式和结构布局，则需要将HTML与CSS结合使用。…

程序猿
2026年5月10日
1000
用户投稿

React组件中动态属性值的管理与同步：利用状态实现受控组件

本教程旨在解决react组件中动态属性值同步使用的问题。我们将探讨如何利用react的`usestate` hook来管理组件内部状态，从而实现一个属性的值动态地影响另一个属性，并构建出可预测、易于维护的受控组件。文章将通过具体代码示例，详细阐述从初始化状态到处理状态更新的完整过程，并强调受控组件在…

程序猿
2026年5月10日
0000
用户投稿

Golang使用Protobuf定义接口与消息格式

Protobuf通过字段编号实现兼容性，新增字段可忽略、删除字段可保留编号，确保新旧版本互操作，支持服务独立演进。在Golang项目中，利用Protobuf定义接口和消息格式，本质上是为服务间通信构建了一套高效、类型安全且跨语言的契约。它让数据结构清晰可见，RPC调用标准化，极大地简化了分布式系统…

程序猿
2026年5月10日
0000
高通预热 2023 骁龙峰会：以AI为主题，10 月 25-26 日举行

【环球网科技综合报道】10月17日消息，高通今日对 2023 骁龙峰会进行了预热，本次大会将以 %ign%ignore_a_1%re_a_1% 为主题，届时骁龙 8 gen 3 处理器也很大可能在本届峰会亮相。在临近活动召开之日，相关业内人士也透露了高通骁龙8Gen3跑分及规格。据悉，高通骁龙8 …

程序猿
2026年5月10日 • 用户投稿
0000
用户投稿

python中numpy的用法

NumPy是Python中用于科学计算的强大库，它提供了以下功能：多维数组处理矩阵运算快速傅里叶变换（FFT）线性代数随机数生成 NumPy在Python中的强大功能 NumPy是Python中用于科学计算的一个强大且灵活的库。它提供了用于处理多维数组和矩阵的一组高效工具，是数据分析和机器学习项目的…

程序猿
2026年5月10日
1000
虫虫漫画直接进入官网入口_虫虫漫画网页版清爽版

虫虫漫画官网入口为www.ccmh.com，用户可直接通过浏览器访问，支持多端适配与账号同步功能，界面简洁无广告，提供海量国漫、日漫、韩漫资源，涵盖恋爱、玄幻等热门题材，更新及时，支持多种阅读模式及离线缓存，阅读体验流畅。虫虫漫画直接进入官网入口在哪里？这是不少网友都关注的，接下来由PHP小编为大…

程序猿
2026年5月10日 • 用户投稿
1000
HTML文档如何工作？如何编辑HTML格式文件？

浏览器解析和渲染html的过程包括：1. 解析html构建dom树；2. 结合css构建渲染树；3. 布局计算元素位置；4. 绘制像素到屏幕。编辑html可使用记事本、vs code、sublime text等文本或代码编辑器，其中vs code因语法高亮、自动补全和插件生态成为主流选择。标准htm…

程序猿
2026年5月10日 • 用户投稿
0000
CSS技巧：在复杂悬停效果中确保图像始终可见

本教程探讨如何在包含悬停效果的CSS卡片布局中，确保图像始终显示在最顶层而不被裁剪或遮挡。通过调整HTML结构，利用CSS的position和z-index属性，以及引入pointer-events，我们将解决图像被overflow: hidden和扩展叠加层遮盖的问题，实现复杂的视觉交互效果。在…

程序猿
2026年5月10日 • 用户投稿
0000
用户投稿

从 JavaScript 获取 URL 并在 PHP DataGrid 中使用

本文档旨在指导开发者如何从 JavaScript 函数中获取 URL，并将其动态应用于 PHP DataGrid。通过前端 JavaScript 动态生成 API 地址，并将其传递给后端的 PHP DataGrid，实现数据根据用户会话动态加载。动态配置 DataGrid 的 URL 在构建动态 …

程序猿
2026年5月10日
1000
用户投稿

JavaScript 中使用多个 querySelector 更新页面元素

本文旨在讲解如何在 JavaScript 的 if 语句中使用多个 querySelector 来更新不同的页面元素，并提供示例代码和注意事项，帮助开发者理解并应用此技术。通过该方法，可以根据特定条件动态修改页面内容，提升用户体验。使用 querySelector 在 if 语句中更新多个元素在…

程序猿
2026年5月10日
1000
用户投稿

GolangWeb项目异常捕获与日志记录

答案：通过中间件使用defer和recover捕获panic，结合zap等结构化日志库记录请求链路信息，为每个请求生成trace ID，实现异常捕获与可追踪日志，提升系统稳定性与可观测性。在Go语言Web项目中，异常捕获与日志记录是保障系统稳定性和可维护性的关键环节。Go本身没有像其他语言那样的t…

程序猿
2026年5月10日
0000
用户投稿

基于两数组数据计算结果排序的 React 教程

本教程针对 React 应用中需要根据两个独立数组的数据计算结果进行排序的场景，提供了一种高效的解决方案。通过使用 JavaScript 的 `reduce` 和 `map` 方法，将两个数组根据唯一标识符进行合并，从而简化排序逻辑，提高代码的可读性和可维护性。避免了复杂的嵌套循环或同步迭代，提供了…

程序猿
2026年5月10日
0000
用户投稿

Golang如何优化日志写入性能_Golang日志写入与文件IO优化方法

使用缓冲、异步写入、高性能日志库和优化IO策略提升Golang日志性能，推荐zap+异步缓冲+SSD组合以平衡实时性、可靠性与高并发需求。在高并发场景下，Golang程序的日志写入可能成为性能瓶颈。频繁的文件IO操作不仅影响响应速度，还可能导致系统负载升高。要提升日志写入性能，不能只依赖简单的fm…

程序猿
2026年5月10日
0000