优化 SciPy 自定义分布：预计算与缓存常数

程序猿 • 2025年11月10日 06:09:10 • 用户投稿 • 阅读 0

本文旨在解决 scipy 自定义连续随机变量中，昂贵常数（如 pdf 归一化常数和 cdf 积分常数）重复计算导致的性能问题。通过引入类级别的本地缓存机制，使用字典存储已计算的常数值，并以参数元组作为键，显著减少了重复计算，从而提升了自定义分布的评估效率。

在 SciPy 中定义自定义连续随机变量时，通常需要继承 scipy.stats.rv_continuous 类并实现 _pdf 和 _cdf 等核心方法。这些方法在计算概率密度函数和累积分布函数时，往往依赖于一些昂贵的、与分布参数相关的常数，例如 PDF 的归一化常数和 CDF 的积分常数。如果这些常数在每次评估 _pdf 或 _cdf 时都被重新计算，将会导致显著的性能瓶颈，尤其是在进行大量采样或统计分析时。

考虑一个自定义分布 Example_gen，其 _pdf 和 _cdf 方法依赖于两个昂贵的常数计算函数 _norm(a, b) 和 _C(a, b)：

from scipy.stats import rv_continuous# 假设 N(a, b) 和 C(a, b) 是昂贵的常数计算函数def N(a, b):    """模拟昂贵的归一化常数计算"""    # 实际应用中可能涉及数值积分或其他复杂计算    import time    time.sleep(0.01) # 模拟耗时操作    return a + b + 1.0def C(a, b):    """模拟昂贵的积分常数计算"""    # 实际应用中可能涉及数值积分或其他复杂计算    import time    time.sleep(0.01) # 模拟耗时操作    return a - b + 0.5# 假设 f(x, a, b) 是非归一化的PDF，F(x, a, b) 是其原函数def f(x, a, b):    return x * a + bdef F(x, a, b):    return 0.5 * x**2 * a + b * xclass Example_gen(rv_continuous):    def _norm(self, a, b):        """昂贵的归一化常数计算函数"""        return N(a, b)    def _C(self, a, b):        """昂贵的积分常数计算函数"""        return C(a, b)    def _pdf(self, x, a, b):        return f(x, a, b) / self._norm(a, b)    def _cdf(self, x, a, b):        return (F(x, a, b) + self._C(a, b)) / self._norm(a, b)Example = Example_gen()# 示例：多次调用会重复计算 _norm 和 _C# frozen_dist = Example(a=1, b=2)# frozen_dist.pdf(0.5)# frozen_dist.cdf(0.5)

解决方案：本地缓存策略

为了避免重复计算这些昂贵的常数，我们可以采用本地缓存的策略。具体来说，可以在 Example_gen 类中定义类级别的字典来存储已经计算过的常数值。当需要某个常数时，首先检查缓存中是否存在对应参数的计算结果；如果存在，则直接返回缓存值；否则，执行昂贵的计算并将结果存入缓存，然后返回。

from scipy.stats import rv_continuousimport math# 假设 N(a, b) 和 C(a, b) 保持不变，仍是昂贵的计算函数# ... (N, C, f, F 函数定义同上) ...class Example_gen(rv_continuous):    _n_cache = {}  # 类级别的归一化常数缓存    _C_cache = {}  # 类级别的积分常数缓存    def _norm(self, a, b):        """昂贵的归一化常数计算函数，带有缓存机制"""        # 使用参数元组作为缓存键，对浮点数进行适当的四舍五入以避免精度问题        key = (round(a, 5), round(b, 5))        v = self._n_cache.get(key)        if v is None:            v = N(a, b)  # 执行昂贵的计算            self._n_cache[key] = v        return v    def _C(self, a, b):        """昂贵的积分常数计算函数，带有缓存机制"""        key = (round(a, 5), round(b, 5))        v = self._C_cache.get(key)        if v is None:            v = C(a, b)  # 执行昂贵的计算            self._C_cache[key] = v        return v    def _pdf(self, x, a, b):        return f(x, a, b) / self._norm(a, b)    def _cdf(self, x, a, b):        return (F(x, a, b) + self._C(a, b)) / self._norm(a, b)Example = Example_gen()# 示例：使用缓存后的性能提升# 第一次调用会计算并缓存常数，后续相同参数的调用将直接从缓存中获取frozen_dist_1 = Example(a=1, b=2)print("第一次调用 (a=1, b=2):")import timestart_time = time.time()frozen_dist_1.pdf(0.5)frozen_dist_1.cdf(0.5)print(f"耗时: {time.time() - start_time:.4f} 秒")print("n第二次调用 (a=1, b=2) - 应该更快:")start_time = time.time()frozen_dist_1.pdf(0.5)frozen_dist_1.cdf(0.5)print(f"耗时: {time.time() - start_time:.4f} 秒")print("n调用不同参数 (a=3, b=4) - 应该再次计算:")frozen_dist_2 = Example(a=3, b=4)start_time = time.time()frozen_dist_2.pdf(0.5)frozen_dist_2.cdf(0.5)print(f"耗时: {time.time() - start_time:.4f} 秒")print("n再次调用 (a=3, b=4) - 应该更快:")start_time = time.time()frozen_dist_2.pdf(0.5)frozen_dist_2.cdf(0.5)print(f"耗时: {time.time() - start_time:.4f} 秒")

注意事项与最佳实践

缓存键的生成：

浮点数精度： 由于浮点数运算的精度问题，直接使用浮点数元组作为字典键可能会导致相同逻辑值的参数被视为不同的键。例如 (1.0, 2.0) 和 (1.0000000000000001, 2.0) 可能被视为不同的键。因此，在生成缓存键时，对浮点数参数进行适当的四舍五入（如 round(a, 5)）是至关重要的，以确保具有相同有效数字的参数能够命中缓存。选择合适的舍入精度取决于实际应用中参数的精度要求。参数顺序： 确保缓存键中参数的顺序始终一致，因为 (a, b) 和 (b, a) 是不同的键。参数类型： 缓存键必须是不可变的（immutable），因此元组是理想的选择。

缓存的持久化：

在某些场景下，如果昂贵常数的计算结果需要在不同的程序运行会话之间保持，可以将缓存字典的内容序列化到文件（如 JSON 或 pickle）中。在程序启动时加载这些文件来初始化缓存，并在程序结束时将更新后的缓存写回文件。

算家云

高效、便捷的人工智能算力服务平台

37 查看详情

例如，在类定义之外或类的 __init__ 方法中添加加载和保存逻辑：

import json# ...class Example_gen(rv_continuous):    _n_cache = {}    _C_cache = {}    # 尝试从文件加载缓存    try:        with open('n_cache.json', 'r') as f:            _n_cache.update({eval(k): v for k, v in json.load(f).items()})        with open('C_cache.json', 'r') as f:            _C_cache.update({eval(k): v for k, v in json.load(f).items()})    except FileNotFoundError:        pass # 文件不存在，缓存为空    # ... (_norm, _C, _pdf, _cdf 方法) ...# 在程序退出前保存缓存# import atexit# def save_caches():#     with open('n_cache.json', 'w') as f:#         json.dump({str(k): v for k, v in Example_gen._n_cache.items()}, f)#     with open('C_cache.json', 'w') as f:#         json.dump({str(k): v for k, v in Example_gen._C_cache.items()}, f)# atexit.register(save_caches)

请注意，使用 eval(k) 从字符串键转换回元组时需谨慎，确保键的来源是可信的。对于更复杂的数据结构，pickle 模块可能更合适。

缓存管理：

对于大多数自定义分布而言，常数计算的参数集合是有限且固定的，因此简单的字典缓存通常足够。如果参数空间非常大，或者需要限制缓存的内存占用，可以考虑使用 functools.lru_cache 装饰器。然而，lru_cache 是基于函数调用的，并且默认是实例级别的（如果装饰的是实例方法），如果需要类级别的共享缓存，则需要将其应用于静态方法或类方法，并确保缓存键包含了所有相关参数。对于本例，类级别的字典更直接地实现了跨实例的常数共享。

总结

通过在 scipy.stats.rv_continuous 的子类中实现本地缓存机制，我们可以有效地预计算并存储那些昂贵的、依赖于分布参数的常数。这种方法显著减少了重复计算，从而大幅提升了自定义随机变量在进行 PDF、CDF 或其他统计函数评估时的性能。正确处理浮点数精度和缓存键的生成是确保缓存机制有效运行的关键。对于需要跨会话持久化缓存的场景，可以结合文件存储技术来进一步优化。

以上就是优化 SciPy 自定义分布：预计算与缓存常数的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/571266.html

js json pdf 内存占用性能瓶颈

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

地下城手游起源火焰女王项链有啥用地下城手游起源火焰女王项链图鉴

上一篇 2025年11月10日 06:08:57

composer提示Allowed memory size exhausted怎么解决_说明解决内存不足报错的方法

下一篇 2025年11月10日 06:09:19

好文分享

应对性能瓶颈：前端工程师的重绘与回流解决方案

重绘和回流解密：前端工程师如何应对性能瓶颈引言：随着互联网的快速发展，前端工程师的角色越来越重要。他们需要处理用户界面的设计和开发，同时还要关注网站性能的优化。在前端性能优化中，重绘和回流是常见的性能瓶颈。本文将详细介绍重绘和回流的原理，并提供一些实用的代码示例，帮助前端工程师应对性能瓶颈。一、…

程序猿
2025年12月24日
2000
好文分享

深入理解CSS框架与JS之间的关系

深入理解CSS框架与JS之间的关系在现代web开发中，CSS框架和JavaScript (JS) 是两个常用的工具。CSS框架通过提供一系列样式和布局选项，可以帮助我们快速构建美观的网页。而JS则提供了一套功能强大的脚本语言，可以为网页添加交互和动态效果。本文将深入探讨CSS框架和JS之间的关系，…

程序猿
2025年12月24日
2000
HTML+CSS+JS实现雪花飘扬（代码分享）

使用html+css+js如何实现下雪特效？下面本篇文章给大家分享一个html+css+js实现雪花飘扬的示例，希望对大家有所帮助。很多南方的小伙伴可能没怎么见过或者从来没见过下雪，今天我给大家带来一个小Demo，模拟了下雪场景，首先让我们看一下运行效果可以点击看看在线运行：http://hai…

程序猿
2025年12月24日 • 好文分享
6000
10款好看且实用的文字动画特效，让你的页面更吸引人！

图片和文字是网页不可缺少的组成部分，图片运用得当可以让网页变得生动，但普通的文字不行。那么就可以给文字添加一些样式，实现一下好看的文字效果，让页面变得更交互，更吸引人。下面创想鸟就来给大家分享10款文字动画特效，好看且实用，快来收藏吧！ 1、网页玻璃文字动画特效模板简介：使用css3制作网页渐变底…

程序猿
2025年12月24日 • 好文分享
5000
好文分享

tp5如何引入css文件

tp5引入css文件的方法：1、将css文件放在public目录下的static文件里即可；2、在页面引入中写上“”语句即可。本教程操作环境：windows7系统、CSS3&&HTML5版、Dell G3电脑。其实很简单,只需要将css,js,image文件放在这个目录下即可页…

程序猿
2025年12月24日
1000
好文分享

聊聊CSS 与 JS 是如何阻塞 DOM 解析和渲染的

本篇文章给大家介绍一下css和js阻塞 dom 解析和渲染的原理。有一定的参考价值，有需要的朋友可以参考一下，希望对大家有所帮助。 hello~各位亲爱的看官老爷们大家好。估计大家都听过，尽量将CSS放头部，JS放底部，这样可以提高页面的性能。然而，为什么呢？大家有考虑过么？很长一段时间，我都是知其…

程序猿
2025年12月24日
3000
好文分享

js如何修改css样式

js修改css样式的方法：1、使用【obj.className】来修改样式表的类名；2、使用【obj.style.cssTest】来修改嵌入式的css；3、使用【obj.className】来修改样式表的类名；4、使用更改外联的css。本教程操作环境：windows7系统、css3版，DELL G…

程序猿
2025年12月24日
1000
好文分享

如何使用纯CSS、JS实现图片轮播效果

本篇文章给大家详细介绍一下使用纯css、js实现图片轮播效果的方法。有一定的参考价值，有需要的朋友可以参考一下，希望对大家有所帮助。 .carousel {width: 648px;height: 400px;margin: 0 auto;text-align: center;position: a…

程序猿
2025年12月24日
1000
好文分享

js如何修改css

js修改css的方法：1、使用【obj.style.cssTest】来修改嵌入式的css；2、使用【bj.className】来修改样式表的类名；3、使用更改外联的css文件，从而改变元素的css。本教程操作环境：windows7系统、css3版，DELL G3电脑。 js修改css的方法：方法…

程序猿
2025年12月24日
1000
好文分享

js如何改变css样式

js改变css样式的方法：1、使用cssText方法；2、使用【setProperty()】方法；3、使用css属性对应的style属性。本教程操作环境：windows7系统、css3版，DELL G3电脑。 js改变css样式的方法：第一种：用cssText div.style.cssText…

程序猿
2025年12月24日
1000
好文分享

为什么css放上面js放下面

css放上面js放下面的原因：1、在加载html生成DOM tree的时候，可以同时对DOM tree进行渲染，这样可以防止闪跳，白屏或者布局混乱；2、javascript加载后会立即执行，同时会阻塞后面的资源加载。本文操作环境：Windows7系统、HTML5&&CSS3版，DE…

程序猿
2025年12月24日
1000
好文分享

推荐六款移动端 UI 框架

作为一个前端人员来说，总结几款相对来说不错的用于移动端开发的UI框架是非常必要的，以下几种移动端UI框架就能基本满足工作中开发需要，根据项目需求，选用合适的框架搭建项目，更能容易提高开发效率。一、MUI 最接近原生APP体验的高性能前端框架，追求性能体验，是我们开始启动MUI项目的…

程序猿
2025年12月24日
0000
好文分享

css如何实现图片的旋转展示效果（代码示例）

本篇文章给大家带来内容是通过代码示例介绍使用css+js实现图片的旋转展示，制作一个手动操作的“无限”照片轮播图。有一定的参考价值，有需要的朋友可以参考一下，希望对你们有所帮助。下面我们就开始介绍如何实现效果。 1、构建图像轮播框架首先是HTML。它有点难以阅读，因为我们删除了元素之间的任何空格…

程序猿
2025年12月24日
0000
好文分享

css3+js实现烟花绽放的动画效果（代码示例）

本篇文章给大家介绍通过js+css3的transforms属性和keyframes属性来实现烟花绽放的动画效果的方法。有一定的参考价值，有需要的朋友可以参考一下，希望对你们有所帮助。首先我们来看看效果：动画的实现原理：动画使用了两个关键帧（keyframes）：一个是烟花筒上升的轨迹，另一个…

程序猿
2025年12月24日
0000
好文分享

css+js如何在幻灯片上添加文字？实现幻灯片的旋转切换（附代码）

本篇文章给大家带来的内容是介绍css+js如何在幻灯片上添加文字？实现幻灯片的旋转切换（附代码）。有一定的参考价值，有需要的朋友可以参考一下，希望对你们有所帮助。在之前的文章【css如何实现幻灯片效果？幻灯片的实现方法】中介绍了实现淡入淡出幻灯片的实现方法，本篇文章就在其基础上去解释如何在幻灯片上…

程序猿
2025年12月24日
0000
好文分享

css+js如何实现简单的动态进度条效果？（代码实例）

css+js如何实现简单的动态进度条？本篇文章就给大家用css+js制作一个简单的动态进度条效果，并将页面动态进度条滚动加载的代码分享给大家，感兴趣的小伙伴可以参考借鉴一下，希望对你们有所帮助。我们要知道，这里主要使用了css3的animation动画属性，首先将进度条设置为一个初始宽度为0，背景…

程序猿
2025年12月24日
0000
好文分享

手写CSS+js实现radio单选按钮

本文给大家介绍手写css+js实现radio单选按钮，有一定的参考价值，有需要的朋友可以参考一下，希望对你们有所帮助。有的时候我们需要用长得漂亮一点的单选按钮，那么，就要抛弃原有的自己来写，下面就是我实现的你丑你先你才丑你先你更丑你先 .radio{display: flex;align-ite…

程序猿
2025年12月24日
0000
好文分享

css3+js绘制动态时钟（附代码）

本章给大家介绍如何使用css3与js实现动态时钟效果，有一定的参考价值，有需要的朋友可以参考一下，希望对你有所帮助。先看看效果图：首先,思考了一下页面的布局,大致需要4层div,最底层是一个表盘的背景图,然后其余3层分别是时针,分针,秒针的图层. html代码如下：变量名是随便起的,不要介意;…

程序猿
2025年12月24日
0000
什么是web标准？？

本章给大家介绍什么是web标准？？通过介绍大家可以对web标准有更深入的了解，有一定的参考价值，有需要的朋友可以参考一下，希望对你有所帮助。 web标准不是某一个标准，而是一系列标准的集合。网页主要由三部分组成：结构（Structure）、表现（Presentation）和行为（Behavior）…

程序猿
好文分享 2025年12月24日
0000
好文分享

关于javascript和css3开发打气球小游戏的完整代码

这篇文章主要介绍了关于javascript和css3开发打气球小游戏的完整代码，有着一定的参考价值，现在分享给大家，有需要的朋友可以参考一下这是一个简单但是印象深刻的小游戏，打气球小游戏的实现代码，主要基于js和css3，基于css3画气球，具体实现代码大家参考下本文效果知识点： css3画气球…

程序猿
2025年12月24日
0000

发表回复

登录后才能评论

优化 SciPy 自定义分布：预计算与缓存常数

解决方案：本地缓存策略

注意事项与最佳实践

总结

关于作者

相关推荐

发表回复