Python数位DP教程:解决大范围数位和计数问题

Python数位DP教程:解决大范围数位和计数问题

本文介绍了如何使用数位动态规划(digit dp)高效解决在大数值范围(n可达10^12)内,统计数位和小于等于给定值x的整数数量的问题。针对传统遍历方法的低效性,文章详细阐述了基于递归与记忆化搜索的数位dp算法原理,并通过具体示例和python代码,指导读者实现一个高性能的解决方案,适用于处理大规模数据场景下的数位条件计数挑战。

问题概述

计算机科学中,我们经常会遇到需要统计满足特定条件的数字数量的问题。一个常见的挑战是,在给定一个大范围 [1, n] 和一个上限 x 的情况下,计算所有整数 i (其中 1

传统方法的局限性

一个直观的解决方案是遍历从 1 到 n 的每一个数字,计算其数位和,然后判断是否满足条件。示例如下:

def digitsums_lower_than_x_naive(x, n):    digit_sum = lambda y: sum(int(digit) for digit in str(y))    # 题目要求1到n,这里+1是为了包含0,因为数位DP通常从0开始计数    # 实际应用中,如果题目要求1到n,需要对0进行特殊处理或减去DS(x, 0)    return sum(1 for i in range(1, n + 1) if digit_sum(i) <= x) + 1

尽管此函数对于小范围的 n 能给出正确结果,但其时间复杂度为 O(n * log(n))(log(n) 是计算数位和的时间),对于 n 达到 10^12 这样的量级,这种方法将极其低效,无法在实际应用中接受。我们需要一种更高效的算法。

核心算法:数位动态规划(Digit DP)

为了解决大范围内的数位和计数问题,我们通常采用数位动态规划(Digit DP)的方法。数位DP的核心思想是将一个大数的计数问题分解为子问题,通过递归地处理数字的每一位,并利用记忆化搜索(memoization)避免重复计算。

立即学习“Python免费学习笔记(深入)”;

基本思想

数位DP通过从最高位到最低位逐位构建数字来计数。在构建过程中,我们维护当前已构建部分的数位和,以及一个标志位来指示当前数字是否仍然受原始上限 n 的限制(即是否为“紧”状态)。

对于本问题,我们可以定义一个函数 DS(max_digit_sum, upper_bound_num),它返回在范围 [0, upper_bound_num] 中,数位和小于等于 max_digit_sum 的整数数量。

递归关系与状态定义

考虑计算 DS(max_s, N),其中 max_s 是允许的最大数位和,N 是一个字符串形式的上限数字。

我们可以将 N 拆解为最高位 D 和剩余部分 N’。例如,如果 N = 112,则 D = 1,N’ = 12。

为了计算 DS(max_s, N),我们可以考虑所有可能的最高位 d:

当 d :当前数字的最高位小于 N 的最高位。这意味着从当前位开始,后续的数字位可以自由选择从 0 到 9,直到数字的末尾。此时,问题转化为计算一个长度比 N 少一位的“全9”数字(例如 99…9)的数位和计数,且允许的最大数位和为 max_s – d。当 d == D 时:当前数字的最高位等于 N 的最高位。这意味着后续的数字位仍然受到 N 的剩余部分 N’ 的限制。此时,问题转化为计算 DS(max_s – d, N’)。

通过这种方式,DS(max_s, N) 可以分解为多个子问题的和。

示例解析:DS(5, 112)

我们以 DS(5, 112) 为例,来演示数位DP的分解过程。这里 max_s = 5,N = “112”。

DS(5, “112”)

N 的最高位 D = 1。

遍历可能的最高位 d 从 0 到 min(max_s, D),即 0 到 1。

当 d = 0 时

当前最高位 0 小于 N 的最高位 1。问题转化为计算一个两位数(99)的数位和计数,最大数位和为 5 – 0 = 5。即 DS(5, “99”)。

当 d = 1 时

当前最高位 1 等于 N 的最高位 1。问题转化为计算 N 的剩余部分 “12” 的数位和计数,最大数位和为 5 – 1 = 4。即 DS(4, “12”)。

所以,DS(5, “112”) = DS(5, “99”) + DS(4, “12”)。

计算 DS(5, “99”)

N = “99”,最高位 D = 9。遍历可能的最高位 d 从 0 到 min(5, 9),即 0 到 5。对于每个 d (从 0 到 5),由于 d DS(5, “99”) = DS(5, “9”) + DS(4, “9”) + DS(3, “9”) + DS(2, “9”) + DS(1, “9”) + DS(0, “9”)。

计算 DS(max_s’, “9”) (一位数的情况,这是递归的基线条件):

对于一位数 N = “9”,其最高位 D = 9。遍历可能的最高位 d 从 0 到 min(max_s’, 9)。对于每个 d,由于 d 实际上,对于 DS(max_s’, “9”),我们可以直接计算:d 可以取 0, 1, …, min(max_s’, 9)。所以结果就是 min(max_s’, 9) + 1。DS(5, “9”) = min(5, 9) + 1 = 5 + 1 = 6 (数字 0, 1, 2, 3, 4, 5 的数位和都 DS(4, “9”) = min(4, 9) + 1 = 4 + 1 = 5DS(3, “9”) = min(3, 9) + 1 = 3 + 1 = 4DS(2, “9”) = min(2, 9) + 1 = 2 + 1 = 3DS(1, “9”) = min(1, 9) + 1 = 1 + 1 = 2DS(0, “9”) = min(0, 9) + 1 = 0 + 1 = 1

所以,DS(5, “99”) = 6 + 5 + 4 + 3 + 2 + 1 = 21。

计算 DS(4, “12”)

N = “12”,最高位 D = 1。

遍历可能的最高位 d 从 0 到 min(4, 1),即 0 到 1。

当 d = 0 时

当前最高位 0 小于 N 的最高位 1。问题转化为计算一个一位数(9)的数位和计数,最大数位和为 4 – 0 = 4。即 DS(4, “9”)。我们已经知道 DS(4, “9”) = 5。

当 d = 1 时

当前最高位 1 等于 N 的最高位 1。问题转化为计算 N 的剩余部分 “2” 的数位和计数,最大数位和为 4 – 1 = 3。即 DS(3, “2”)。

所以,DS(4, “12”) = DS(4, “9”) + DS(3, “2”) = 5 + DS(3, “2”)。

计算 DS(3, “2”) (一位数的情况):

N = “2”,最高位 D = 2。遍历可能的最高位 d 从 0 到 min(3, 2),即 0 到 2。DS(3, “2”) = DS(3-0, “”) + DS(3-1, “”) + DS(3-2, “”)对于一位数 N = “2”,d 可以取 0, 1, 2。DS(3, “2”) = min(3, int(“2”)) + 1 = 2 + 1 = 3 (数字 0, 1, 2 的数位和都

所以,DS(4, “12”) = 5 + 3 = 8。

最终结果:DS(5, “112”) = DS(5, “99”) + DS(4, “12”) = 21 + 8 = 29。

记忆化搜索的重要性

在上述递归过程中,我们可以看到像 DS(4, “9”) 这样的子问题会被多次计算。为了避免重复计算,我们使用一个缓存(cache 或 memo)来存储已经计算过的状态的结果。当需要计算某个状态时,首先检查缓存;如果已存在,则直接返回;否则,计算并存储结果。这正是动态规划的核心思想之一。

Python实现

下面是基于上述数位DP思想的Python实现。

def count_digit_sums_up_to_x(n_str, x, cache):    """    计算在字符串表示的数字 n_str 范围内(从0到n_str),    数位和小于等于 x 的整数数量。    参数:        n_str (str): 表示上限数字的字符串。        x (int): 允许的最大数位和。        cache (dict): 用于存储已计算状态的记忆化字典。                      键为 (n_str, x),值为对应的计数。    返回:        int: 满足条件的整数数量。    """    # 基线条件:如果 n_str 只有一个数字    if len(n_str) == 1:        # 考虑从0到该数字的所有整数。        # 例如,n_str="5", x=3,则数字可以是0,1,2,3,共4个。        # 它们的数位和都小于等于3。        # 但如果 x=0, n_str="5",则只有数字0满足,共1个。        # 所以是 min(x, int(n_str[0])) + 1        return min(x, int(n_str[0])) + 1    # 检查缓存    if (n_str, x) in cache:        return cache[(n_str, x)]    # 获取当前数字的最高位    top_digit = int(n_str[0])    # 构建一个与 n_str 长度相同但除最高位外全为9的字符串,    # 用于处理当前位小于 top_digit 的情况    nines_suffix = '9' * (len(n_str) - 1)    current_count = 0    # 遍历当前位可能的数字 d    # d 的范围是从 0 到 min(x, top_digit)    for d in range(min(x, top_digit) + 1):        if d < top_digit:            # 情况1: 当前位 d 小于 top_digit            # 此时,后续位可以取 0-9,形成一个长度为 len(n_str)-1 的“全9”数。            # 剩余的数位和上限为 x - d。            current_count += count_digit_sums_up_to_x(nines_suffix, x - d, cache)        else: # d == top_digit            # 情况2: 当前位 d 等于 top_digit            # 此时,后续位仍然受 n_str 剩余部分的限制。            # 剩余的数位和上限为 x - d。            current_count += count_digit_sums_up_to_x(n_str[1:], x - d, cache)    # 将结果存入缓存    cache[(n_str, x)] = current_count    return current_countdef solve(n, x):    """    主函数,调用数位DP函数并处理输入。    参数:        n (int): 范围上限,例如 112。        x (int): 允许的最大数位和,例如 5。    返回:        int: 在 [0, n] 范围内数位和小于等于 x 的整数数量。    """    n_str = str(n)    return count_digit_sums_up_to_x(n_str, x, {})# 示例测试print(f"DS(112, 5) = {solve(112, 5)}") # 预期输出 29

代码解析

count_digit_sums_up_to_x(n_str, x, cache) 函数:n_str:当前要处理的数字上限,以字符串形式传入,方便逐位操作。x:当前允许的剩余最大数位和。cache:一个字典,用于存储 (n_str, x) 状态的计算结果,实现记忆化。基线条件 if len(n_str) == 1::当 n_str 只剩一位时(例如 “5”),表示我们正在计算个位数。结果是 min(x, int(n_str[0])) + 1。这表示从 0 到 min(x, n_str[0]) 的所有数字都满足条件。例如,如果 n_str=”5″, x=3,那么 0, 1, 2, 3 这四个数字的数位和都小于等于3,且它们都小于等于5。记忆化 if (n_str, x) in cache::在每次递归调用前,检查当前状态 (n_str, x) 是否已在缓存中。如果存在,直接返回缓存结果,避免重复计算。循环 for d in range(min(x, top_digit) + 1)::top_digit 是 n_str 的当前最高位。d 遍历当前位可以放置的数字。d 的上限是 top_digit(因为不能超过 n_str 的限制),同时也不能超过剩余允许的最大数位和 x。所以 d 的取值范围是 0 到 min(x, top_digit)。递归调用d :当前位 d 小于 n_str 的最高位。这意味着后续的位可以自由选择 0-9。因此,我们递归调用 count_digit_sums_up_to_x,将 n_str 的剩余部分替换为一个由 len(n_str) – 1 个 9 组成的全9字符串(nines_suffix),并更新剩余数位和为 x – d。d == top_digit:当前位 d 等于 n_str 的最高位。这意味着后续的位仍然受到 n_str 剩余部分的限制。因此,我们递归调用 count_digit_sums_up_to_x,传入 n_str[1:](n_str 的剩余部分),并更新剩余数位和为 x – d。cache[(n_str, x)] = current_count:在所有子问题计算完毕并累加到 current_count 后,将结果存入缓存。

复杂度分析

状态数量:n_str 的长度最多为 log10(N) (对于 N=10^12,长度约为 13)。x 的最大值对于 N=10^12,最大数位和为 9 * 12 = 108。因此,状态数量大约是 log10(N) * X。每个状态的计算:在一个状态中,循环 d 的次数最多为 10 次(从 0 到 9)。每次循环都是一次递归调用或简单的加法。总时间复杂度:O(log10(N) * X * 10),可以简化为 O(log10(N) * X)。对于 N=10^12 (约13位),X=108:13 * 108 * 10 约为 14040 次操作。这相比于 10^12 次

以上就是Python数位DP教程:解决大范围数位和计数问题的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1381866.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年12月14日 23:24:44
下一篇 2025年12月14日 23:24:53

相关推荐

  • NumPy数组形状深度解析:理解维度与创建多维数组

    本文深入探讨numpy数组的维度与形状,重点解析一维数组 `(n,)` 与二维数组 `(1, n)` 之间的关键区别,并通过代码示例演示如何基于输入结构准确创建不同维度的数组。同时,文章还将介绍两种实用的数组形状转换技巧,帮助读者更灵活地处理数据维度。 在NumPy中,数组的形状(shape)和维度…

    2025年12月14日
    000
  • Python多目标优化:智能排座与资源分配策略

    本文深入探讨如何利用python解决涉及多方偏好和动态变化的复杂资源分配与排座问题。我们将介绍多目标优化、启发式算法等核心概念,并指导读者如何构建一个系统来自动寻找满足多重条件的理想解决方案。文章将特别提及进化算法如nsga-ii及其在deap库中的实现,帮助读者应对实际场景中的挑战,如突发情况下的…

    2025年12月14日
    000
  • NumPy二维数组的位异或归约:解决浮点数类型错误

    本文详细阐述了在numpy中对二维数组进行位异或(xor)归约操作的方法。针对常见的`typeerror`,即当数组元素为浮点数时无法直接执行位异或的问题,提供了核心解决方案:在执行归约前,务必将数组元素转换为合适的整数类型。教程将通过示例代码演示从浮点数到整数的转换过程,并成功实现位异或归约,同时…

    2025年12月14日
    000
  • python中Fearturetools三个基本概念

    理解实体、实体集和深度特征合成是使用 Featuretools 进行自动化特征工程的核心:实体是数据表的抽象,如用户或订单表;实体集是管理多个关联实体及其关系的容器,支持跨表特征生成;深度特征合成通过聚合与变换操作,沿实体间关系路径自动生成高阶特征,如用户平均订单金额或上次登录时间差。正确设置索引、…

    2025年12月14日
    000
  • Python 将字符串写入文件的正确姿势

    使用 with open() 可安全写入字符串,需指定 encoding=’utf-8′ 防止乱码,选 ‘w’ 覆盖、’a’ 追加、’x’ 防覆盖,多行用 writelines() 并手动加 n,避免不关…

    2025年12月14日
    000
  • python中如何实现信息增益和信息增益率

    信息增益和信息增益率用于决策树特征选择,基于信息熵计算。1. 信息熵衡量数据混乱程度,公式为H(S) = -Σ(p_i log2(p_i)),Python用entropy函数实现。2. 信息增益IG(S, A) = H(S) – Σ(|S_v|/|S| H(S_v)),表示划分后熵的减少…

    2025年12月14日 好文分享
    000
  • Python IDE之Thonny的介绍

    Thonny适合初学者:它自带Python解释器,界面简洁,支持变量可视化、单步调试和函数调用栈查看,内置pip管理器,可连接micro:bit,特别适用于零基础学习者和教学场景。 Thonny 是一款专为 Python 初学者设计的集成开发环境(IDE),由爱沙尼亚塔尔图大学开发。它界面简洁、功能…

    2025年12月14日
    000
  • python中如何配置Logging处理器

    首先使用basicConfig快速配置日志,或手动创建Logger、Handler、Formatter实现灵活控制;通过FileHandler、StreamHandler等设置输出目标与级别,避免重复日志需检查addHandler调用及propagate设置。 在Python中配置Logging处理…

    2025年12月14日
    000
  • Docker环境下Airflow与PostgreSQL连接故障排查与配置指南

    本文详细介绍了在docker compose环境中,airflow任务无法连接到独立的postgresql数据库的常见问题。核心问题在于airflow容器尝试通过`localhost`访问数据库,而正确的做法是使用docker服务名称作为主机名。教程将提供具体的`docker-compose.yam…

    2025年12月14日
    000
  • NumPy中高效查找一维数组最近邻:避免For循环的广播技巧

    本文介绍如何在NumPy一维数组中高效查找指定值的N个最近邻元素,核心在于利用NumPy的广播机制替代传统的for循环。通过将数组扩展维度,实现一次性计算所有元素间的绝对差,从而优化代码性能,使其更符合NumPy的风格。 在数值计算和数据分析中,查找数组中与给定值最接近的元素是一项常见任务,尤其是在…

    2025年12月14日
    000
  • 高效合并两棵二叉搜索树并生成有序列表

    本文探讨了如何以最优时间复杂度O(M+N)将两棵二叉搜索树(BST)的所有节点值合并成一个有序列表。文章分析了常见的低效实现,特别是Python中列表`pop(0)`操作的性能陷阱,并提供了多种高效的解决方案,包括利用Python内置的`sorted()`函数、`heapq.merge`模块以及优化…

    2025年12月14日
    000
  • 使用Python进行多条件座位分配优化:理论与实践

    本文探讨了如何利用多目标优化方法解决复杂的资源分配问题,特别是针对具有多重偏好和约束条件的座位安排场景。文章介绍了优化、多目标和启发式算法等核心概念,并指导读者如何构建合适的评价函数,以实现自动化、高效的解决方案。通过Python库(如DEAP)的应用,读者将学习如何将理论转化为实际操作,应对动态变…

    2025年12月14日
    000
  • PyTorch VGG-19 模型微调指南:全层与特定全连接层优化策略

    本教程详细介绍了在 pytorch 中对预训练 vgg-19 模型进行微调的两种核心策略。我们将探讨如何实现全网络层的微调,以及如何选择性地仅微调其最后两个全连接层(fc1、fc2)及最终分类层。文章提供了具体的代码示例,演示了如何加载模型、冻结或解冻参数,并根据自定义数据集替换输出层,旨在帮助读者…

    2025年12月14日
    000
  • Keras二分类器预测单一类别的调试与优化指南

    本文旨在解决keras二分类器始终预测单一类别的问题,即使在数据集类别平衡的情况下。我们将从数据准备、模型构建与训练入手,深入分析导致该问题的潜在原因,并提供一系列诊断与优化策略,包括进行充分的探索性数据分析(eda)、优先尝试传统统计模型、精炼特征工程,以及审视数据本身的内在关联性,以帮助开发者构…

    2025年12月14日
    000
  • 解决OpenCV cv2.imread文件读取错误:路径管理与最佳实践

    本文深入探讨了opencv中`cv2.imread`函数常见的图片读取失败问题,特别是由于文件路径不正确或当前工作目录混淆导致的错误。文章将详细解释`cv2.imread`的工作机制,提供诊断文件路径问题的有效方法,并给出使用`os`模块进行路径管理的最佳实践,确保您的python脚本能够稳定可靠地…

    2025年12月14日
    000
  • 解决PySide6应用在Windows上打包时NumPy导入错误的教程

    当开发者尝试将基于PySide6和Pandas等库构建的Python应用程序打包部署到Windows环境时,一个常见的挑战是处理复杂的第三方依赖。特别是当应用程序依赖于NumPy这类底层有C扩展的科学计算库时,使用如pyside6-deploy等工具进行打包时,可能会遭遇ImportError: U…

    2025年12月14日
    000
  • 使用Python Logging模块优雅地记录Pandas DataFrame

    本文详细介绍了如何利用Python的`logging`模块和`pandas`库,通过自定义`Formatter`类,实现将Pandas DataFrame以格式化、可控行数的方式集成到标准日志流中。这种方法不仅确保了日志输出的一致性,还能通过日志级别和动态参数灵活控制DataFrame的显示细节,避…

    2025年12月14日
    000
  • 如何在Python中使用Pandas和NumPy处理多条件数据筛选与聚合

    本教程详细阐述了在Python中如何结合使用Pandas和NumPy,高效地处理基于多个条件的数据筛选和聚合操作。文章将通过具体示例,演示如何利用`numpy.logical_and`或Pandas的`&`运算符组合条件,以及如何运用`groupby()`方法计算多条件下的中位数等统计量,从…

    2025年12月14日
    000
  • Discord.py 应用命令:深入理解 Interaction 对象的使用

    本教程旨在解决 Discord.py 应用命令(斜杠命令)开发中常见的 `Context` 与 `Interaction` 对象混淆问题。我们将详细阐述这两种对象的核心区别,解释为何应用命令必须使用 `Interaction` 对象作为其第一个参数,并提供正确的代码示例及响应机制,确保您的斜杠命令能…

    2025年12月14日
    000
  • 解决Flask-SQLAlchemy初始化数据时的循环导入问题

    在flask应用中使用flask-sqlalchemy进行数据库初始化并添加初始数据时,常常会遇到模型文件与应用工厂文件之间因`db`实例导入而产生的循环导入问题。本文将详细解析这一问题,并提供一种标准的解决方案:通过引入独立的`extensions.py`文件来集中管理flask扩展实例,从而有效…

    2025年12月14日
    000

发表回复

登录后才能评论
关注微信