水塘抽样

  • C++怎么实现一个水塘抽样算法_C++大数据流随机抽样问题

    水塘抽样算法能从未知长度数据流中等概率抽取k个样本。初始化大小为k的数组存储前k个元素,第i个后续元素以k/i概率入池并随机替换旧元素,确保最终每个元素被选概率均为k/N。 水塘抽样(Reservoir Sampling)是一种用于从大量或未知长度的数据流中随机抽取样本的算法。特别适合处理无法一次性…

    2025年12月19日
    000
关注微信