C++STL查找算法find和binary_search使用

std::find适用于无序数据的线性查找,返回元素位置,时间复杂度O(N);std::binary_search要求数据有序,仅判断存在性,时间复杂度O(log N),效率更高。

c++stl查找算法find和binary_search使用

在C++ STL中,

std::find

std::binary_search

是两种核心的查找算法,它们各自适用于不同的场景和数据特性。简单来说,

find

是一种线性查找,不要求数据有序,它会遍历序列直到找到目标或遍历结束;而

binary_search

则是一种二分查找,它严格要求数据必须已经有序,效率远高于

find

,但它只告诉你元素是否存在,不会返回具体位置。选择哪一个,核心在于你的数据是否已排序,以及你需要的是元素的存在性判断还是其精确位置。

解决方案

std::find

std::binary_search

是C++标准库(STL)中两种非常实用的查找算法,它们都定义在


头文件中。理解它们的适用场景和工作原理,对于编写高效且正确的C++代码至关重要。

std::find

:线性查找的通用解法

std::find

是最基础的查找算法之一。它接受一个迭代器范围

[first, last)

和一个待查找的值

val

。它的工作方式很简单:从

first

指向的元素开始,逐个比较,直到找到第一个与

val

相等的元素,或者遍历到

last

立即学习“C++免费学习笔记(深入)”;

特点:不要求数据有序: 这是它最大的优点,你可以对任何序列类型(如

std::vector

std::list

std::array

等)使用它,无论它们是否排序。返回迭代器: 如果找到目标元素,它会返回一个指向该元素的迭代器;如果没有找到,则返回

last

迭代器。这使得你可以进一步操作找到的元素。时间复杂度: 平均和最坏情况下都是O(N),N是序列中的元素数量。这意味着,数据量越大,查找时间越长。何时使用:当你的数据是无序的。当你需要找到元素的具体位置(迭代器),而不仅仅是判断它是否存在。当数据量相对较小,O(N)的性能开销可以接受时。

#include #include #include  // for std::findint main() {    std::vector numbers = {10, 20, 30, 40, 20, 50};    // 使用 std::find 查找 30    auto it_found = std::find(numbers.begin(), numbers.end(), 30);    if (it_found != numbers.end()) {        std::cout << "找到 30,位于索引: " << std::distance(numbers.begin(), it_found) << std::endl;    } else {        std::cout << "未找到 30" << std::endl;    }    // 使用 std::find 查找 99 (不存在的元素)    auto it_not_found = std::find(numbers.begin(), numbers.end(), 99);    if (it_not_found != numbers.end()) {        std::cout << "找到 99" << std::endl;    } else {        std::cout << "未找到 99" << std::endl;    }    return 0;}

std::binary_search

:高效查找的有序利器

std::binary_search

是一个基于二分查找的算法,它的效率非常高,但前提是它操作的范围

[first, last)

必须是已排序的(默认是升序,也可以提供自定义比较器)。它不会返回元素的具体位置,只返回一个布尔值,指示元素是否存在。

特点:要求数据有序: 这是它使用的前提条件。如果数据无序,结果将是未定义的或错误的。只返回布尔值:

true

表示找到,

false

表示未找到。时间复杂度: O(log N)。对于大型数据集,这比O(N)的线性查找快得多。例如,在一百万个元素中查找,线性查找可能需要一百万次比较,而二分查找只需要大约20次。何时使用:当你的数据已经有序,或者你愿意为了一系列查找而先对数据进行排序。当你只需要判断某个元素是否存在,而不需要知道它的具体位置。

#include #include #include  // for std::binary_search, std::sortint main() {    std::vector sorted_numbers = {10, 20, 30, 40, 50}; // 假设数据已排序    // 如果数据未排序,需要先排序    // std::vector unsorted_numbers = {50, 10, 30, 20, 40};    // std::sort(unsorted_numbers.begin(), unsorted_numbers.end());    // std::cout << "排序后的数据: ";    // for (int n : unsorted_numbers) {    //     std::cout << n << " ";    // }    // std::cout << std::endl;    // 使用 std::binary_search 查找 30    if (std::binary_search(sorted_numbers.begin(), sorted_numbers.end(), 30)) {        std::cout << "找到 30" << std::endl;    } else {        std::cout << "未找到 30" << std::endl;    }    // 使用 std::binary_search 查找 99 (不存在的元素)    if (std::binary_search(sorted_numbers.begin(), sorted_numbers.end(), 99)) {        std::cout << "找到 99" << std::endl;    } else {        std::cout << "未找到 99" << std::endl;    }    return 0;}

为什么在有序数据中,

binary_search

find

更受青睐?

这是一个非常实际的问题,在我个人的开发经验中,如果数据量稍大且确定有序,我几乎总是倾向于

binary_search

或者其他基于二分查找的变体。原因很简单,但其背后的性能差异是巨大的。

std::find

的工作方式是线性的,它从头到尾一个一个地检查元素。想象一下你在图书馆找一本书,如果书架上的书是随机摆放的,你只能一本一本翻过去看书名,直到找到为止。这就是O(N)的复杂度,最坏情况下你需要检查所有书。

std::binary_search

则利用了数据有序的特性。它就像你在查字典:你知道字母顺序,所以你可以直接翻到中间,如果目标字母在你翻到的这一页之前,你就只在前半部分找;如果之后,就只在后半部分找。每次查找都将搜索范围缩小一半。这种“分而治之”的策略,使得查找次数呈对数增长,也就是O(log N)。

举个例子,假设有一个包含100万个元素的

std::vector

std::find

平均需要进行50万次比较(最坏情况100万次)。

std::binary_search

最多只需要大约20次比较(log₂1,000,000 ≈ 19.9)。

这种效率上的天壤之别,在处理大数据集时尤为明显。如果你的应用程序对性能有要求,并且数据可以保持有序,那么选择

binary_search

或其同类算法是毫无疑问的优化方向。当然,如果数据量特别小,比如只有几十个元素,

find

的O(N)和

binary_search

的O(log N)在实际执行时间上可能差别不大,甚至

find

由于其更简单的内部逻辑,在某些极端情况下可能略快一点(因为

binary_search

的逻辑分支更多)。但从扩展性考虑,

binary_search

无疑是更优的选择。

除了

find

binary_search

,STL还有哪些查找利器?

STL的查找算法远不止这两个,它提供了一系列工具来应对各种复杂的查找需求。在我看来,掌握这些工具能让你更灵活地处理数据。

std::lower_bound

std::upper_bound

这两个算法是

binary_search

的“升级版”,它们也要求数据有序。

std::lower_bound(first, last, val)

返回一个迭代器,指向序列中第一个不小于

val

的元素。

std::upper_bound(first, last, val)

返回一个迭代器,指向序列中第一个大于

val

的元素。它们常用于查找一个元素可能插入的位置,或者查找一个区间内所有与

val

相等的元素。示例:

std::vector data = {10, 20, 30, 30, 30, 40, 50};auto low = std::lower_bound(data.begin(), data.end(), 30); // 指向第一个30auto up = std::upper_bound(data.begin(), data.end(), 30);   // 指向第一个40std::cout << "30出现的次数: " << std::distance(low, up) << std::endl; // 输出3

std::equal_range

结合了

lower_bound

upper_bound

的功能,同样要求数据有序。它返回一个

std::pair

,其中

first

lower_bound

的结果,

second

upper_bound

的结果。对于查找某个值在有序序列中的所有出现位置,这个函数非常方便。

std::find_if

std::find_if_not

这两个是

find

的“条件查找”版本。它们不查找具体的值,而是查找满足特定条件的第一个元素。

std::find_if(first, last, predicate)

查找第一个使

predicate

返回

true

的元素。

std::find_if_not(first, last, predicate)

查找第一个使

predicate

返回

false

的元素。示例:

std::vector nums = {1, 2, 3, 4, 5, 6};auto it_even = std::find_if(nums.begin(), nums.end(), [](int n){ return n % 2 == 0; });if (it_even != nums.end()) {    std::cout << "第一个偶数是: " << *it_even << std::endl; // 输出2}

std::count

std::count_if

用于计算某个值或满足某个条件的元素在序列中出现的次数。

std::count(first, last, val)

计算

val

出现的次数。

std::count_if(first, last, predicate)

计算满足

predicate

条件的元素次数。

std::search

std::find_end

用于在一个序列中查找另一个子序列的出现。

std::search

查找第一个出现的子序列。

std::find_end

查找最后一个出现的子序列。

除了这些通用算法,别忘了STL容器自身也提供了高效的查找方法,比如

std::set

std::map

std::unordered_set

std::unordered_map

。这些容器的

find

成员函数通常比全局算法更高效,因为它们利用了容器内部的数据结构(红黑树或哈希表)来实现O(log N)或平均O(1)的查找速度。当你需要频繁查找时,选择合适的容器本身就是一种强大的查找策略。

在使用STL查找算法时,常见的性能陷阱和优化建议有哪些?

尽管STL算法强大,但在实际使用中,如果不注意一些细节,可能会掉入性能陷阱。我个人在项目中就遇到过不少因为选择不当或理解偏差导致的性能瓶颈

对未排序数据使用

binary_search

这是最常见的错误,也是最致命的。

std::binary_search

要求数据有序,如果你在一个无序的

vector

上调用它,结果是未定义的,很可能返回错误的结果,而编译器不会报错。如果你需要对无序数据进行高效查找,要么先排序(如果查找次数多于一次),要么考虑使用哈希表。

频繁地对大型数据集进行排序后单次查找: 如果你只有一个查找操作,并且数据是无序的,那么先用

std::sort

进行O(N log N)的排序,然后用

std::binary_search

进行O(log N)的查找,总成本是O(N log N)。这通常比直接用

std::find

进行O(N)的线性查找要慢。只有当你需要进行多次查找时,预排序的成本才能被摊销。

选择错误的容器类型:

std::vector

对于

std::find

来说,由于其内存连续性,缓存局部性好,表现不错。但对于大量插入/删除操作,它效率不高。

std::list

std::find

list

上的表现通常比

vector

差,因为

list

的元素不连续,缓存命中率低。

binary_search

无法直接应用于

list

(需要随机访问迭代器)。

std::set

/

std::map

这些基于红黑树的容器,其

find

成员函数提供O(log N)的查找效率,且数据始终保持有序。如果你的核心需求是高效查找和自动排序,它们是很好的选择。

std::unordered_set

/

std::unordered_map

基于哈希表的容器,提供平均O(1)的查找效率。这是在需要极致查找速度且不关心元素顺序时的首选。但在最坏情况下(哈希冲突严重),性能可能退化到O(N)。

自定义比较器的效率: 如果你为

std::sort

std::binary_search

提供了自定义比较器(lambda表达式或函数对象),请确保这个比较器本身是高效的。一个复杂的比较器可能会抵消二分查找带来的性能优势。

不必要的拷贝: 当查找对象是复杂类型时,确保比较操作是按引用进行的,避免不必要的对象拷贝。例如,如果你的

vector

存储的是大对象,

std::find

在比较时会使用

operator==

,如果这个操作涉及大量拷贝,会影响性能。

迭代器失效: 虽然不直接是查找算法本身的性能陷阱,但在使用查找算法得到迭代器后,如果对容器进行了修改(如插入、删除),可能会导致迭代器失效,后续使用失效迭代器会引发未定义行为。这是STL编程中一个非常基础但又容易被忽视的问题。

优化建议:

了解你的数据: 数据是否需要有序?查找频率如何?数据量大小?这些是选择算法和容器的关键。选择合适的容器: 如果你需要频繁查找且数据有序,考虑

std::set

std::map

。如果查找是主要的且不需要有序,

std::unordered_set

std::unordered_map

通常是最快的。预排序: 如果数据大部分时间是静态的,但需要多次高效查找,那么一次性排序的成本是值得的。使用

std::lower_bound

等: 当你需要获取有序序列中元素的精确位置或范围时,

lower_bound

upper_bound

equal_range

binary_search

更有用,因为它们提供了迭代器。剖析(Profiling): 如果对性能有疑问,不要猜测,使用性能分析工具(如Valgrind, gprof, Visual Studio Profiler等)来找出真正的瓶颈。有时候,你认为的瓶颈可能并不是实际的。

总之,STL提供了丰富的查找工具,关键在于理解它们的工作原理和适用场景,并结合实际需求做出明智的选择。

以上就是C++STL查找算法find和binary_search使用的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1476055.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年12月18日 23:55:13
下一篇 2025年12月18日 23:55:25

相关推荐

  • CSS mask属性无法获取图片:为什么我的图片不见了?

    CSS mask属性无法获取图片 在使用CSS mask属性时,可能会遇到无法获取指定照片的情况。这个问题通常表现为: 网络面板中没有请求图片:尽管CSS代码中指定了图片地址,但网络面板中却找不到图片的请求记录。 问题原因: 此问题的可能原因是浏览器的兼容性问题。某些较旧版本的浏览器可能不支持CSS…

    2025年12月24日
    900
  • Uniapp 中如何不拉伸不裁剪地展示图片?

    灵活展示图片:如何不拉伸不裁剪 在界面设计中,常常需要以原尺寸展示用户上传的图片。本文将介绍一种在 uniapp 框架中实现该功能的简单方法。 对于不同尺寸的图片,可以采用以下处理方式: 极端宽高比:撑满屏幕宽度或高度,再等比缩放居中。非极端宽高比:居中显示,若能撑满则撑满。 然而,如果需要不拉伸不…

    2025年12月24日
    400
  • 如何让小说网站控制台显示乱码,同时网页内容正常显示?

    如何在不影响用户界面的情况下实现控制台乱码? 当在小说网站上下载小说时,大家可能会遇到一个问题:网站上的文本在网页内正常显示,但是在控制台中却是乱码。如何实现此类操作,从而在不影响用户界面(UI)的情况下保持控制台乱码呢? 答案在于使用自定义字体。网站可以通过在服务器端配置自定义字体,并通过在客户端…

    2025年12月24日
    600
  • 如何在地图上轻松创建气泡信息框?

    地图上气泡信息框的巧妙生成 地图上气泡信息框是一种常用的交互功能,它简便易用,能够为用户提供额外信息。本文将探讨如何借助地图库的功能轻松创建这一功能。 利用地图库的原生功能 大多数地图库,如高德地图,都提供了现成的信息窗体和右键菜单功能。这些功能可以通过以下途径实现: 高德地图 JS API 参考文…

    2025年12月24日
    400
  • 如何使用 scroll-behavior 属性实现元素scrollLeft变化时的平滑动画?

    如何实现元素scrollleft变化时的平滑动画效果? 在许多网页应用中,滚动容器的水平滚动条(scrollleft)需要频繁使用。为了让滚动动作更加自然,你希望给scrollleft的变化添加动画效果。 解决方案:scroll-behavior 属性 要实现scrollleft变化时的平滑动画效果…

    2025年12月24日
    000
  • 如何为滚动元素添加平滑过渡,使滚动条滑动时更自然流畅?

    给滚动元素平滑过渡 如何在滚动条属性(scrollleft)发生改变时为元素添加平滑的过渡效果? 解决方案:scroll-behavior 属性 为滚动容器设置 scroll-behavior 属性可以实现平滑滚动。 html 代码: click the button to slide right!…

    2025年12月24日
    500
  • 为什么设置 `overflow: hidden` 会导致 `inline-block` 元素错位?

    overflow 导致 inline-block 元素错位解析 当多个 inline-block 元素并列排列时,可能会出现错位显示的问题。这通常是由于其中一个元素设置了 overflow 属性引起的。 问题现象 在不设置 overflow 属性时,元素按预期显示在同一水平线上: 不设置 overf…

    2025年12月24日 好文分享
    400
  • 网页使用本地字体:为什么 CSS 代码中明明指定了“荆南麦圆体”,页面却仍然显示“微软雅黑”?

    网页中使用本地字体 本文将解答如何将本地安装字体应用到网页中,避免使用 src 属性直接引入字体文件。 问题: 想要在网页上使用已安装的“荆南麦圆体”字体,但 css 代码中将其置于第一位的“font-family”属性,页面仍显示“微软雅黑”字体。 立即学习“前端免费学习笔记(深入)”; 答案: …

    2025年12月24日
    000
  • 如何选择元素个数不固定的指定类名子元素?

    灵活选择元素个数不固定的指定类名子元素 在网页布局中,有时需要选择特定类名的子元素,但这些元素的数量并不固定。例如,下面这段 html 代码中,activebar 和 item 元素的数量均不固定: *n *n 如果需要选择第一个 item元素,可以使用 css 选择器 :nth-child()。该…

    2025年12月24日
    200
  • 使用 SVG 如何实现自定义宽度、间距和半径的虚线边框?

    使用 svg 实现自定义虚线边框 如何实现一个具有自定义宽度、间距和半径的虚线边框是一个常见的前端开发问题。传统的解决方案通常涉及使用 border-image 引入切片图片,但是这种方法存在引入外部资源、性能低下的缺点。 为了避免上述问题,可以使用 svg(可缩放矢量图形)来创建纯代码实现。一种方…

    2025年12月24日
    100
  • 如何让“元素跟随文本高度,而不是撑高父容器?

    如何让 元素跟随文本高度,而不是撑高父容器 在页面布局中,经常遇到父容器高度被子元素撑开的问题。在图例所示的案例中,父容器被较高的图片撑开,而文本的高度没有被考虑。本问答将提供纯css解决方案,让图片跟随文本高度,确保父容器的高度不会被图片影响。 解决方法 为了解决这个问题,需要将图片从文档流中脱离…

    2025年12月24日
    000
  • 为什么我的特定 DIV 在 Edge 浏览器中无法显示?

    特定 DIV 无法显示:用户代理样式表的困扰 当你在 Edge 浏览器中打开项目中的某个 div 时,却发现它无法正常显示,仔细检查样式后,发现是由用户代理样式表中的 display none 引起的。但你疑问的是,为什么会出现这样的样式表,而且只针对特定的 div? 背后的原因 用户代理样式表是由…

    2025年12月24日
    200
  • inline-block元素错位了,是为什么?

    inline-block元素错位背后的原因 inline-block元素是一种特殊类型的块级元素,它可以与其他元素行内排列。但是,在某些情况下,inline-block元素可能会出现错位显示的问题。 错位的原因 当inline-block元素设置了overflow:hidden属性时,它会影响元素的…

    2025年12月24日
    000
  • 为什么 CSS mask 属性未请求指定图片?

    解决 css mask 属性未请求图片的问题 在使用 css mask 属性时,指定了图片地址,但网络面板显示未请求获取该图片,这可能是由于浏览器兼容性问题造成的。 问题 如下代码所示: 立即学习“前端免费学习笔记(深入)”; icon [data-icon=”cloud”] { –icon-cl…

    2025年12月24日
    200
  • 为什么使用 inline-block 元素时会错位?

    inline-block 元素错位成因剖析 在使用 inline-block 元素时,可能会遇到它们错位显示的问题。如代码 demo 所示,当设置了 overflow 属性时,a 标签就会错位下沉,而未设置时却不会。 问题根源: overflow:hidden 属性影响了 inline-block …

    2025年12月24日
    000
  • 如何利用 CSS 选中激活标签并影响相邻元素的样式?

    如何利用 css 选中激活标签并影响相邻元素? 为了实现激活标签影响相邻元素的样式需求,可以通过 :has 选择器来实现。以下是如何具体操作: 对于激活标签相邻后的元素,可以在 css 中使用以下代码进行设置: li:has(+li.active) { border-radius: 0 0 10px…

    2025年12月24日
    100
  • 为什么我的 CSS 元素放大效果无法正常生效?

    css 设置元素放大效果的疑问解答 原提问者在尝试给元素添加 10em 字体大小和过渡效果后,未能在进入页面时看到放大效果。探究发现,原提问者将 CSS 代码直接写在页面中,导致放大效果无法触发。 解决办法如下: 将 CSS 样式写在一个单独的文件中,并使用 标签引入该样式文件。这个操作与原提问者观…

    2025年12月24日
    000
  • 如何模拟Windows 10 设置界面中的鼠标悬浮放大效果?

    win10设置界面的鼠标移动显示周边的样式(探照灯效果)的实现方式 在windows设置界面的鼠标悬浮效果中,光标周围会显示一个放大区域。在前端开发中,可以通过多种方式实现类似的效果。 使用css 使用css的transform和box-shadow属性。通过将transform: scale(1.…

    2025年12月24日
    200
  • 为什么我的 em 和 transition 设置后元素没有放大?

    元素设置 em 和 transition 后不放大 一个 youtube 视频中展示了设置 em 和 transition 的元素在页面加载后会放大,但同样的代码在提问者电脑上没有达到预期效果。 可能原因: 问题在于 css 代码的位置。在视频中,css 被放置在单独的文件中并通过 link 标签引…

    2025年12月24日
    100
  • 为什么我的 Safari 自定义样式表在百度页面上失效了?

    为什么在 Safari 中自定义样式表未能正常工作? 在 Safari 的偏好设置中设置自定义样式表后,您对其进行测试却发现效果不同。在您自己的网页中,样式有效,而在百度页面中却失效。 造成这种情况的原因是,第一个访问的项目使用了文件协议,可以访问本地目录中的图片文件。而第二个访问的百度使用了 ht…

    2025年12月24日
    000

发表回复

登录后才能评论
关注微信