MySQL中常用的窗口函数有哪些 MySQL窗口函数详解与实战案例

mysql从8.0版本开始支持窗口函数,它能在不改变结果集行数的情况下进行计算,使数据分析更高效;1. 窗口函数通过over()定义计算范围,支持partition by分组和order by排序;2. 常见函数包括rank()、dense_rank()、row_number()等排序函数,sum()、avg()等聚合函数,lag()、lead()等偏移函数,以及first_value()、last_value()、ntile()等;3. rank()并列时跳过后续排名,dense_rank()不跳过,row_number()生成唯一序号;4. 聚合函数作为窗口函数可实现累计计算,如累计工资;5. lag()和lead()用于获取前后行数据,常用于差值分析;6. first_value()取窗口首值,last_value()需配合rows between unbounded preceding and unbounded following才能取窗口末值;7. ntile(n)将数据按序分为n桶,用于分层分析;8. 性能优化建议包括为partition by和order by列建立索引、避免复杂表达式、合理设定窗口范围并避免过度使用窗口函数;掌握这些内容可有效提升复杂查询的编写效率与执行性能。

MySQL中常用的窗口函数有哪些 MySQL窗口函数详解与实战案例

MySQL窗口函数,简单来说,就是在查询结果集上进行计算,但又不改变结果集的行数。它就像给你的数据加了一层“透视镜”,能让你看到更丰富的信息,而不用像GROUP BY那样改变数据的原始结构。

MySQL从8.0版本开始支持窗口函数,极大地增强了数据分析的能力。

MySQL窗口函数详解与实战案例

窗口函数是什么,为什么我们需要它?

想象一下,你要计算每个部门的工资排名,或者找出每个月销售额最高的几天。如果用传统的SQL,你需要各种子查询和连接,代码又长又难懂。窗口函数就像一个“神奇的盒子”,它能在你的原始数据上进行计算,然后把结果“贴”回每一行数据上。这样,你就能在同一行看到原始数据和计算结果,分析起来方便多了。

窗口函数的核心在于“窗口”的概念,它定义了计算的范围。这个范围可以是整个结果集,也可以是按照某种条件划分的子集。

MySQL常见的窗口函数有哪些?

MySQL提供了丰富的窗口函数,大致可以分为以下几类:

排序函数:

RANK()

,

DENSE_RANK()

,

ROW_NUMBER()

聚合函数:

SUM()

,

AVG()

,

MIN()

,

MAX()

,

COUNT()

分布函数:

PERCENT_RANK()

,

CUME_DIST()

偏移函数:

LAG()

,

LEAD()

首尾函数:

FIRST_VALUE()

,

LAST_VALUE()

其他函数:

NTH_VALUE()

,

NTILE()

这些函数的功能各不相同,但它们都遵循窗口函数的通用语法:

函数名(参数) OVER (PARTITION BY 列名 ORDER BY 列名)

PARTITION BY

用于将结果集划分为多个分区,窗口函数会在每个分区内独立计算。

ORDER BY

用于指定每个分区内的排序规则。如果没有

PARTITION BY

,则整个结果集被视为一个分区。

举个例子,假设我们有一个

employees

表,包含员工姓名、部门和工资:

name department salary

AliceSales5000BobSales6000CarolIT7000DavidIT8000EveSales5500

要计算每个部门的工资排名,可以使用以下SQL:

SELECT    name,    department,    salary,    RANK() OVER (PARTITION BY department ORDER BY salary DESC) AS salary_rankFROM    employees;

结果如下:

name department salary salary_rank

BobSales60001EveSales55002AliceSales50003DavidIT80001CarolIT70002

可以看到,

RANK()

函数在每个部门内按照工资降序进行了排名。

排序函数:RANK(), DENSE_RANK(), ROW_NUMBER() 的区别

这三个排序函数都用于计算排名,但它们的行为略有不同。

RANK()

:如果有并列排名,会跳过后续排名。例如,如果有两个第一名,则下一个排名是第三名。

DENSE_RANK()

:如果有并列排名,不会跳过后续排名。例如,如果有两个第一名,则下一个排名是第二名。

ROW_NUMBER()

:无论是否有并列排名,都会按照顺序生成唯一的排名。

继续上面的例子,如果我们在 Sales 部门添加一个工资为 6000 的员工 Frank:

name department salary

AliceSales5000BobSales6000FrankSales6000CarolIT7000DavidIT8000EveSales5500

使用不同的排序函数:

SELECT    name,    department,    salary,    RANK() OVER (PARTITION BY department ORDER BY salary DESC) AS rank_rank,    DENSE_RANK() OVER (PARTITION BY department ORDER BY salary DESC) AS dense_rank,    ROW_NUMBER() OVER (PARTITION BY department ORDER BY salary DESC) AS row_numberFROM    employees;

结果如下:

name department salary rank_rank dense_rank row_number

BobSales6000111FrankSales6000112EveSales5500323AliceSales5000434DavidIT8000111CarolIT7000222

可以看到,

RANK()

函数跳过了排名 2,而

DENSE_RANK()

函数没有跳过。

ROW_NUMBER()

函数则为每一行都生成了唯一的排名。

聚合函数作为窗口函数的应用场景?

SUM()

,

AVG()

,

MIN()

,

MAX()

,

COUNT()

这些聚合函数也可以作为窗口函数使用。 它们可以在窗口范围内进行聚合计算,并将结果返回到每一行。

动态WEB网站中的PHP和MySQL:直观的QuickPro指南第2版 动态WEB网站中的PHP和MySQL:直观的QuickPro指南第2版

动态WEB网站中的PHP和MySQL详细反映实际程序的需求,仔细地探讨外部数据的验证(例如信用卡卡号的格式)、用户登录以及如何使用模板建立网页的标准外观。动态WEB网站中的PHP和MySQL的内容不仅仅是这些。书中还提到如何串联JavaScript与PHP让用户操作时更快、更方便。还有正确处理用户输入错误的方法,让网站看起来更专业。另外还引入大量来自PEAR外挂函数库的强大功能,对常用的、强大的包

动态WEB网站中的PHP和MySQL:直观的QuickPro指南第2版 508 查看详情 动态WEB网站中的PHP和MySQL:直观的QuickPro指南第2版

例如,要计算每个部门的累计工资:

SELECT    name,    department,    salary,    SUM(salary) OVER (PARTITION BY department ORDER BY salary) AS cumulative_salaryFROM    employees;

结果如下:

name department salary cumulative_salary

AliceSales50005000EveSales550010500BobSales600016500CarolIT70007000DavidIT800015000

SUM(salary) OVER (PARTITION BY department ORDER BY salary)

计算了每个部门内,按照工资排序的累计工资。

如何使用LAG() 和 LEAD() 函数?

LAG()

LEAD()

函数用于访问窗口内前一行或后一行的值。

LAG(column, n, default_value)

:返回窗口内当前行之前第 n 行的 column 值。如果之前没有 n 行,则返回 default_value。

LEAD(column, n, default_value)

:返回窗口内当前行之后第 n 行的 column 值。如果之后没有 n 行,则返回 default_value。

例如,要计算每个员工的工资与前一个员工的工资差:

SELECT    name,    department,    salary,    salary - LAG(salary, 1, 0) OVER (PARTITION BY department ORDER BY salary) AS salary_differenceFROM    employees;

结果如下:

name department salary salary_difference

AliceSales50005000EveSales5500500BobSales6000500CarolIT70007000DavidIT80001000

LAG(salary, 1, 0) OVER (PARTITION BY department ORDER BY salary)

返回了每个部门内,前一个员工的工资。第一个员工的工资差为 5000,因为

LAG()

函数返回了默认值 0。

FIRST_VALUE() 和 LAST_VALUE() 函数的应用场景

FIRST_VALUE()

LAST_VALUE()

函数用于返回窗口内第一行和最后一行的值。

FIRST_VALUE(column)

:返回窗口内第一行的 column 值。

LAST_VALUE(column)

:返回窗口内最后一行的 column 值。

需要注意的是,

LAST_VALUE()

函数默认只返回当前行及之前行的最后一行的值。如果需要返回整个窗口的最后一行的值,需要使用

ROWS BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING

子句。

例如,要计算每个员工的工资与部门最高工资的差:

SELECT    name,    department,    salary,    MAX(salary) OVER (PARTITION BY department) - salary AS salary_differenceFROM    employees;

或者使用

FIRST_VALUE()

LAST_VALUE()

函数:

SELECT    name,    department,    salary,    LAST_VALUE(salary) OVER (PARTITION BY department ORDER BY salary ROWS BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING) - salary AS salary_differenceFROM    employees;

这两个SQL语句的结果相同,都是计算每个员工的工资与部门最高工资的差。

如何使用NTILE()函数进行数据分桶?

NTILE(n)

函数将窗口内的数据分成 n 桶,并为每一行分配一个桶号。

例如,要将员工按照工资分成 3 个等级:

SELECT    name,    department,    salary,    NTILE(3) OVER (ORDER BY salary) AS salary_levelFROM    employees;

结果如下:

name department salary salary_level

AliceSales50001EveSales55001BobSales60002CarolIT70002DavidIT80003

NTILE(3) OVER (ORDER BY salary)

将员工按照工资排序,并分成 3 个等级。

窗口函数性能优化建议

窗口函数虽然强大,但使用不当也会影响性能。以下是一些性能优化建议:

尽量使用索引:

PARTITION BY

ORDER BY

子句中使用的列应该有索引,以提高查询效率。避免在窗口函数中使用复杂的表达式: 复杂的表达式会增加计算量,影响性能。合理选择窗口范围: 窗口范围过大或过小都会影响性能。应该根据实际需求选择合适的窗口范围。避免过度使用窗口函数: 过度使用窗口函数会增加查询复杂度,影响性能。

总之,窗口函数是MySQL中非常强大的数据分析工具。掌握窗口函数的使用,可以让你更轻松地完成各种复杂的数据分析任务。但同时也要注意性能优化,避免过度使用。

以上就是MySQL中常用的窗口函数有哪些 MySQL窗口函数详解与实战案例的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1027733.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
天宫AI能做企业级应用吗_天宫AI企业解决方案与部署方法
上一篇 2025年12月2日 02:47:02
电脑程序里没有winrar怎么办_winrar软件安装与修复方法
下一篇 2025年12月2日 02:47:10

相关推荐

  • composer require-dev和require有什么不同_Composer Require与Require-Dev区别解析

    require用于声明项目运行必需的依赖,如框架、数据库组件和第三方SDK,这些包会随项目部署到生产环境;2. require-dev用于声明仅在开发和测试阶段需要的工具,如PHPUnit、PHPStan、Faker等,不会默认部署到生产环境;3. 安装时composer install根据环境决定…

    2026年5月10日
    900
  • 开源免费PHP工具 PHP开发效率提升利器

    推荐开源免费PHP开发工具以提升效率:VS Code、Sublime Text轻量高效,PhpStorm专业强大;调试用Xdebug、Kint、Ray;依赖管理选Composer;代码质量工具包括PHPStan、Psalm、PHP_CodeSniffer;数据库管理可用%ignore_a_1%MyA…

    2026年5月10日
    000
  • 利用海象运算符简化条件赋值:Python教程与最佳实践

    本文旨在探讨Python中海象运算符(:=)在条件赋值场景下的应用。通过对比传统if/else语句与海象运算符,以及条件表达式,分析海象运算符在简化代码、提高可读性方面的优势与局限性。并通过具体示例,展示如何在列表推导式等场景下合理使用海象运算符,同时强调其潜在的复杂性及替代方案,帮助开发者更好地掌…

    2026年5月10日
    000
  • Debian syslog性能优化技巧有哪些

    提升Debian系统syslog (通常基于rsyslog)性能,关键在于精简配置和高效处理日志。以下策略能有效优化日志管理,提升系统整体性能: 精简配置,高效加载: 在rsyslog配置文件中,仅加载必要的输入、输出和解析模块。 使用全局指令设置日志级别和格式,避免不必要的处理。 自定义模板: 创…

    2026年5月10日
    000
  • c++中的SFINAE技术是什么_c++模板编程中的SFINAE原理与应用

    SFINAE 是“替换失败不是错误”的原则,指模板实例化时若参数替换导致错误,只要存在其他合法候选,编译器不报错而是继续重载决议。它用于条件启用模板、类型检测等场景,如通过 decltype 或 enable_if 控制函数重载,实现类型特征判断。尽管 C++20 引入 Concepts 简化了部分…

    2026年5月10日
    000
  • 理解编程指令:当结果正确,但实现方式不符要求时

    本文探讨了在编程实践中,即使程序输出了正确的结果,但若其实现方式未能严格遵循既定指令,仍可能被视为“不正确”的问题。我们将通过具体示例,对比直接求和与累加求和两种实现策略,强调理解和遵守编程规范的重要性,以确保代码的健壮性、可维护性及符合项目要求。 在软件开发过程中,我们经常会遇到这样的情况:编写的…

    2026年5月10日
    000
  • Golang goroutine与channel调试技巧

    使用go run -race检测数据竞争,结合runtime.NumGoroutine监控协程数量,通过pprof分析阻塞调用栈,利用select超时避免永久阻塞,有效排查goroutine泄漏、死锁和数据竞争问题。 Go语言的goroutine和channel是并发编程的核心,但它们也带来了调试上…

    2026年5月10日
    000
  • 使用 Jupyter Notebook 进行探索性数据分析

    Jupyter Notebook通过单元格实现代码与Markdown结合,支持数据导入(pandas)、清洗(fillna)、探索(matplotlib/seaborn可视化)、统计分析(describe/corr)和特征工程,便于记录与分享分析过程。 Jupyter Notebook 是进行探索性…

    2026年5月10日
    000
  • php常量怎么用_PHP常量(define/const)定义与使用方法

    PHP中可通过define函数和const关键字定义常量,用于存储不可变值。define适用于全局作用域,支持动态名称和条件定义,如define(‘SITE_NAME’, ‘MyWebsite’);const在编译时生效,语法简洁但限制多,只能在类或全…

    2026年5月10日
    000
  • 网站标题关键词更新后,搜索引擎为何仍显示旧标题?

    网站标题更新后,搜索引擎为何显示旧标题? 网站SEO优化中,站长常修改网站标题关键词,期望搜索结果显示自定义标题。然而,即使更新标签、meta keywords、meta description和结构化数据中的name属性后,搜索结果仍显示旧标题,这令人费解。本文将对此进行解释。 问题:站长修改了网…

    2026年5月10日
    100
  • Python命令怎样使用profile分析脚本性能 Python命令性能分析的基础教程

    使用Python的cProfile模块分析脚本性能最直接的方式是通过命令行执行python -m cProfile your_script.py,它会输出每个函数的调用次数、总耗时、累积耗时等关键指标,帮助定位性能瓶颈;为进一步分析,可将结果保存为文件python -m cProfile -o ou…

    2026年5月10日
    000
  • 如何插入查询结果数据_SQL插入Select查询结果方法

    如何插入查询结果数据_SQL插入Select查询结果方法如何插入查询结果数据_SQL插入Select查询结果方法如何插入查询结果数据_SQL插入Select查询结果方法如何插入查询结果数据_SQL插入Select查询结果方法

    使用INSERT INTO…SELECT语句可高效插入数据,通过NOT EXISTS、LEFT JOIN、MERGE语句或唯一约束避免重复;表结构不一致时可通过别名、类型转换、默认值或计算字段处理;结合存储过程可提升可维护性,支持参数化与动态SQL。 将查询结果数据插入到另一个表中,可以…

    2026年5月10日 用户投稿
    000
  • Discord.py 交互按钮超时与持久化解决方案

    本教程旨在解决Discord.py中交互按钮在一段时间后出现“This Interaction Failed”错误的问题。我们将深入探讨视图(View)的超时机制,并提供通过正确设置timeout参数以及利用bot.add_view()方法实现按钮持久化的具体方案,确保您的机器人交互功能稳定可靠,即…

    2026年5月10日
    000
  • python中zip函数详解 python多序列压缩zip函数应用场景

    zip函数的应用场景包括:1) 同时遍历多个序列,2) 合并多个列表的数据,3) 数据分析和科学计算中的元素运算,4) 处理csv文件,5) 性能优化。zip函数是一个强大的工具,能够简化代码并提高处理多个序列时的效率。 在Python中,zip函数是一个非常有用的工具,它能够将多个可迭代对象打包成…

    2026年5月10日
    000
  • 谷歌浏览器如何截图 谷歌浏览器页面截图技巧

    谷歌浏览器如何截图 谷歌浏览器页面截图技巧谷歌浏览器如何截图 谷歌浏览器页面截图技巧谷歌浏览器如何截图 谷歌浏览器页面截图技巧谷歌浏览器如何截图 谷歌浏览器页面截图技巧

    使用谷歌浏览器的开发者工具截图步骤:1. 按ctrl+shift+i(windows/linux)或cmd+option+i(mac)打开开发者工具。2. 点击右上角三个点,选择”更多工具”,再选择”截图”。3. 选择截取整个页面。推荐的谷歌浏览器扩展…

    2026年5月10日 用户投稿
    100
  • Python中怎样使用pymongo?

    在python中使用pymongo可以轻松地与mongodb数据库进行交互。1)安装pymongo:pip install pymongo。2)连接到mongodb:from pymongo import mongoclient; client = mongoclient(‘mongod…

    2026年5月10日
    000
  • JavaScript函数中插入加载动画(Spinner)的正确方法

    本文旨在解决在JavaScript函数中插入加载动画(Spinner)时遇到的异步问题。通过引入async/await和Promise.all,确保在数据处理完成前后正确显示和隐藏加载动画,提升用户体验。我们将提供两种实现方案,并详细解释其原理和优势。 在Web开发中,当执行耗时操作时,显示加载动画…

    2026年5月10日
    000
  • JS如何实现迭代器?迭代器协议

    JavaScript中实现迭代器需遵循可迭代协议和迭代器协议,通过定义[Symbol.iterator]方法返回具备next()方法的迭代器对象,从而支持for…of和展开运算符;该机制统一了数据结构的遍历接口,实现惰性求值,适用于自定义对象、树、图及无限序列等复杂场景,提升代码通用性与…

    2026年5月10日
    000
  • Golang空接口如何应用在项目中

    空接口可用于接收任意类型值,常见于日志函数、通用数据结构、JSON动态解析及配置驱动逻辑,提升代码灵活性,但需配合类型断言确保安全,避免滥用以降低维护成本。 空接口 interface{} 在 Go 语言中是一个非常灵活的类型,它可以存储任何类型的值。虽然它牺牲了一部分类型安全,但在实际项目中合理使…

    2026年5月10日
    100
  • MySQL数据库不支持中文的解决办法

    接上一篇文章,在解决了mysql+flask环境配置问题之后,往数据库存中文字符串会报1366错误,提示不正确的字符。继而发现默认的mysql采用了latin1字符集,这种编码是不支持中文的。 如果想支持中文的话,需要设置一下mysql字符集。 众所周知utf-8是可以的,gbk也没问题,为了可扩展…

    用户投稿 2026年5月10日
    000

发表回复

登录后才能评论
关注微信