Sql 四大排名函数(ROW_NUMBER、RANK、DENSE_RANK、NTILE)简介

排名函数是Sql Server2005新增的功能,下面简单介绍一下他们各自的用法和区别。我们新建一张Order表并添加一些初始数据方便我们查看效果。

Sql 四大排名函数(ROW_NUMBER、RANK、DENSE_RANK、NTILE)简介

 表结构和初始数据Sql

附上表结构和初始数据图:

  表结构和初始数据-晓菜鸟

 

一、ROW_NUMBER

  row_number的用途的非常广泛,排序最好用他,一般可以用来实现web程序的分页,他会为查询出来的每一行记录生成一个序号,依次排序且不会重复,注意使用row_number函数时必须要用over子句选择对某一列进行排序才能生成序号。row_number用法实例:

 

select ROW_NUMBER() OVER(order by [SubTime] desc) as row_num,* from [Order]

 

  查询结果如下图所示:

  row_number查询结果-晓菜鸟

  图中的row_num列就是row_number函数生成的序号列,其基本原理是先使用over子句中的排序语句对记录进行排序,然后按照这个顺序生成序号。over子句中的order by子句与SQL语句中的order by子句没有任何关系,这两处的order by 可以完全不同,如以下sql,over子句中根据SubTime降序排列,Sql语句中则按TotalPrice降序排列。

select ROW_NUMBER() OVER(order by [SubTime] desc) as row_num,* from [Order] order by [TotalPrice] desc

  查询结果如下图所示:

  over子句和sql语句中的order by 可完全不同-晓菜鸟

  利用row_number可以实现web程序的分页,我们来查询指定范围的表数据。例:根据订单提交时间倒序排列获取第三至第五条数据。

with orderSection as(    select ROW_NUMBER() OVER(order by [SubTime] desc) rownum,* from [Order])select * from [orderSection] where rownum between 3 and 5 order by [SubTime] desc

  查询结果如下图所示:

  利用row_number实现分页-晓菜鸟

  注意:在使用row_number实现分页时需要特别注意一点,over子句中的order by 要与Sql排序记录中的order by 保持一致,否则得到的序号可能不是连续的。下面我们写一个例子来证实这一点,将上面Sql语句中的排序字段由SubTime改为TotalPrice。另外提一下,对于带有子查询和CTE的查询,子查询和CTE查询有序并不代表整个查询有序,除非显示指定了order by。

with orderSection as(    select ROW_NUMBER() OVER(order by [SubTime] desc) rownum,* from [Order])select * from [orderSection] where rownum between 3 and 5 order by [TotalPrice] desc

  查询结果如下图所示:

  over子句中的order by 与sql排序的order by 不一致-晓菜鸟

  

二、RANK

  rank函数用于返回结果集的分区内每行的排名, 行的排名是相关行之前的排名数加一。简单来说rank函数就是对查询出来的记录进行排名,与row_number函数不同的是,rank函数考虑到了over子句中排序字段值相同的情况,如果使用rank函数来生成序号,over子句中排序字段值相同的序号是一样的,后面字段值不相同的序号将跳过相同的排名号排下一个,也就是相关行之前的排名数加一,可以理解为根据当前的记录数生成序号,后面的记录依此类推。可能我描述的比较苍白,理解起来也比较吃力,我们直接上代码,rank函数的使用方法与row_number函数完全相同。

select RANK() OVER(order by [UserId]) as rank,* from [Order]

  查询结果如下图所示:

  使用rank函数排名-晓菜鸟

  由上图可以看出,rank函数在进行排名时,同一组的序号是一样的,而后面的则是根据当前的记录数依次类推,图中第一、二条记录的用户Id相同,所以他们的序号是一样的,第三条记录的序号则是3。  

 

三、DENSE_RANK

  dense_rank函数的功能与rank函数类似,dense_rank函数在生成序号时是连续的,而rank函数生成的序号有可能不连续。dense_rank函数出现相同排名时,将不跳过相同排名号,rank值紧接上一次的rank值。在各个分组内,rank()是跳跃排序,有两个第一名时接下来就是第四名,dense_rank()是连续排序,有两个第一名时仍然跟着第二名。将上面的Sql语句改由dense_rank函数来实现。

select DENSE_RANK() OVER(order by [UserId]) as den_rank,* from [Order]

  查询结果如下图所示:

  使用dense_rank函数排名-晓菜鸟

  图中第一、二条记录的用户Id相同,所以他们的序号是一样的,第三条记录的序号紧接上一个的序号,所以为2不为3,后面的依此类推。

四、NTILE

  ntile函数可以对序号进行分组处理,将有序分区中的行分发到指定数目的组中。 各个组有编号,编号从一开始。 对于每一个行,ntile 将返回此行所属的组的编号。这就相当于将查询出来的记录集放到指定长度的数组中,每一个数组元素存放一定数量的记录。ntile函数为每条记录生成的序号就是这条记录所有的数组元素的索引(从1开始)。也可以将每一个分配记录的数组元素称为“桶”。ntile函数有一个参数,用来指定桶数。下面的SQL语句使用ntile函数对Order表进行了装桶处理:

select NTILE(4) OVER(order by [SubTime] desc) as ntile,* from [Order]

  查询结果如下图所示:

  使用ntile排名函数-晓菜鸟

  Order表的总记录数是6条,而上面的Sql语句ntile函数指定的组数是4,那么Sql Server2005是怎么来决定每一组应该分多少条记录呢?这里我们就需要了解ntile函数的分组依据(约定)。

  ntile函数的分组依据(约定):

  1、每组的记录数不能大于它上一组的记录数,即编号小的桶放的记录数不能小于编号大的桶。也就是说,第1组中的记录数只能大于等于第2组及以后各组中的记录数。

  2、所有组中的记录数要么都相同,要么从某一个记录较少的组(命名为X)开始后面所有组的记录数都与该组(X组)的记录数相同。也就是说,如果有个组,前三组的记录数都是9,而第四组的记录数是8,那么第五组和第六组的记录数也必须是8。

  这里对约定2进行详细说明一下,以便于更好的理解。

  首先系统会去检查能不能对所有满足条件的记录进行平均分组,若能则直接平均分配就完成分组了;若不能,则会先分出一个组,这个组分多少条记录呢?就是 (总记录数/总组数)+1 条,之所以分配 (总记录数/总组数)+1 条是因为当不能进行平均分组时,总记录数%总组数肯定是有余的,又因为分组约定1,所以先分出去的组需要+1条。

  分完之后系统会继续去比较余下的记录数和未分配的组数能不能进行平均分配,若能,则平均分配余下的记录;若不能,则再分出去一组,这个组的记录数也是(总记录数/总组数)+1条。

  然后系统继续去比较余下的记录数和未分配的组数能不能进行平均分配,若能,则平均分配余下的记录;若还是不能,则再分配出去一组,继续比较余下的……这样一直进行下去,直至分组完成。

  举个例子,将51条记录分配成5组,51%5==1不能平均分配,则先分出去一组(51/5)+1=11条记录,然后比较余下的 51-11=40 条记录能否平均分配给未分配的4组,能平均分配,则剩下的4组,每组各40/4=10 条记录,分配完成,分配结果为:11,10,10,10,10,晓菜鸟我开始就错误的以为他会分配成 11,11,11,11,7。

  根据上面的两个约定,可以得出如下的算法:

 

复制代码

//mod表示取余,p表示取整.if(记录总数 mod 桶数==0){  recordCount=记录总数 p 桶数;  //将每桶的记录数都设为recordCount.}else{  recordCount1=记录总数 p 桶数+1;  int n=1;//n表示桶中记录数为recordCount1的最大桶数.  m=recordCount1*n;  while(((记录总数-m) mod (桶数- n)) !=0)  {    n++;    m=recordCount1*n;  }  recordCount2=(记录总数-m) p (桶数-n);  //将前n个桶的记录数设为recordCount1.  //将n+1个至后面所有桶的记录数设为recordCount2.}

复制代码

 

Sql 四大排名函数(ROW_NUMBER、RANK、DENSE_RANK、NTILE)简介 NTILE()函数算法实现代码

  

  根据上面的算法,如果总记录数为59,总组数为5,则 n=4 , recordCount1=12 , recordCount2=11,分组结果为 :12,12,12,12,11。

  如果总记录数为53,总组数为5,则 n=3 , recordCount1=11 , recordCount2=10,分组结果为:11,11,11,10,10。

  就拿上面的例子来说,总记录数为6,总组数为4,通过算法得到 n=2 , recordCount1=2 , recordCount2=1,分组结果为:2,2,1,1。

 

select ntile,COUNT([ID]) recordCount from (    select NTILE(4) OVER(order by [SubTime] desc) as ntile,* from [Order]) as tgroup by t.ntile

 

  运行Sql,分组结果如图:

  使用ntilt()函数分组-晓菜鸟

  比对算法与Sql Server的分组结果是一致的,说明算法没错。:)

 

总结:

在使用排名函数的时候需要注意以下三点:

  1、排名函数必须有 OVER 子句。

  2、排名函数必须有包含 ORDER BY 的 OVER 子句。

  3、分组内从1开始排序。

本文讲解了Sql 四大排名函数(ROW_NUMBER、RANK、DENSE_RANK、NTILE)相关知识,更多相关内容请关注创想鸟。

相关推荐:

Mysql常用基准测试工具

Mysql函数 的相关讲解

SQLLite相关内容

以上就是Sql 四大排名函数(ROW_NUMBER、RANK、DENSE_RANK、NTILE)简介的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/383831.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月6日 12:33:45
下一篇 2025年11月6日 12:38:51

相关推荐

  • 迁移PHPCMS网站到新域名的详细步骤

    迁移phpcms网站到新域名的核心步骤包括:1.全面备份网站文件和数据库,确保有恢复保障;2.将备份文件上传至新服务器并解压,或调整服务器目录指向;3.创建新数据库并导入备份,执行sql更新v9_site表的domain和siteurl、v9_setting表的base_url等关键字段;4.修改d…

    2025年12月10日 好文分享
    000
  • PHP如何使用MySQL数据库 PHP源码连接MySQL配置指南

    php连接mysql的解决方案是使用mysqli或pdo扩展,其中mysqli是官方推荐、性能更佳的选择,而pdo支持多数据库连接、灵活性更高。1. 安装扩展:linux下通过sudo apt-get install php-mysqli或sudo yum install php-mysqli安装m…

    2025年12月10日 好文分享
    000
  • PHP 函数如何与 SQL 交互

    php 提供一系列函数用于与 sql 数据库交互:使用 mysqli_connect 连接到数据库。使用 mysqli_query 执行 sql 查询。使用以下函数之一处理查询结果:mysqli_fetch_row(以关联数组形式获取单行结果)mysqli_fetch_assoc(以关联数组形式获取…

    2025年12月9日
    000
  • SQL文件如何Mysql 导入数据库

    1、在 win 系统下使用 mysql 中的source命令即可实现导入 sql 文件: mysql -u root -pmysql>use 数据库名mysql>source d:/数据库名 这样就完成了 Win 系统下的 SQL 文件的导入。 2、在 Linux 系统下导入 SQL 文…

    数据库 2025年12月5日
    100
  • MySQL内连接、外连接及SQL JOINS的实现方法是什么

    1. 内连接 内连接:合并具有同一列的两个以上的表的行,结果集中不包含一个表与另一个表不匹配的行。 说人话就是,查询结果只包含它们匹配的行,不匹配的就不要了。 【例子】查询员工编号 employee_id 和其对应的部门名称 department_name 。其中部门名称 department_na…

    2025年12月4日 数据库
    000
  • MySQL之SQL语法及SQL解析顺序源码分析

    sql(structured query language)是一种标准,作为一种访问【关系型数据库的标准语言】。许多数据库产品,如oracle,db2,sql server,postgresql,mysql都支持它。在过去几年中,nosql最初声称不需要sql,但最终不得不修正为”not…

    2025年12月4日 数据库
    000
  • mysql如何执行sql脚本

    类似于普通的脚本语言,MySQL也有一套对字符、单词和特殊符号的使用规则,MySQL通过执行SQL脚本来完成对数据库的操作,这个脚本由一个或多个MySQL语句(SQL语句+扩展语句)组成,脚本文件的后缀名称通常是.%ign%ignore_a_1%re_a_1%。MySQL客户机还可以在控制台上执行语…

    数据库 2025年12月3日
    000
  • mysql实现按组区分后获取每组前几名的sql怎么写

    遇到一个场景,要把数据分组,然后获取每组前10条数据,首先我想到用group by分组,但是难点是分组后怎么知道该数据在组里面排第几条。 一、创建表,插入相关测试数据 CREATE TABLE `score` ( `id` int(11) NOT NULL AUTO_INCREMENT COMMEN…

    2025年12月3日
    000
  • mysql的DML进阶、分页查找、SQL约束及多表操作方法

    一. 什么是DML, 以及DML基本操作, 表的列和行的跟新操作 针对列进行修改操作 #首先简单的创建一个student表为后序操作做准备use test;create table student (id int,name varchar(8),age tinyint) engine = innod…

    2025年12月3日 数据库
    000
  • sql中怎么执行批处理 批处理执行的高效方法分享

    在sql中执行批处理的关键在于使用不同数据库的特定方法一次性执行多条语句。在sql server中,使用go命令分隔多个批处理,每个go之间的语句为一个独立批处理;在mysql中,可通过客户端工具或编程语言(如python)执行包含多条语句的脚本文件,同时注意分割语句并忽略空行;批处理错误可通过事务…

    2025年12月3日 数据库
    000
  • SQL中substring函数怎么用 5分钟掌握substring函数核心用法

    sql中的substring函数用于截取字符串,基本语法为substring(string, start, length),其中string为要截取的字符串,start为开始位置(从1开始),length为截取字符数;例如从’hello world’中截取’wor…

    2025年12月3日 数据库
    000
  • sql中如何实现递归查询 递归查询的经典案例演示

    sql递归查询通过cte实现层级数据查询,核心在于锚点成员与递归成员结合,常见错误包括无限循环、性能问题、数据类型不匹配等;优化方法有索引优化、限制递归深度、使用临时表等;不同数据库如postgresql、sql server、mysql支持递归cte,oracle则使用connect by语法。 …

    2025年12月3日 数据库
    000
  • SQL中NULL值处理的注意事项 NULL值在SQL运算中的特殊规则解析

    sql中null值处理需特别注意其特性及运算规则。1. null代表未知或缺失,不能用=判断,需使用is null或is not null;2. null参与运算结果通常也为null,需用isnull、coalesce、ifnull等函数替换默认值;3. 统计时avg会忽略null值影响结果,可用c…

    2025年12月3日 数据库
    000
  • SQL如何计算数据总数 SQL数据总数统计方法分享

    %ign%ignore_a_1%re_a_1%中统计数据总数最直接的方法是使用count()函数,它会统计表中所有行的数量,包括null值。例如:select count() from employees; 可返回总行数。其次,若需统计特定列非null值的数量,则使用count(column_nam…

    2025年12月3日 数据库
    000
  • sql中怎么插入多条数据 批量插入数据的便捷方法分享

    在sql中插入多条数据的方法有多种,核心是提高效率并减少数据库交互。1. 使用insert into … values一次性插入多条记录,适用于少量数据;2. 通过创建临时表插入数据并进行预处理;3. mysql使用load data infile高效导入文件数据;4. postgres…

    2025年12月3日 数据库
    000
  • SQL查询不等于某个日期的写法 日期不等查询的注意事项

    要排除特定日期的数据需使用!=或运算符并注意格式匹配,1.直接使用!=或排除特定日期,如select * from table where date_column != ‘2023-10-27’;2.若字段含时间部分,建议用范围查询排除整日数据;3.可借助数据库函数如mysq…

    2025年12月3日 数据库
    000
  • sql中rank和dense_rank的区别 窗口函数rank/dense_rank对比

    简而言之,RANK() 会产生跳跃的排名,而 DENSE_RANK() 则不会。如果你需要考虑并列排名,并且不希望排名出现空隙,那么 DENSE_RANK() 更适合。 RANK() vs DENSE_RANK():%ign%ignore_a_1%re_a_1%对比 SQL 中的 RANK() 和 …

    2025年12月3日 数据库
    000
  • SQL如何实现分页查询 SQL分页查询3种实现方案

    优化sql分页查询性能的核心在于减少offset的使用,避免全表扫描。1.使用limit和offset适用于小数据量,但offset过大时会导致性能急剧下降;2.通过子查询或join先找到起始id再进行范围查询,在一定程度上提升性能;3.书签式分页基于唯一递增字段记录上一页最后一条数据id,直接从该…

    2025年12月3日 数据库
    000
  • sql中怎么创建视图 视图创建的详细步骤解析

    视图是存储的sql查询,用于简化复杂查询、提高数据安全性和提供友好访问方式。创建视图的核心是使用create view语句,语法为create view view_name as select …,例如创建显示工资高于5000员工信息的视图。视图分为简单视图(基于单表、无聚合函数)和复杂…

    2025年12月3日 数据库
    000
  • sql中如何创建数据库 创建数据库的完整步骤解析

    创建数据库需先通过sql语句如create database database_name;命名应简洁明确,反映数据类型或用途,避免特殊字符和保留字,推荐使用小写字母与下划线组合;选择dbms时要考虑性能、功能及成本,还需考虑并发处理、安全性及备份策略;创建后需设计表结构,遵循范式减少冗余,建立外键关…

    2025年12月3日 数据库
    000

发表回复

登录后才能评论
关注微信