优化 SQL 查询

优化 sql 查询

在编写查询时,我们应该始终花时间找到编写查询的最佳方式。

有时,这可能意味着使用表面上看起来速度不快但实际上速度很快的方法。

查询优化对于拥有高效的网站至关重要。

虽然查询优化也适用于报告和分析,但作为 web 服务一部分运行的查询是网站用户最关注的查询。

在本文中,我使用 mysql 测试员工数据库:https://dev.mysql.com/doc/employee/en/

模式

create table `employees` (  `emp_no` int not null,  `birth_date` date not null,  `first_name` varchar(14) not null,  `last_name` varchar(16) not null,  `gender` enum('m','f') not null,  `hire_date` date not null,  primary key (`emp_no`),  key `name` (`first_name`,`last_name`) )
create table `salaries` (  `emp_no` int not null,  `salary` int not null,  `from_date` date not null,  `to_date` date not null,  primary key (`emp_no`,`from_date`),  key `salary` (`emp_no`,`salary`))

薪水表可以多次包含同一员工,每次员工薪水发生变化时,薪水表中都会出现一个新行。

任务

此查询的任务是返回年收入超过 50,000 美元的员工编号、名字、姓氏的唯一列表。

除了选择数据之外,我们还需要确保没有重复的员工。

使用 distinct

select distinct    employees.emp_no,    first_name,    last_namefrom    employees    inner join salaries using (emp_no)where    salary > 50000

一般来说,使用 distinct 表明查询可以写得更好。

distinct 获取所有可能的行,并在查询过程结束时删除不需要的重复行。

distinct 是根据所有选定的行计算的。这可能意味着在某些情况下可能会返回重复的名称。

可能发生这种情况的一个示例是,如果我们包含一个员工的每一行都发生更改的列,例如 salary

select distinct    employees.emp_no,    first_name,    last_name,    salaryfrom    employees    inner join salaries using (emp_no)where    salary > 50000

查询执行计划:

-> table scan on   (cost=241946..245972 rows=321886)   └─> temporary table with deduplication  (cost=241946..241946 rows=321886)      └─> nested loop inner join  (cost=209757 rows=321886)         ├─> filter: (salaries.salary > 50000)  (cost=97097 rows=321886)         │  └─> index scan on salaries using salary  (cost=97097 rows=965756)         └─> single-row index lookup on employees using primary (emp_no=salaries.emp_no)  (cost=0.25 rows=1)

执行计划显示使用了临时表,成本较高。临时表的查询速度通常较慢。有时它们是必要的,但如果您能找到一种不使用临时表的查询方法,通常会更有效。

平均响应时间:745ms

使用 group by

确保唯一用户的常用方法是使用 group by

group by 通常比 distinct 更快。它不需要删除重复项的最后一步来完成查询计划

select    employees.emp_no,    first_name,    last_namefrom    employees    inner join salaries using(emp_no)where    salary > 50000group by    employees.emp_no

查询执行计划:

-> table scan on   (cost=241946..245972 rows=321886)   └─> temporary table with deduplication  (cost=241946..241946 rows=321886)      └─> nested loop inner join  (cost=209757 rows=321886)         ├─> filter: (salaries.salary > 50000)  (cost=97097 rows=321886)         │  └─> index scan on salaries using salary  (cost=97097 rows=965756)         └─> single-row index lookup on employees using primary (emp_no=salaries.emp_no)  (cost=0.25 rows=1)

虽然 group by 比 distinct 稍快,但执行计划是相同的。这种情况下它们之间的区别一般与内部查询优化器、查询缓存等有关。

虽然执行计划非常有用,但它们并不总能为您提供内部发生的全部情况,这会导致可能具有相同执行计划的查询之间存在细微的差异。

平均响应时间:721ms

使用子查询

虽然子查询通常被认为效率较低,但有时它们可​​以减少行数,从而使查询速度更快。

在本例中,我们将使用子查询来查找工资超过 50,000 美元的员工编号

select    employees.emp_no,    first_name,    last_namefrom    employeeswhere    emp_no in(        select            emp_no from salaries        where            salary > 50000)

使用该方法,查询时间显着下降。

查询执行计划:

-> nested loop inner join  (cost=89029 rows=33961)   ├─> remove duplicates from input sorted on salary  (cost=5161 rows=33961)   │  └─> filter: (salaries.salary > 50000)  (cost=5161 rows=33961)   │     └─> index scan on salaries using salary  (cost=5161 rows=965756)   └─> single-row index lookup on employees using primary (emp_no=salaries.emp_no)  (cost=80472 rows=1)

在这里您将看到查询不再使用临时表,而是使用更简单的计划,成本值更低。

这些因素导致响应时间更快。

平均响应时间: 234ms

虽然使用子查询显着提高了查询性能,但我们也许可以通过使用 exists 子句获得更好的结果,这比子查询中使用的 in 语句具有一些优势。

使用存在

使用 exists 时,查询一旦找到匹配项就会提前终止。在这种情况下,一旦找到特定员工,它就会提前终止。

虽然某个员工的工资表中有多行,但如果找到匹配的行,则不需要继续检查该特定员工是否存在,因此它会停止查找该员工并继续寻找下一个员工一个。

select    employees.emp_no,    first_name,    last_namefrom    employeeswhere    exists (        select            1        from            salaries        where            salaries.emp_no = employees.emp_no            and salary > 50000)

我们在此查询中使用 select 1 因为 exists 只返回 true 或 false,而不返回该行包含的内容。

虽然我们可以使用 select emp_noselect *,但返回常量可以使查询的意图更清晰,并且在某些情况下可以更高效。

查询执行计划:

-> nested loop inner join  (cost=89029 rows=33961)   ├─> remove duplicates from input sorted on salary  (cost=5161 rows=33961)   │  └─> filter: (salaries.salary > 50000)  (cost=5161 rows=33961)   │     └─> index scan on salaries using salary  (cost=5161 rows=965756)   └─> single-row index lookup on employees using primary (emp_no=salaries.emp_no)  (cost=80472 rows=1)

虽然此查询计划与子查询查询计划相同,但提前终止可以提高执行时间。

平均响应时间:220ms

概括

独特:745ms
分组依据:721ms
子查询:234ms
存在:220ms

使用子查询并不总是最有效的查询方法,但是,在这种情况下,它可以显着改善您的查询。

虽然仅更改查询可以帮助修复缓慢的查询,但还可以考虑其他优化。

创建更好的索引也可以帮助解决缓慢的查询问题,但是添加索引应该保留在重写查询无法帮助查询提高效率的时候。

对自己的数据尝试不同的查询策略非常重要。虽然 exists 是查询此数据集时最有效的策略,但其他数据集的结果可能有所不同,因此请尝试各种查询,看看哪一个最适合您。

以上就是优化 SQL 查询的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/55087.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月9日 19:11:01
下一篇 2025年11月9日 19:14:37

相关推荐

  • 旋转长方形后,如何计算其相对于画布左上角的轴距?

    绘制长方形并旋转,计算旋转后轴距 在拥有 1920×1080 画布中,放置一个宽高为 200×20 的长方形,其坐标位于 (100, 100)。当以任意角度旋转长方形时,如何计算它相对于画布左上角的 x、y 轴距? 以下代码提供了一个计算旋转后长方形轴距的解决方案: const x = 200;co…

    2025年12月24日
    000
  • 旋转长方形后,如何计算它与画布左上角的xy轴距?

    旋转后长方形在画布上的xy轴距计算 在画布中添加一个长方形,并将其旋转任意角度,如何计算旋转后的长方形与画布左上角之间的xy轴距? 问题分解: 要计算旋转后长方形的xy轴距,需要考虑旋转对长方形宽高和位置的影响。首先,旋转会改变长方形的长和宽,其次,旋转会改变长方形的中心点位置。 求解方法: 计算旋…

    2025年12月24日
    000
  • 旋转长方形后如何计算其在画布上的轴距?

    旋转长方形后计算轴距 假设长方形的宽、高分别为 200 和 20,初始坐标为 (100, 100),我们将它旋转一个任意角度。根据旋转矩阵公式,旋转后的新坐标 (x’, y’) 可以通过以下公式计算: x’ = x * cos(θ) – y * sin(θ)y’ = x * …

    2025年12月24日
    000
  • 如何计算旋转后长方形在画布上的轴距?

    旋转后长方形与画布轴距计算 在给定的画布中,有一个长方形,在随机旋转一定角度后,如何计算其在画布上的轴距,即距离左上角的距离? 以下提供一种计算长方形相对于画布左上角的新轴距的方法: const x = 200; // 初始 x 坐标const y = 90; // 初始 y 坐标const w =…

    2025年12月24日
    200
  • CSS元素设置em和transition后,为何载入页面无放大效果?

    css元素设置em和transition后,为何载入无放大效果 很多开发者在设置了em和transition后,却发现元素载入页面时无放大效果。本文将解答这一问题。 原问题:在视频演示中,将元素设置如下,载入页面会有放大效果。然而,在个人尝试中,并未出现该效果。这是由于macos和windows系统…

    2025年12月24日
    200
  • 如何计算旋转后的长方形在画布上的 XY 轴距?

    旋转长方形后计算其画布xy轴距 在创建的画布上添加了一个长方形,并提供其宽、高和初始坐标。为了视觉化旋转效果,还提供了一些旋转特定角度后的图片。 问题是如何计算任意角度旋转后,这个长方形的xy轴距。这涉及到使用三角学来计算旋转后的坐标。 以下是一个 javascript 代码示例,用于计算旋转后长方…

    2025年12月24日
    000
  • 如何在 VS Code 中解决折叠代码复制问题?

    解决 VS Code 折叠代码复制问题 在 VS Code 中使用折叠功能可以帮助组织长代码,但使用复制功能时,可能会遇到只复制可见部分的问题。以下是如何解决此问题: 当代码被折叠时,可以使用以下简单操作复制整个折叠代码: 按下 Ctrl + C (Windows/Linux) 或 Cmd + C …

    2025年12月24日
    000
  • 如何相对定位使用 z-index 在小程序中将文字压在图片上?

    如何在小程序中不使用绝对定位压住上面的图片? 在小程序开发中,有时候需要将文字内容压在图片上,但是又不想使用绝对定位来实现。这种情况可以使用相对定位和 z-index 属性来解决。 问题示例: 小程序中的代码如下: 顶顶顶顶 .index{ width: 100%; height: 100vh;}.…

    2025年12月24日
    000
  • 网络进化!

    Web 应用程序从静态网站到动态网页的演变是由对更具交互性、用户友好性和功能丰富的 Web 体验的需求推动的。以下是这种范式转变的概述: 1. 静态网站(1990 年代) 定义:静态网站由用 HTML 编写的固定内容组成。每个页面都是预先构建并存储在服务器上,并且向每个用户传递相同的内容。技术:HT…

    2025年12月24日
    000
  • 为什么多年的经验让我选择全栈而不是平均栈

    在全栈和平均栈开发方面工作了 6 年多,我可以告诉您,虽然这两种方法都是流行且有效的方法,但它们满足不同的需求,并且有自己的优点和缺点。这两个堆栈都可以帮助您创建 Web 应用程序,但它们的实现方式却截然不同。如果您在两者之间难以选择,我希望我在两者之间的经验能给您一些有用的见解。 在这篇文章中,我…

    2025年12月24日
    000
  • CSS如何实现任意角度的扇形(代码示例)

    本篇文章给大家带来的内容是关于CSS如何实现任意角度的扇形(代码示例),有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。 扇形制作原理,底部一个纯色原形,里面2个相同颜色的半圆,可以是白色,内部半圆按一定角度变化,就可以产生出扇形效果 扇形绘制 .shanxing{ position:…

    2025年12月24日
    000
  • safari怎么打开html5_Safari浏览器直接输入html5链接自动渲染打开【打开】

    Safari中正确渲染HTML5内容需采用file://协议、禁用本地限制、启用HTTP服务器或更新版本并开启实验性功能。具体包括:一、用file:///绝对路径打开本地HTML文件;二、勾选高级设置中的“显示开发菜单”并禁用本地文件限制;三、用Python启动本地HTTP服务,通过http://l…

    2025年12月23日
    000
  • html中怎么运行sql语句_html中运行sql语句方法【教程】

    必须通过后端服务执行SQL操作。一、PHP与MySQL交互:使用PHP脚本在服务器端连接数据库,执行查询并嵌入HTML输出,避免硬编码凭证。二、Ajax调用API:前端通过JavaScript向后端API发送请求,服务端执行SQL并返回JSON数据,前端动态渲染结果。三、SQLite与JavaScr…

    2025年12月23日
    000
  • html标题如何_设置HTML页面标题与层级【层级】

    应区分title元素与h1–h6语义标题:title设于head中且唯一,用于浏览器标签和SEO;h1为页面唯一主标题;h2–h6须严格递进嵌套;需用开发者工具验证层级完整性;ARIA仅作布局受限时的语义补充。 如果您希望在HTML页面中正确设置页面标题并合理组织内容层级结构,则需要区分页面的标题(…

    2025年12月23日
    000
  • 如何调出html_在浏览器中调出HTML开发者工具【工具】

    可通过五种方式调出HTML开发者工具:一、快捷键(Win/Linux用Ctrl+Shift+I,macOS用Cmd+Option+I);二、右键“检查”元素;三、菜单栏“更多工具→开发者工具”;四、Chrome/Edge中输入chrome://inspect并启用实验功能;五、直接按F12键。 如果…

    2025年12月23日
    000
  • html手机怎么运行_手机运行html方法【教程】

    1、使用手机浏览器可直接打开本地HTML文件,只需通过文件管理器点击文件并选择浏览器打开即可预览;2、借助Spck Editor等专用编辑器应用能实现实时编辑与预览,适合开发调试;3、对于含JavaScript或需服务器支持的动态内容,应安装KSWEB类应用搭建本地服务器,再通过http://loc…

    2025年12月23日
    000
  • py怎么运行html文件_python运行html文件方法【教程】

    使用Python运行HTML文件的方法有三种:一是通过内置http.server模块启动本地服务器,命令为python -m http.server 8000;二是编写Python脚本自动化启动服务器,便于重复使用;三是利用webbrowser模块直接在默认浏览器中打开HTML文件,无需启动服务器。…

    2025年12月23日
    000
  • html5如何绘制爱心_HTML5绘制爱心图形与Canvas技巧【教程】

    绘制爱心有三种方法:一、用Canvas贝塞尔曲线纯代码绘制;二、用极坐标公式转笛卡尔坐标逐点描迹;三、用SVG路径配合CSS实现高效渲染与动效。 2、修改d属性中的路径数据可调整心形比例与曲率。 3、为添加class名,然后在CSS中定义hover变换效果,如缩放或颜色渐变。 4、若需响应式适配,将…

    2025年12月23日
    000
  • 如何对文本添加html_为纯文本添加HTML标签格式【标签】

    四种纯文本转HTML方法:一、手动包裹p/h2/strong/ul标签;二、正则批量替换段落、标题、加粗;三、浏览器控制台执行JS分割换行;四、sed/awk命令行处理文件。 如果您有一段纯文本内容,需要为其添加标准的 HTML 标签以实现结构化显示(例如段落、加粗、标题等),但又不希望引入复杂框架…

    2025年12月23日
    000
  • html如何连接_连接HTML与数据库或API接口【接口】

    HTML无法直接连接数据库或调用API,需借助JavaScript fetch、PHP中转、Node.js后端或Python Flask等服务端技术实现动态数据交互。 如果您希望在网页中动态获取数据,HTML本身无法直接连接数据库或调用API接口,必须借助服务器端语言或JavaScript等客户端技…

    2025年12月23日
    000

发表回复

登录后才能评论
关注微信