Mysql limit 优化,百万至千万级快速分页 复合索引的引用并应用

MySql 性能到底能有多高?用了php半年多,真正如此深入的去思考这个问题还是从前天开始。有过痛苦有过绝望,到现在充满信心!

MySql 这个数据库绝对是适合dba级的高手去玩的,一般做一点1万篇新闻的小型系统怎么写都可以,用xx框架可以实现快速开发。可是数据量到了10万,百万至千万,他的性能还能那么高吗?一点小小的失误,可能造成整个系统的改写,甚至更本系统无法正常运行!好了,不那么多废话了。用事实说话,看例子:

数据表 collect ( id, title ,info ,vtype) 就这4个字段,其中 title 用定长,info 用text, id
是逐渐,vtype是tinyint,vtype是索引。这是一个基本的新闻系统的简单模型。现在往里面填充数据,填充10万篇新闻。

最后collect 为 10万条记录,数据库表占用硬盘1.6G。OK ,看下面这条sql语句:

select id,title from collect limit 1000,10; 很快;基本上0.01秒就OK,再看下面的

select id,title from collect limit 90000,10; 从9万条开始分页,结果?

8-9秒完成,my god 哪出问题了????其实要优化这条数据,网上找得到答案。看下面一条语句:

select id from collect order by id limit 90000,10; 很快,0.04秒就OK。
为什么?因为用了id主键做索引当然快。网上的改法是:

select id,title from collect where id>=(select id from collect order by id
limit 90000,1) limit 10;

这就是用了id做索引的结果。可是问题复杂那么一点点,就完了。看下面的语句

select id from collect where vtype=1 order by id limit 90000,10;
很慢,用了8-9秒!

到了这里我相信很多人会和我一样,有崩溃感觉!vtype 做了索引了啊?怎么会慢呢?vtype做了索引是不错,你直接 select id from
collect where vtype=1 limit 1000,10;
是很快的,基本上0.05秒,可是提高90倍,从9万开始,那就是0.05*90=4.5秒的速度了。和测试结果8-9秒到了一个数量级。从这里开始有人提出了分表的思路,这个和discuz
论坛是一样的思路。思路如下:

建一个索引表: t (id,title,vtype) 并设置成定长,然后做分页,分页出结果再到 collect 里面去找info 。
是否可行呢?实验下就知道了。

10万条记录到 t(id,title,vtype) 里,数据表大小20M左右。用

select id from t where vtype=1 order by id limit 90000,10;
很快了。基本上0.1-0.2秒可以跑完。为什么会这样呢?我猜想是因为collect 数据太多,所以分页要跑很长的路。limit
完全和数据表的大小有关的。其实这样做还是全表扫描,只是因为数据量小,只有10万才快。OK, 来个疯狂的实验,加到100万条,测试性能。

加了10倍的数据,马上t表就到了200多M,而且是定长。还是刚才的查询语句,时间是0.1-0.2秒完成!分表性能没问题?错!因为我们的limit还是9万,所以快。给个大的,90万开始

select id from t where vtype=1 order by id limit 900000,10; 看看结果,时间是1-2秒!

why ?? 分表了时间还是这么长,非常之郁闷!有人说定长会提高limit的性能,开始我也以为,因为一条记录的长度是固定的,mysql
应该可以算出90万的位置才对啊? 可是我们高估了mysql 的智能,他不是商务数据库,事实证明定长和非定长对limit影响不大? 怪不得有人说
discuz到了100万条记录就会很慢,我相信这是真的,这个和数据库设计有关!

难道MySQL 无法突破100万的限制吗???到了100万的分页就真的到了极限???

答案是: NO !!!!
为什么突破不了100万是因为不会设计mysql造成的。下面介绍非分表法,来个疯狂的测试!一张表搞定100万记录,并且10G
数据库,如何快速分页!

好了,我们的测试又回到 collect表,开始测试结论是:
30万数据,用分表法可行,超过30万他的速度会慢道你无法忍受!当然如果用分表+我这种方法,那是绝对完美的。但是用了我这种方法后,不用分表也可以完美解决!

答案就是:复合索引! 有一次设计mysql索引的时候,无意中发现索引名字可以任取,可以选择几个字段进来,这有什么用呢?开始的select id from
collect order by id limit 90000,10; 这么快就是因为走了索引,可是如果加了where 就不走索引了。抱着试试看的想法加了
search(vtype,id) 这样的索引。然后测试
select id from collect where vtype=1 limit 90000,10; 非常快!0.04秒完成!

AppMall应用商店 AppMall应用商店

AI应用商店,提供即时交付、按需付费的人工智能应用服务

AppMall应用商店 56 查看详情 AppMall应用商店

再测试: select id ,title from collect where vtype=1 limit 90000,10;
非常遗憾,8-9秒,没走search索引!

再测试:search(id,vtype),还是select id 这个语句,也非常遗憾,0.5秒。
综上:如果对于有where 条件,又想走索引用limit的,必须设计一个索引,将where
放第一位,limit用到的主键放第2位,而且只能select 主键!

完美解决了分页问题了。可以快速返回id就有希望优化limit , 按这样的逻辑,百万级的limit 应该在0.0x秒就可以分完。看来mysql
语句的优化和索引时非常重要的!
好了,回到原题,如何将上面的研究成功快速应用于开发呢?如果用复合查询,我的轻量级框架就没的用了。分页字符串还得自己写,那多麻烦?这里再看一个例子,思路就出来了:
select * from collect where id in (9000,12,50,7000); 竟然 0秒就可以查完!
mygod ,mysql 的索引竟然对于in语句同样有效!看来网上说in无法用索引是错误的!
有了这个结论,就可以很简单的应用于轻量级框架了:
代码如下:
代码如下:
$db=dblink();
$db->pagesize=20;
$sql=”select id from collect where vtype=$vtype”;
$db->execute($sql);
$strpage=$db->strpage();
//将分页字符串保存在临时变量,方便输出
while($rs=$db->fetch_array()){
$strid.=$rs[‘id’].’,’;
}
$strid=substr($strid,0,strlen($strid)-1);
//构造出id字符串
$db->pagesize=0;
//很关键,在不注销类的情况下,将分页清空,这样只需要用一次数据库连接,不需要再开;
$db->execute(“select
id,title,url,sTime,gTime,vtype,tag from collect where id in ($strid)”);
fetch_array()): ?>

“>target=”_blank”>
<?php echo
$rs[‘tag’];?>

<?php endwhile;
?>

<?php
echo $strpage;
?>

通过简单的变换,其实思路很简单:1)通过优化索引,找出id,并拼成 “123,90000,12000” 这样的字符串。2)第2次查询找出结果。
小小的索引+一点点的改动就使mysql 可以支持百万甚至千万级的高效分页!
通过这里的例子,我反思了一点:对于大型系统,PHP千万不能用框架,尤其是那种连sql语句都看不到的框架!因为开始对于我的轻量级框架都差点崩溃!只适合小型应用的快速开发,对于ERP,OA,大型网站,数据层包括逻辑层的东西都不能用框架。如果程序员失去了对sql语句的把控,那项目的风险将会成几何级数增加!尤其是用mysql
的时候,mysql 一定需要专业的dba 才可以发挥他的最佳性能。一个索引所造成的性能差别可能是上千倍!
PS:
经过实际测试,到了100万的数据,160万数据,15G表,190M索引,就算走索引,limit都得0.49秒。所以分页最好别让别人看到10万条以后的数据,要不然会很慢!就算用索引。经过这样的优化,mysql到了百万级分页是个极限!但有这样的成绩已经很不错,如果你是用sqlserver肯定卡死!而160万的数据用
id in (str) 很快,基本还是0秒。如果这样,千万级的数据,mysql应该也很容易应付。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/443283.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月7日 19:25:34
下一篇 2025年11月7日 19:37:18

相关推荐

  • 网络进化!

    Web 应用程序从静态网站到动态网页的演变是由对更具交互性、用户友好性和功能丰富的 Web 体验的需求推动的。以下是这种范式转变的概述: 1. 静态网站(1990 年代) 定义:静态网站由用 HTML 编写的固定内容组成。每个页面都是预先构建并存储在服务器上,并且向每个用户传递相同的内容。技术:HT…

    2025年12月24日
    000
  • 为什么多年的经验让我选择全栈而不是平均栈

    在全栈和平均栈开发方面工作了 6 年多,我可以告诉您,虽然这两种方法都是流行且有效的方法,但它们满足不同的需求,并且有自己的优点和缺点。这两个堆栈都可以帮助您创建 Web 应用程序,但它们的实现方式却截然不同。如果您在两者之间难以选择,我希望我在两者之间的经验能给您一些有用的见解。 在这篇文章中,我…

    2025年12月24日
    000
  • 优化CSS解析过程中的回流和重绘技巧

    CSS回流和重绘解析及优化技巧 近年来,网页性能优化成为了前端开发中的重要环节,其中包括对CSS回流和重绘的解析及优化。在优化CSS的过程中,我们需要了解回流和重绘的定义,并学习一些具体的优化技巧。 什么是回流和重绘? 回流(reflow)和重绘(repaint)是浏览器渲染引擎对网页进行布局和绘制…

    2025年12月24日
    000
  • 优化网页加载速度的技巧:理解回流和重绘的差异与优化方法

    回流与重绘的差异与优化:优化网页加载速度的技巧 在如今互联网高速发展的时代,网页加载速度成了用户体验的重要指标之一。加载速度慢不仅会让用户感到不耐烦,还会导致用户流失,影响网站的转化率。而要提高网页的加载速度,我们就需要了解和优化回流与重绘。 回流(reflow)和重绘(repaint)是浏览器渲染…

    2025年12月24日
    300
  • 提高页面渲染速度:优化回流和重绘的关键方法

    提高页面渲染速度:优化回流和重绘的关键方法,需要具体代码示例 随着网页应用的发展,用户对页面加载速度的要求也越来越高。而页面的渲染速度受到回流和重绘的影响,因此我们需要优化这两个过程来提高页面的渲染速度。本文将介绍一些关键的方法,并提供具体的代码示例。 使用transform替代top/left当改…

    2025年12月24日
    000
  • 通过使用Web标准,提升网页性能与用户体验的方法

    随着互联网的快速发展,越来越多的企业和个人都开始关注网页的性能和用户体验。一方面,良好的网页性能可以提高网站的可访问性和搜索引擎排名,另一方面,优秀的用户体验可以增加用户的黏性和转化率。而借助Web标准来优化网页性能与用户体验,则成为现如今的一种主流方法。 那么,如何利用Web标准来优化网页性能与用…

    2025年12月24日
    000
  • 比较重排、重绘和回流的优化策略以提高网页性能

    优化网页性能:探讨重排、重绘和回流的优劣比较,需要具体代码示例 随着互联网的发展,网页性能优化已成为每个前端开发人员需要面对的一个重要问题。在优化网页性能的过程中,我们需要了解并针对不同的操作进行优化。其中,重排、重绘和回流是导致网页性能下降的常见问题,本文将探讨它们的优劣,并给出一些具体的代码示例…

    2025年12月24日
    000
  • 使用关系型选择器优化CSS选择器:提升选择效率的技巧

    优化CSS选择器:如何使用关系型选择器提高选择效率 引言:在前端开发中,CSS选择器是一个非常重要的概念。它用来为HTML元素添加样式,控制页面的外观和布局。然而,在大型项目中,优化CSS选择器的效率显得尤为重要。本文将介绍如何使用关系型选择器来提高选择效率,并附上具体的代码示例。 一、什么是关系型…

    2025年12月24日
    000
  • 优化网页排版的CSS属性使用指南

    优化网页排版的CSS属性使用指南 在现代网页设计中,好的排版是不可或缺的一部分。正确使用CSS属性可以有效地改善网页排版的质量和用户体验。本文将为您介绍一些常用的CSS属性以及示例代码,帮助您优化网页排版。 一、字体属性 font-size:控制字体的大小,可以使用像素、百分比或者em作为单位。例如…

    2025年12月24日
    000
  • CSS 清除样式属性优化技巧:reset 和 normalize

    CSS 清除样式属性优化技巧:reset 和 normalize 在开发网页时,经常会遇到浏览器默认样式的干扰,导致网页显示效果不一致。为了解决这个问题,我们可以使用 CSS 清除样式属性的优化技巧。本文将介绍两种常用的方式:reset 和 normalize,并提供具体的代码示例。 一、Reset…

    2025年12月24日
    000
  • 优化用户界面体验的秘密武器:CSS开发项目经验大揭秘

    在当今数字化的时代,网站和应用程序的用户界面体验对于吸引和留住用户至关重要。而在开发用户界面时,CSS是一种不可或缺的技术。CSS(层叠样式表)是一种用来描述网页样式的语言,通过CSS,我们可以控制网页的布局、字体、颜色、动画等方方面面。然而,要想真正实现一个优秀的用户界面体验,只掌握基本的CSS语…

    2025年12月24日
    000
  • CSS 响应式图像属性优化技巧:max-width 和 object-fit

    CSS 响应式图像属性优化技巧:max-width 和 object-fit 在设计响应式网页时,优化图像是至关重要的一环。图像的处理不仅影响页面的加载速度,还会影响用户体验。在传统的网页开发中,经常会使用 max-width 属性来实现图像的响应式调整,但这往往会导致图像变形或者失真。而近年来引入…

    2025年12月24日
    000
  • CSS 径向渐变属性优化技巧:radial-gradient 和 background-position

    CSS 径向渐变属性优化技巧:radial-gradient 和 background-position 引言:CSS 径向渐变(radial-gradient)是一种用于创建圆形渐变效果的属性,常用于设计网页的背景、按钮样式等。在使用径向渐变时,结合合理的 background-position …

    2025年12月24日
    000
  • CSS 动画属性优化技巧:animation 和 transition

    CSS 动画属性优化技巧:animation 和 transition 引言:随着 Web 技术的不断发展,CSS 动画成为了网页设计和开发中非常重要的一部分。在过去,开发者通常使用 JavaScript 来实现动画效果,但现在通过 CSS 动画属性,我们可以更加轻松和高效地创建各种动画效果。本文将…

    2025年12月24日
    000
  • CSS 形状属性优化技巧:border-radius 和 clip-path

    CSS 形状属性优化技巧:border-radius 和 clip-path 在CSS中,我们经常使用一些属性来调整元素的形状,以使其更加吸引人和视觉上的吸引力。其中两个常用的属性是border-radius和clip-path。本文将详细介绍这两个属性,并提供一些优化技巧,以及具体的代码示例。 一…

    2025年12月24日
    000
  • CSS 布局属性优化技巧:position sticky 和 flexbox

    CSS 布局属性优化技巧:position sticky 和 flexbox 在网页开发中,布局是一个非常重要的方面。良好的布局结构可以提高用户体验,使页面更加美观和易于导航。而CSS布局属性则是实现这一目标的关键。在本文中,我将介绍两种常用的CSS布局属性优化技巧:position sticky和…

    2025年12月24日
    000
  • CSS 清除浮动属性优化技巧:clear 和 overflow

    CSS 清除浮动属性优化技巧:clear 和 overflow 在前端开发中,常常会遇到浮动元素造成布局混乱的情况。浮动元素可以实现元素在页面中左浮、右浮或居中浮动的效果,但它也可能导致父元素高度塌陷、布局错乱等问题。为了解决这些问题,我们需要使用一些技巧来清除浮动属性。本文将介绍两种常用的清除浮动…

    2025年12月24日
    100
  • 如何使用Css Flex 弹性布局优化移动端网页加载速度

    如何使用CSS Flex弹性布局优化移动端网页加载速度 随着移动设备的普及和互联网的快速发展,移动端网页加载速度成为了开发人员需要重视的问题之一。网页加载速度的快慢直接影响用户体验和网站的流量。在移动端网页的布局方面,CSS Flex弹性布局是一个值得开发人员注意的技术,它可以帮助我们更好地优化移动…

    2025年12月24日
    000
  • 如何优化CSS Positions布局以提升搜索引擎友好性

    如何优化CSS Positions布局以提升搜索引擎友好性 在网站开发过程中,搜索引擎优化(SEO)是至关重要的一环。除了关键词的优化和网站内容的质量之外,布局的优化也是提升搜索引擎友好性的重要因素之一。而CSS的布局选择则对网站的搜索引擎友好性有着直接的影响。本文将介绍如何优化CSS Positi…

    2025年12月24日
    000
  • 运用CSS3样式优化网页加载速度的实用方法

    运用CSS3样式优化网页加载速度的实用方法 随着互联网的快速发展,网页加载速度成为用户体验的重要指标之一。在许多情况下,用户会因为网页加载缓慢而选择离开。为了解决这个问题,前端开发人员可以通过优化CSS3样式来提高网页的加载速度。本文将介绍一些实用的方法,帮助开发人员在保持设计美观的同时,改善网页的…

    2025年12月24日
    000

发表回复

登录后才能评论
关注微信