研究了这么久的MongoDB,我也来吐下槽。

MongoDB做为一款NOSQL数据库,在刚接触它的时候,被它的性能深深的吸引了。在一四核,4G内存的centos虚拟机上,插入了500W每条大小200byte的数据。发现它的写性能太令我震惊了。在不做索引的情况下,前一百万条,只用了二分钟就插完了,这只是我WIN7上的一台

   mongodb做为一款nosql数据库,在刚接触它的时候,被它的性能深深的吸引了。在一四核,4g内存的centos虚拟机上,插入了500w每条大小200byte的数据。发现它的写性能太令我震惊了。在不做索引的情况下,前一百万条,只用了二分钟就插完了,这只是我win7上的一台虚拟机,win7执行插入操作。在先建索引的情况下,再插入了一百万条,只是比没有索引的情况下,慢了20秒。但发现它对磁盘的占用,有点超出了我的估计!它占用的磁盘空间太大,而实际上数据大小没有这么大。磁盘占用大小差不多是数据的三倍。

  插完数据后,进行了一些读取操作。性能还是非常可观的,查询都是MS秒级的。欣喜之余,接着再插数据。坑爹的事情就发生了。32位的mongodb最大一块文件块是512M,当512M有存储空间用完时,再插数据会先划出512M的数据块。当内存被大量占用后,发现它的插入数据,变龟速了。特别是在开辟一块新的存储空间时,完全阻塞了。Mongo在内存足够的情况下,开始插入的数据能达到6000条/秒,到内存不足后,速度瞬间降到了200条/秒,如果内存进一步退化,索引比数据量大的话,香港空间,有可能完全阻塞。

  换到64位的MongoDB测试,发现他的内存充足的情况下,比32位的插入100W条速度要快到十几秒。而且64位的MongoDB,他最大的一块存储是2G的数据块。当内存不足的情况下,哥哭了~~~,绝大部分时间在阻塞。速度降到你不能忍受。关闭MongoDB,重启centos后,再接着插入,在将部分MongoDB的数据加载进内存后,又非常快了,插入速度几M/秒。好景不长,当2G的数据块用完后,再开辟一块2G的数据块时,发现MongoDB占用的内存瞬间升高,写入速度直线下降,直至阻塞。我怀疑MongoDB在开辟了那2G的空间后,同时在内存中开辟了一块2G的内存,由于当时内存不足(发现SWAP中的虚拟内存也占用过高),所以产生了阻塞情况。MongoDB可能是内存映射写入方式,所以它在内存足够的情况下,写入速度非常快。建议实际生产环境中,如果数据量大的话,给它多留点内存吧,MongoDB绝对是吃内存的老虎。

  之后重启centos,内存又降下来了,MongoDB中已经存储了500万条数据了,再进行有索引查询,发现MongoDB在数据在冷的情况下,响应很慢,多执行几次查询预热后,性能才能回升,直至像刚插入时再查询那样。500万条数据查询,返回1000行数据内的,有索引情况下,查询时间是几十MS,然后继续测试了各种复杂查询。执行下面一条语句后,哥泪牛满面了

db.jqueue.find({“$or”:[{“Name”:”janson7″},{“Age”:{“$in”:[1,2,3]}}]}).sort({“_id”:-1}).explain(){“cursor” : “BtreeCursor _Name_ reverse”,”isMultiKey” : false,”n” : 301,”nscannedObjects” : 5000000,”nscanned” : 5000000,”nscannedObjectsAllPlans” : 5000000,”nscannedAllPlans” : 5000000,”scanAndOrder” : false,”indexOnly” : false,”nYields” : 0,”nChunkSkips” : 0,”millis” : 50989,”indexBounds” : {“_id” : [[{“$maxElement” : 1},{“$minElement” : 1}]]},”server” : “localhost:27017”}

  发现他全表遍历了一次,反复测试后,都是这样的情况,一去掉sort,后,就是直接读索引,或者把OR操作去掉,也是读索引。我认为,排序应该是在查询到的数据中进行排序的,也就是先去索引中找到了相应的项,再把项根据我的要求排序啊,不可能出现遍历表的情况。

  然后经过了坚辛的百度和Google,终于找到了答案,原来这是MongoDB的一个Bug,从他一设计出来后,这个Bug就一直没解决过。

  园子里这位兄台的文章里写了

  它自已的官方上的反馈:https://jira.mongodb.org/browse/SERVER-1205 发现这个问题,从10年就有人提出了,直到现在,2.2.2版本了,都还没有解决。如果有要进行$or查询,再sort排序业务的兄弟,请三思,我们开始想用MongoDB,就是因为我们业务里面这个查询是一个非常频繁且关键的查询。

  在倍受打击后,改变设计方法,改变业务模式,虚拟主机,我不再进行$or查询了,我直接用Capped Collection来做一个临时映射,通过Capped表中数据进行排序,分页偏移,再用ID去主表查询。

吐槽大师 吐槽大师

吐槽大师(Roast Master) – 终极 AI 吐槽生成器,适用于 Instagram,Facebook,Twitter,Threads 和 Linkedin

吐槽大师 26 查看详情 吐槽大师

  在使用Capped Collection时,又发现了坑爹的事。2.2之前的版本,Capped Collection是默认没有索引的,2.2后就默认加了_id,并做索引了.我用的是C#驱动,然后按照驱动说明方法,

var collectionOptions = CollectionOptions.SetCapped(true).SetMaxDocuments(1000).SetMaxSize(1000000).SetAutoIndexId(false);

  建了一个Capped表,去MongoDB里面看,发现,他还是建了索引。头大了,又开始找资料,发现了官方提供的驱动版本是1.7版本以前的,网站空间,也就是说,这个版本有可能不会支持2.2的新功能,在2.2以前,Capped默认是不建索引的,2.2是默认建索引了。查找官方驱动源码,下载地址:https://github.com/mongodb/mongo-csharp-driver

 

Sets whether the collection is capped.CollectionOptionsBuilder SetCapped(bool value){if (value){_document[] = value;}else{_document.Remove();}return this;}

发现他的源码是这样写的,因为早期版本默认情况下是不建索引的,所以,如果 SetCapped传入的参数是false的话,他就直接执行了_document.Remove(“capped”);这一句,直接把这个参数选项从CollectionOptions项中删除了,没有带这个参数传入至数据库,而默认情况下,它是要建索引的,也就是说,在这个驱动版本,你是怎么样做Capped都会给你建索引,最后没办法,只好改了他的源码

 

Sets whether the collection is capped.CollectionOptionsBuilder SetCapped(bool value){_document.Remove();}

让它不管输入什么参数,这项都得输入,然后再执行时 ,发现MongoDB里面的Capped就没有建索引了。

  

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/472828.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月8日 08:15:24
下一篇 2025年11月8日 08:16:32

相关推荐

  • 什么是PHP的依赖注入?通过容器实现松耦合代码设计

    依赖注入通过外部注入依赖实现松耦合,使代码更易测试和维护,依赖注入容器如Symfony、Laravel、PHP-DI和Pimple可集中管理依赖,提升开发效率与系统灵活性。 依赖注入,简单来说,就是将一个对象所依赖的其他对象,从外部提供给它,而不是让它自己去创建或查找。这就像给汽车加燃料,你不需要车…

    2025年12月11日
    000
  • PHP如何实现文件读写?使用fopen和fwrite操作文件

    PHP文件读写核心是fopen()配合fread()/fwrite()和fclose(),选择正确模式如’r’读、’w’写(清空)、’a’追加,避免数据丢失;需检查fopen()返回值确保文件打开成功,使用flock()处理并发…

    2025年12月11日
    000
  • MongoDB PHP驱动:理解连接行为与认证失败的根源

    本文深入探讨了MongoDB PHP驱动中连接行为的细节,解释了为何在调用find()方法返回Traversable对象后,仍可能遭遇“Authentication failed”错误。核心在于MongoDBClient构造函数不立即建立连接,认证过程在首次数据操作时才触发。文章提供了解决方案,强调…

    2025年12月11日
    000
  • 如何使用PHP正确检查MongoDB Atlas数据库中是否存在数据

    本文旨在指导开发者如何使用PHP连接MongoDB Atlas数据库,并正确地检查特定数据是否存在。常见的错误在于混淆了查询条件和查询结果,导致验证逻辑失效。本文将提供正确的代码示例,并详细解释如何通过MongoDB的PHP驱动程序执行查询并验证结果,确保注册表单等功能能够准确地判断数据是否存在。 …

    2025年12月11日
    000
  • 在PHP中正确检查MongoDB Atlas数据库中数据是否存在的方法

    本教程深入探讨在使用PHP MongoDB驱动程序时,如何准确判断MongoDB Atlas数据库中是否存在特定数据。我们将纠正常见的错误,即混淆查询定义与查询结果,并提供基于游标处理的正确验证方法,确保数据存在性检查的逻辑严谨有效,避免因误解查询返回值而导致的逻辑错误。 理解MongoDB PHP…

    2025年12月11日
    000
  • PHP连接MongoDB Atlas:正确检查数据是否存在及常见误区

    本教程详细阐述了在PHP中连接MongoDB Atlas数据库时,如何正确检查数据是否存在。针对常见的将查询条件变量误判为查询结果的错误,文章提供了正确的查询执行与结果验证方法,并通过代码示例指导读者有效判断文档是否存在,避免注册等场景中的数据重复问题。 1. 理解MongoDB PHP驱动的查询结…

    2025年12月11日
    000
  • Symfony 怎么将监控指标转数组

    解析prometheus文本格式的核心是逐行读取并用正则提取指标名称、标签和值,将标签字符串转换为键值对数组,最终构建成包含name、labels、value的结构化数组;2. 高效提取的关键在于准确解析指标行,跳过#开头的注释行,正确处理histogram和summary的特殊后缀(如_bucke…

    2025年12月11日
    000
  • Symfony 如何将任务队列转为数组

    将 symfony 消息对象转换为数组的核心方法包括在消息类中实现 toarray() 方法,适用于结构简单、字段明确的场景,可手动映射属性并格式化数据如日期;2. 使用 symfony serializer 组件进行自动序列化,支持通过序列化组(@groups)精细控制输出字段,适用于复杂或嵌套对…

    2025年12月11日
    000
  • PHP命令怎样通过–ini参数查看配置文件路径 PHP命令查找配置文件的方法

    最直接的方法是使用php –ini命令,1. 在终端执行php –ini可查看当前php加载的主配置文件路径及额外解析的.ini文件;2. 输出中的loaded configuration file即为正在使用的php.ini路径;3. additional .ini fil…

    2025年12月11日
    000
  • Symfony 如何把NoSQL查询结果转数组

    将nosql查询结果转换为数组最推荐的方法是使用symfony serializer组件;2. 可通过手动遍历对象并提取属性值构建数组,适用于简单场景;3. 更优方案是利用serializer的normalize方法,结合@groups注解精确控制序列化字段;4. 需安装symfony/serial…

    2025年12月11日
    000
  • Symfony 怎样将MongoDB文档转数组

    在 symfony 中将 mongodb 文档转换为数组最直接的方式是使用 doctrine odm 提供的 toarray() 方法,适用于简单文档结构;2. 常见应用场景包括构建 restful api 响应、数据导出、日志调试、表单预填充和缓存处理;3. toarray() 方法的主要局限性在…

    2025年12月11日
    000
  • PHP怎样制作付费简历解析?人才库变现方案

    制作付费简历解析系统的核心在于整合第三方解析服务或自研模块,并结合支付与用户管理体系实现变现。1. 优先推荐整合第三方简历解析api,通过php调用接口获取结构化数据,实现高效准确的解析;2. 自研解析模块需处理多种文件格式、应用ocr及nlp技术提取信息,但开发难度高,适合有资源和技术积累的团队;…

    2025年12月11日
    000
  • PHP实时聊天系统开发 使用Workerman构建高性能PHP聊天服务器

    php实时聊天系统的核心技术选型包括workerman和swoole,其中workerman凭借异步非阻塞特性适合高并发消息推送;1. 使用workerman需准备php环境并安装pcntl、posix扩展及composer;2. 通过composer require workerman/worke…

    2025年12月11日
    000
  • 如何用PHP开发简单的爬虫 PHP网页抓取与解析技术

    使用php开发爬虫需先通过curl或file_get_contents发起http请求获取html;2. 然后利用domdocument、xpath或正则表达式解析html提取数据;3. 将数据存储至数据库或文件;4. 通过设置user-agent、使用代理ip、控制请求频率(如sleep函数)等方…

    2025年12月11日
    000
  • 如何为PHP环境配置MongoDB支持 PHP连接Mongo数据库的设置

    要配置php环境以支持mongodb,核心步骤是安装并启用mongodb的php驱动,使php应用能够与mongodb数据库通信。1. 安装mongodb php驱动,推荐使用pecl安装,若无pecl则需先安装php开发包及相关编译工具;2. 编辑php.ini文件,添加extension=mon…

    2025年12月11日 好文分享
    000
  • PHP实现内容审核系统变现 PHP自动化审核技术应用

    php内容审核系统变现的核心是将风险管理能力产品化,通过api服务按调用量收费、saas订阅模式提供平台、定制化解决方案提升利润率;2. 技术突破点在于集成第三方ai服务实现分级过滤与按需调用,构建可配置规则引擎提升灵活性,并通过人工复审反馈优化模型准确率;3. 系统架构需采用异步消息队列处理任务、…

    2025年12月11日 好文分享
    000
  • 怎样用PHP操作MongoDB?NoSQL数据库使用指南

    使用 php 操作 mongodb 需掌握安装扩展、连接数据库及执行增删改查等核心操作。1. 安装 mongodb 扩展可通过 pecl 或 composer 实现;2. 使用 mongodbclient 类连接数据库并选择集合;3. 插入数据支持单条 insertone 和批量 insertman…

    2025年12月11日 好文分享
    000
  • PHP数据库备份与恢复 PHP操作MySQL数据维护

    php操作mysql数据维护的核心在于保证数据的安全性和可用性,主要通过备份与恢复、日常优化和维护操作来实现。1.使用mysqldump命令行工具或mysqli/pdo扩展进行数据库备份;2.通过执行sql文件恢复数据库,建议在服务器端通过ssh运行脚本;3.php可执行清理过期数据、优化表结构、检…

    2025年12月11日 好文分享
    000
  • PHP怎样解析FlatBuffer数据 FlatBuffer解析方法高效处理二进制

    php解析flatbuffer数据的核心步骤包括获取schema、生成代码、读取和解析二进制数据。首先,需获取.fbs定义文件;其次,使用第三方工具或手动编写代码生成php解析逻辑;接着,通过file_get_contents()等函数读取二进制数据;最后按schema解析并使用数据。由于php缺乏…

    2025年12月11日 好文分享
    000
  • 用户登录系统如何开发?Session认证机制详细教程

    session 是用户登录系统开发中最常见的认证方式,适合中小型 web 应用。1. session 是服务器端记录用户状态的机制,通过生成唯一 session id 并存储在客户端 cookie 中实现用户识别;2. 实现流程包括用户提交信息、后端验证并创建 session、返回 session …

    2025年12月11日 好文分享
    000

发表回复

登录后才能评论
关注微信