MongoDB 聚合

mongodb除了基本的查询功能,还提供了很多强大的聚合工具,其中简单的可计算集合中的文档个数, 复杂的可利用MapReduce做复杂数据分析. 1.count count返回集合中的文档数量 db.refactor.count() 不管集合有多大,都能很快的返回文档数量. 可以传递查询,MongoDB会

mongodb除了基本的查询功能,还提供了很多强大的聚合工具,其中简单的可计算集合中的文档个数,

复杂的可利用MapReduce做复杂数据分析.

 

1.count

count返回集合中的文档数量

db.refactor.count()

不管集合有多大,都能很快的返回文档数量.

可以传递查询,MongoDB会计算查询结果的数量

db.refactor.count({“username”:”refactor”})

但是增加查询条件会使count变慢.

 

2.distinct

distinct用来找出给定键的所有不同值.使用时必须指定集合和键.

如:

db.runCommand({“distinct”:”refactor”,”key”:”username”})

MongoDB 聚合

 

 3.group

group先选定分组所依据的键,MongoDB将会将集合依据选定键值的不同分成若干组.然后可以通过聚合每一组内的文档,

产生一个结果文档.

如:

db.runCommand(
{
  ”group”:
  {
    ”ns”:”refactor”,
    ”key”:{“username”:true},
    ”initial”:{“count”:0},
    ”$reduce”:function(doc,prev)
    {
      prev.count++;
    },
    ”condition”:{“age”:{“$gt”:40}}
  }
}
)

   “ns”:”refactor”,

指定要进行分组的集合
    “key”:{“username”:true},

指定文档分组的依据,这里是username键,所有username键的值相等的被划分到一组,true为返回键username的值
    “initial”:{“count”:0},

每一组reduce函数调用的初始个数.每一组的所有成员都会使用这个累加器.
    “$reduce”:function(doc,prev){…}

每个文档都对应的调用一次.系统会传递两个参数:当前文档和累加器文档.

“condition”:{“age”:{“$gt”:40}}

这个age的值大于40的条件

 

4.使用完成器

完成器用于精简从数据库传到用户的数据.group命令的输出一定要能放在单个数据库相应中.

“finalize”附带一个函数,在数组结果传递到客户端之前被调用一次.

db.runCommand(
  {
    ”group”:
    {
      ”ns”:”refactor”,
      ”key”:{“username”:true},
      ”initial”:{“count”:0},
      ”$reduce”:function(doc,prev)
      {
        prev.count++;
      },
      ”finalize”:function(doc)
      {
        doc.num=doc.count;
        delete doc.count;
      }
    }
  }
)

finalize能修改传递的参数也能返回新值.

 

5.将数组作为键使用

有些时候分组所依据的条件很复杂,不仅是一个键.比如要使用group计算每个类别有多篇博客文章.由于有很多作者,

给文章分类时可能不规律的使用了大小写.所以,如果要是按类别名来分组,最后”MongoDB”和”mongodb”就是不同的组.

为了消除这种大小写的影响,就要定义一个函数来确定文档所依据的键.

定义分组要用到$keyf

聚好用AI 聚好用AI

可免费AI绘图、AI音乐、AI视频创作,聚集全球顶级AI,一站式创意平台

聚好用AI 115 查看详情 聚好用AI

db.runCommand(
 {
  “group”:
   {
    “ns”:”refactor”,
    “$keyf”:function(doc){return {“username”:doc.username.toLowerCase()}},
    “initial”:{“count”:0},
    “$reduce”:function(doc,prev)
       {
        prev.count++;
       }
   }
 }
)

 

6.MapReduce

count,distinct,group能做的事情MapReduce都能做.它是一个可以轻松并行化到多个服务器的聚合方法.它会

拆分问题,再将各个部分发送到不同机器上,让每台机器完成一部分.当所有机器都完成时候,再把结果汇集起来形成

最终完整的结果.

MapReduce需要几个步骤:

1.映射,将操作映射到集合中的每个文档.这个操作要么什么都不做,要么 产生一个键和n个值.

2.洗牌,按照键分组,并将产生的键值组成列表放到对应键中.

3.化简,把列表中的值 化简 成一个单值,这个值被返回.

4.重新洗牌,直到每个键的列表只有一个值为止,这个值就是最终结果.

MapReduce的速度比group慢,group也很慢.在应用程序中,最好不要用MapReduce,可以在后台运行MapReduce

创建一个保存结果的集合,可以对这个集合进行实时查询.

 

找出集合中的所有键

MongoDB没有模式,所以并不知晓每个文档有多少个键.通常找到集合的所有键的做好方式是用MapReduce.

在映射阶段,想得到文档中的每个键.map函数使用emit 返回要处理的值.emit会给MapReduce一个键和一个值.

这里用emit将文档某个键的记数(count)返回({count:1}).我们为每个键单独记数,所以为文档中的每一个键调用一次emit,

this是当前文档的引用:

map=function(){
  for(var key in this)
  {
    emit(key,{count:1})
  }
};

这样返回了许许多多的{count:1}文档,每一个都与集合中的一个键相关.这种有一个或多个{count:1}文档组成的数组,

会传递给reduce函数.reduce函数有两个参数,一个是key,也就是emit返回的第一个值,另一个参数是数组,由一个或者多个

对应键的{count:1}文档组成.

reduce=function(key,emits){
  total=0;
  for(var i in emits){
    total+=emits[i].count;
  }
  return {count:total};
}

reduce要能被反复被调用,不论是映射环节还是前一个化简环节.reduce返回的文档必须能作为reduce的

第二个参数的一个元素.如x键映射到了3个文档{“count”:1,id:1},{“count”:1,id:2},{“count”:1,id:3}

其中id键用于区别.MongoDB可能这样调用reduce:

>r1=reduce(“x”,[{“count”:1,id:1},{“count”:1,id:2}])

{count:2}

>r2=reduce(“x”,[{“count”:1,id:3}])

{count:1}

>reduce(“x”,[r1,r2])

{count:3}

reduce应该能处理emit文档和其他reduce结果的各种集合.

如:

mr=db.runCommand(
  {
  ”mapreduce”:”refactor”,
  ”map”:map,
  ”reduce”:reduce,
  ”out”:{inline:1}
  }
)

或:

db.refactor.mapReduce(map,reduce,{out:{inline:1}})

MongoDB 聚合

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/513545.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月9日 02:02:46
下一篇 2025年11月9日 02:09:07

相关推荐

  • Synthetix Network (SNX) 价格预测 2025:未来价格走势如何?

    Synthetix Network (SNX) 价格预测 2025:未来价格走势如何? 随着比特币逼近 11 万美元大关及 Web3 生态的技术突破,去中心化金融(DeFi)赛道正重回市场焦点。作为合成资产协议龙头,Synthetix Network(SNX)凭借其独特的衍生品交易模型,成为投资者关…

    2025年12月8日
    000
  • VS Code开发工坊:前端全栈开发环境搭建实战

    答案:通过安装ESLint、Prettier、Live Server、REST Client等核心插件,配置Node.js+Express后端环境并解决CORS实现前后端联调,利用launch.json设置断点调试,可构建高效VS Code全栈开发 workflow。 想用 VS Code 打通前端…

    2025年12月6日 开发工具
    000
  • 使用Express和EJS在独立卡片中展示多数据库内容

    本文详细介绍了如何利用Express框架、EJS模板引擎和Mongoose,从多个MongoDB数据库(或集合)中获取数据,并通过建立数据关联,在前端页面中以独立的HTML卡片形式动态展示图文结合的内容。重点在于后端的数据建模、关联查询以及前端EJS模板中循环渲染的正确实践。 理解需求:多源数据与独…

    2025年12月6日 web前端
    000
  • 如何在Laravel中配置会话管理

    在%ignore_a_1%中配置会话管理,1. 修改config/session.php文件;2. 根据需求调整.env环境变量;3. 选择合适的会话驱动如file、database、redis;4. 设置生命周期和安全性选项。核心在于通过config/session.php定义会话行为,包括驱动、…

    2025年12月5日
    000
  • ThinkPHP的依赖注入是什么?ThinkPHP如何实现IoC容器?

    thinkphp中依赖注入的核心是ioc容器,它通过构造函数注入等方式自动解析和管理类的依赖关系;2. 使用di能显著提升代码解耦、可测试性和可维护性,例如替换userrepository实现无需修改userservice;3. 容器通过绑定(如接口到实现、闭包绑定)和自动解析(利用反射递归注入依赖…

    2025年12月5日 PHP框架
    000
  • YII框架的MongoDB支持是什么?YII框架如何操作MongoDB?

    yii框架通过activerecord和dao两种方式支持mongodb操作,配置连接后可像操作关系型数据库一样进行增删改查;2. activerecord提供面向对象的封装,dao则允许更灵活的原生操作;3. 两者在api设计上保持一致,但mongodb无模式、使用objectid主键、支持嵌套数…

    2025年12月4日
    000
  • js如何检测温湿度传感器 物联网设备数据监测方案

    javascript无法直接读取温湿度传感器数据,必须通过中间层实现。1.硬件层:选择dht或sht系列传感器与esp32等微控制器连接。2.固件层:使用arduino ide或micropython编写代码读取传感器数据并通过wi-fi发送至服务器。3.后端层:构建node.js或python服务…

    2025年12月4日 web前端
    000
  • MySQL如何结合Node.js构建REST API MySQL+Node.js实现高效API开发的步骤

    使用node.js和mysql构建rest api的步骤包括:项目初始化与依赖安装,创建数据库连接配置文件并使用连接池,搭建express应用骨架,定义路由与控制器分离业务逻辑,最后通过启动脚本运行服务;2. 选择该组合的原因是node.js的非阻塞i/o模型适合高并发api处理,全栈javascr…

    2025年12月3日
    000
  • Java中如何实现审计日志 详解AOP记录

    java中实现审计日志的核心是记录操作者、时间、类型及内容,主要通过aop实现。1. 定义切面类并使用@aspect注解;2. 使用@pointcut定义拦截方法的切点;3. 采用@afterreturning或@afterthrowing定义通知以记录成功或失败日志;4. 在通知中通过joinpo…

    2025年12月3日 java
    100
  • Swoole如何实现集群部署?集群如何管理?

    Swoole集群部署需依赖外部组件实现,核心方案包括:1. 使用Nginx或HAProxy进行负载均衡;2. 通过Consul、Etcd等实现服务发现;3. 利用Redis等分布式缓存管理会话状态;4. 采用Prometheus和ELK进行监控与日志管理;5. 常见模式有无状态API集群、有状态长连…

    2025年12月3日
    000
  • PHP数据库备份与恢复 PHP操作MySQL数据维护

    php操作mysql数据维护的核心在于保证数据的安全性和可用性,主要通过备份与恢复、日常优化和维护操作来实现。1.使用mysqldump命令行工具或mysqli/pdo扩展进行数据库备份;2.通过执行sql文件恢复数据库,建议在服务器端通过ssh运行脚本;3.php可执行清理过期数据、优化表结构、检…

    2025年12月3日 后端开发
    000
  • PHP怎样解析FlatBuffer数据 FlatBuffer解析方法高效处理二进制

    php解析flatbuffer数据的核心步骤包括获取schema、生成代码、读取和解析二进制数据。首先,需获取.fbs定义文件;其次,使用第三方工具或手动编写代码生成php解析逻辑;接着,通过file_get_contents()等函数读取二进制数据;最后按schema解析并使用数据。由于php缺乏…

    2025年12月3日 后端开发
    000
  • 如何在Yii2项目中高效集成MongoDB?yiisoft/yii2-mongodb助你轻松驾驭NoSQL数据库

    可以通过一下地址学习composer:学习地址 告别数据僵局:Yii2 项目中 MongoDB 集成的痛点与解决方案 你是否曾遇到这样的困境:项目需求快速变化,数据结构不断调整,而传统关系型数据库的严格模式让你疲于应对?或者,你正在处理大量非结构化数据,关系型数据库的性能瓶颈逐渐显现?这时候,你可能…

    开发工具 2025年12月3日
    000
  • 如何用Java操作MongoDB?MongoClient连接方案

    java开发者操作mongodb最常用的方式是通过mongoclient连接数据库。1. mongoclient是核心类,用于管理连接并提供对集合和文档的操作能力;2. 支持本地或远程连接,本地使用new mongoclient(),远程需指定ip和端口;3. 若启用认证,需传入用户名、密码及认证数…

    2025年12月3日
    000
  • SQL增量聚合计算怎么写_SQL增量式聚合计算方法详解

    增量聚合计算通过仅处理数据变化部分提升效率。1. 利用时间戳、版本号或变更日志识别变更;2. 使用自定义聚合函数、窗口函数或子查询计算增量;3. 维护聚合结果表并结合索引、分区、物化视图优化性能;4. 通过事务、幂等性、快照隔离保证一致性;5. 可选流处理框架(如Flink)、NoSQL、内存数据库…

    2025年12月3日 数据库
    000
  • MongoDB中find()和findOne()有何不同?

    find()返回匹配文档的游标,适用于多条数据查询与分页操作;findOne()返回首个匹配文档或null,适合单条数据检索,性能更优。 在MongoDB中,find() 和 findOne() 都用于查询数据,但它们的返回结果和使用场景有明显区别。 返回结果不同 find() 返回一个游标(cur…

    2025年12月3日 数据库
    000
  • mongodb怎么看数据库信息?

    执行 show dbs 可查看所有数据库,包括系统和用户数据库;2. 输入 db 显示当前操作的数据库名称,默认为 test;3. 使用 use 数据库名 切换到指定数据库,若数据库不存在且无数据则不会显示;4. 运行 db.stats() 查看数据库状态,包含集合数、文档总数、数据大小、存储空间及…

    2025年12月3日 数据库
    000
  • mongodb有主键吗?

    MongoDB通过_id字段实现类似主键的唯一性控制:插入文档时自动创建ObjectId类型的_id,确保集合内唯一并自带索引;可手动指定_id值以存储自然唯一键,利用其唯一性避免重复;与传统主键不同的是_id无需显式定义、支持多种类型且可修改,但需保证唯一性;基于_id可高效执行查询、更新和删除操…

    2025年12月3日 数据库
    000
  • mongodb数据库收费吗

    MongoDB开源免费,但云服务商托管服务如阿里云、腾讯云、MongoDB Atlas等按配置收费,包含计算、存储、备份及流量等项目,提供包年包月与按量付费模式,部分平台如Atlas提供M0免费集群用于学习。 MongoDB 本身是开源的,可以免费下载和使用。但当你使用云服务商托管的 MongoDB…

    2025年12月3日 数据库
    000
  • mongodb如何删除字段

    使用$unset操作符可删除MongoDB文档中的字段,语法为db.collection.update({条件},{$unset:{字段名:””}}),示例:db.users.update({_id:1},{$unset:{age:””}})将删除ag…

    2025年12月3日 数据库
    000

发表回复

登录后才能评论
关注微信