mongodb聚合的使用

聚合:
主要用于计算和统计等,类似sql种的sum() avg()
db.集合.aggregate( { 管道:{表达式} } ) 常用的管道:
$group:将集合中的文档按照字段进行分组
$match:过滤数据,输出符合条件的文档
$project:修改文档的结构,重命名、增加、删除字段,创建结果,类似投影,指定字段显示结果
$sort:排序
$limit:限制返回文档条数
$skip:跳过指定数量的文档
$unwind:对列表类型字段内容拆分 常用表达式: $表达式:"$字段"
$sum:计算总数量,$sum:1 代表按照1倍进行统计总数量
$avg:计算平均值
$min:获取最小值
$max:获取最大值
$push:结果文档插入到一个数组给配合分组使用
$first:获取排序后第一个文档数据
$last:获取排序后最后一个文档数据 $group: {_id:"$字段"} 指定字段分组,id为null代表全部数据为一组
例如:统计男生、女生的人数
db.stu.aggregate(
{$group:{
_id:"$gender", //按照gender进行排序
total:{$sum:1} //自己设置一个字段total用于保存统计每个组的人数
// $sum:1 代表按照一倍进行统计总数量
}}
) _id:null 代表所有数据分为一组
例如: 求总人数和平均年龄
db.stu.aggregate(
{$group:{
_id:null, //整个数据分为一组
total:{$sum:1}, //按照一倍统计总数量
avg_age:{$avg:"$age"} //按照字段年龄求平均数
}}
) $push: 透视数据,将符合分组条件的字段插入到结果列表当中,"$$ROOT"可以令整个文档插入列表
例如:按照性别统计姓名:
db.stu.aggregate(
{$group:{
_id:"$gender", //按照性别进行分组
names:{$push:"$name"} //将符合分组的name字段值插入 names的列表里
}}
) 例如: 按照性别,统计文档
db.stu.aggregate(
{$group:{
_id:"$gender", //按照性别进行分组
info:{$push:"$$ROOT"} //将符合分组的文档插入到info列表当中
}}
) $match: 过滤数据,输出符合条件的文档
例如:查询年龄大于20的学生
db.stu.aggregate(
{$match:{age:{$gt:20}}} //年龄大于20
) 例如:查询年龄大于20的男生女生分别的人数。(多个管道进行并列)
db.stu.aggregate(
{$match:{age:{$gt:20}}}, //年龄大于20 筛选出符合条件的数据
{$group:{
_id:"$gender", //按照性别分组
total:{$sum:1} //求出总数量
}}
) $project: 类似投影,指定字段进行显示结果
例如: 查询学生的姓名、年龄
db.stu.aggregate(
{$project:{
_id:0,
name:1, //指定为1代表显示,指定为0代表不显示
age:1
}}
) 例如:查询男女生,输出人数
db.stu.aggregate(
{$group:{ //按照性别分组后统计人数
_id:"$gender",
total:{$sum:1}
}},
{$project:{
_id:0, //指定只输出总数 不输出_id
total:1
}}
) $sort: 排序后输出,1为升序 -1为降序
例如: 查询学生信息,按年龄升序
db.stu.aggregate(
{$sort:{age:1}}
) 例如: 查询男女生的人数并按人数降序
db.stu.aggregate(
{$group:{ //按年龄排序求出总人数
_id:"$gender",
total:{$sum:1}
}},
{$sort:{total:-1}} //按照total的降序排列
) $skip和$limit:
$skip:num 越过前num条文档
$limit:num 显示num条文档
先skip再limit实现分页的功能 例如:查询3到7条(略过前2条,查询5条)
db.stu.aggregate(
{$skip:2},
{$limit:5}
) $unwind:对文档中包含列表类型按照列表内元素个数数据进行拆分成多条
构造数据:db.t2.insert({_id:1,item:'t-shirt',size:['S','M','L']})
拆分: db.t2.aggregate( {$unwind:"$size"} )
结果: { "_id" : 1, "item" : "t-shirt", "size" : "S" }
{ "_id" : 1, "item" : "t-shirt", "size" : "M" }
{ "_id" : 1, "item" : "t-shirt", "size" : "L" } 处理空数组、非数组、无字段、null情况:(按如上操作会丢失查询结果)
需要指定preserveNullAndEmptyArrays: true代表保留空文档,false代表不保留空文档
构造数据:db.t3.insert([
{ "_id" : 1, "item" : "a", "size": [ "S", "M", "L"] },
{ "_id" : 2, "item" : "b", "size" : [ ] },
{ "_id" : 3, "item" : "c", "size": "M" },
{ "_id" : 4, "item" : "d" },
{ "_id" : 5, "item" : "e", "size" : null }
])
丢数据的拆分: db.t3.aggregate({ $unwind:"$size" })
空的size仍然保留信息: db.t3.aggregate({ $unwind:"$size",preserveNullAndEmptyArrays:true })
上一篇:python列表中的pop函数


下一篇:slf4j+log4j的使用