MongoDB驱动聚合查询aggregate在分组分页排序后出现的数据混乱问题


u=60481258,2906075580&fm=26&gp=0.jpg

最近在获取MongoDB数据时需要把重复的数据分组来排序,语言版本:PHP7

直接上代码

$param = [
    'aggregate' => '表名',
    'pipeline'  => [
        // 搜索条件
        ['$match' => ['status' => 1]],
        // 根据重复的title来group分组 max_sort=>获取最大的排序值
        ['$group' => ['_id' => '$title', 'count' => ['$sum' => 1], 'max_sort' => ['$max' => '$sort']]],
        // 根据分组的最大值条件降序
        ['$sort' => ['max_sort' => -1]]
    ],
    // 高版本需要带上这个值
    'cursor'    => new \stdClass()
];
$mongodb = new MaMongoDB\Driver\Managerager('mongodb://localhost:27017/', []);
$command = new MongoDB\Driver\Command($param);
$result  = $mongodb->executeCommand('数据库', $command);
$res   = $result->toArray();

一切都是按照预想的结果,但是出来的结果太多了,实际项目中大多数需要分页效果,这时候加上skip,limit条件进去

    'pipeline'  => [
        // 搜索条件
        ['$match' => ['status' => 1]],
        // 根据重复的title来group分组 max_sort=>获取最大的排序值
        ['$group' => ['_id' => '$title', 'count' => ['$sum' => 1], 'max_sort' => ['$max' => '$sort']]],
        ['$skip'  => ($page - 1) * $limit],
        ['$limit' => (int)$limit,
        // 根据分组的最大值条件降序
        ['$sort'  => ['max_sort' => -1]]
    ],

跑下代码之后发现出来的结果倒是问题,但是排序混乱了。。。

why?在没有解决这个问题之前,可谓是翻遍了Google、Baidu、CSDN等所有能查的资源网站,都无从解决下手。最后无奈,只能顶着网速和过了18级的英语水平去看官网的文档了。

在MongoDB游标方法中,例如限额,排序,跳过可以以任何顺序应用=>顺序无关紧要。 find()返回一个游标,在其上应用了修改。排序总是在限制之前完成,跳过也要在限制之前完成。因此换句话说,顺序是:排序->跳过->限制

聚合框架不会返回数据库游标。而是返回带有汇总结果的 document 。它的工作原理是在管道的每个步骤中产生中间结果,因此操作的顺序确实很重要。

重点来了,聚合查询不会返回数据游标,所以排序很重要。按照MongoDB官方的推荐写法

db.test.find().sort({"age":1}).limit(2);

也就是说正常的顺序是sort->skip->limit,这时候把上面的语句换下顺序后

    'pipeline'  => [
        // 搜索条件
        ['$match' => ['status' => 1]],
        // 根据重复的title来group分组 max_sort=>获取最大的排序值
        ['$group' => ['_id' => '$title', 'count' => ['$sum' => 1], 'max_sort' => ['$max' => '$sort']]],
        // 根据分组的最大值条件降序
        ['$sort'  => ['max_sort' => -1]],
        ['$skip'  => ($page - 1) * $limit],
        ['$limit' => (int)$limit,
    ],

再跑下代码,分组分页正常,排序也是按照sort里面的条件排了。可能很多小伙伴遵循了sort->skip->limit这种顺序的写法没有出现过异常,但是对于平时不是那么严谨的小伙伴来说,比如我,可能就会在这种问题上卡很久,谁会想到一个数组的排序会多数据结果产生那么大的影响。

记录下此次教训~~~

声明:版权所有,违者必究|如未注明,均为原创|本网站采用 BY-NC-SA协议进行授权

转载:转载请注明原文链接 - MongoDB驱动聚合查询aggregate在分组分页排序后出现的数据混乱问题

点击排行