技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

python-快速计算bson文档中的对象数

时间：2022-09-01分类：MongoDB作者：编程之家原文地址

我想计算存储在mongodb bson文件中的文档数,而不必通过mongo restore将文件导入到db中.

我能够在python中提出的最好的方法是

bson_doc = open('./archive.bson','rb')
it = bson.decode_file_iter(bson_doc)
total = sum(1 for _ in it)
print(total)

从理论上讲,这是可行的,但是当bson文档很大时,在实践中就很慢.任何人都可以在不进行完整解码的情况下更快地计算bson文档中文档的数量？

我目前正在使用python 2.7和pymongo.
https://api.mongodb.com/python/current/api/bson/index.html

我没有手头的文件,但我相信有办法-如果您要手动解析数据.

source for bson.decode_file_iter(没有文档字符串)如下所示：

_UNPACK_INT = struct.Struct("<i").unpack

def decode_file_iter(file_obj, codec_options=DEFAULT_CODEC_OPTIONS):
    while True:
        # Read size of next object.
        size_data = file_obj.read(4)
        if len(size_data) == 0:
            break  # Finished with file normaly.
        elif len(size_data) != 4:
            raise InvalidBSON("cut off in middle of objsize")
        obj_size = _UNPACK_INT(size_data)[0] - 4
        elements = size_data + file_obj.read(obj_size)
        yield _bson_to_dict(elements, codec_options)

我想,耗时的操作是_bson_to_dict调用-您不需要一个.

因此,您所需要做的就是读取文件-获取具有下一个文档大小的int32值并跳过它.然后计算执行此操作时遇到的文档数.

因此,我相信,此功能应该可以解决问题：

import struct
import os
from bson.errors import InvalidBSON

def count_file_documents(file_obj):
    """Counts how many documents provided BSON file contains"""
    cnt = 0
    while True:
        # Read size of next object.
        size_data = file_obj.read(4)
        if len(size_data) == 0:
            break  # Finished with file normaly.
        elif len(size_data) != 4:
            raise InvalidBSON("cut off in middle of objsize")
        obj_size = struct.Struct("<i").unpack(size_data)[0] - 4
        # Skip the next obj_size bytes
        file_obj.seek(obj_size, os.SEEK_CUR)
        cnt += 1
    return cnt

(不过,我尚未测试过代码.手头没有MongoDB.)

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 dio@foxmail.com 举报，一经查实，本站将立刻删除。

上一篇：嵌套诺言节点js 下一篇：CodeGo.net>有什么办法将Sq

相关推荐

【主流技术】MongoTemplate 与 Spring Boot 项目集成(附CURD技巧)

MongoTemplate 是Spring Data MongoDB 中的一个核心类，为 Spring 与 MongoDB 数据库的交互提供了丰富的功能集。

MongoTemplate 提供了创建、更新、删除和查询 MongoDB 文档的便利操作，并提供了编程语言的领域对象（POJO）和 Mong

作者：CodeBlogMan 时间：2024-10-09

【解决方案】项目重构之如何使用 MySQL 替换原来的 MongoDB

笔者今天要分享的是一个项目重构过程中如何将数据库选型由原来的 MongoDB 改为 MySQL 的思考，涉及到业务当前的痛点、选型分析、解决的核心思路，最后会给出简单的 demo。

作者：CodeBlogMan 时间：2024-10-09

mongodb/mongoTemplate.upsert批量插入更新数据的实现

mongodb/mongoTemplate.upsert批量插入更新数据的实现

作者：热爱生活的猴子时间：2022-12-19

Mongodb:安装教程

进入官网下载官网安装点击next勾选同意，点击next点击customer点击修改安装路径个人修改的路径。点击next点击next取消勾选，点击next点击install安装进行中安装完成之后配置在data目录新建db目录在log目录下新建mongodb.log文件在安装目录新建文件mongodb.configdbpath=D:frontapplicationmongodbdatadb#数据库路径#这里是你的安装路径！！！！！l

作者：HaanLen 时间：2022-12-19

MongoDB实验——数据库基本操作头歌

头歌 MongoDB实验——数据库基本操作

作者：海浪～& 时间：2022-12-19

mongodb期末考试总结

期末考试复习总结

作者：弗敢成也.z 时间：2022-12-19

Studio 3T使用教程,本人详细介绍连接Mongodb过程

4：点击 Manually configure my connection settings，然后next。

作者：晨曦之泪时间：2022-12-19

MongoDB的安装(详细教程)

MongoDB 是一个基于分布式文件存储的数据库，主要用于为 web 应用提供可扩展的高性能数据存储解决方案。以下内容是如何在 windows 下安装 MongoDB 的教程，主要参照MongoDB - 学习教程如果想要在 Linux 下安装 MongoDB ，详见Liunx - MongoDB 的安装MongoDB由 C++语言编写，是一个介于关系型数据库和非关系型数据之间的产品，是非关系型数据库中功能最丰富，最像关系数据库的。它支持的数据结构非常松散，是类似与json的bson。......

作者：多加点辣也没关系时间：2022-12-06

Mongodb实验二——分片集群搭建

mongodb分片式集群搭建本实验在一台电脑上完成，本人自己方法与标准方法略有差异，大家仁者见仁，同时可能你按照一样的步骤下来，会出现各种各样的错误，但希望大家懂得学会去查看日志，查看代码，懂得如何解决问题，这是一个有趣的过程，共勉。

作者：中意灬时间：2022-11-29

Node.js | Express+MongoDB 实现简易用户管理系统三登录验证之Cookie&Session

在前面的几节中我们已经创建并优化好了简易用户管理系统的项目结构，也对Cookie-Session登录验证的工作原理做了讲解，接下来我们将继续补充这个系统的功能，这一节我们将实战运用来实现这个系统的登录验证功能。

作者：海底烧烤店ai 时间：2022-11-21

小编推荐

苹果市值2025年有望达4万亿美元