微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

使用 json2csv

如何解决使用 json2csv

我有一个 nodeJS 应用程序,它使用 json2csv 模块将数据从 MongoDB 集合导出到 CSV 文件。由于记录数量巨大,因此无法将整个数据存储在变量中。所以它从集合中以 1000s 的块为单位进行查询并附加到文件中。

const Json2csvParser = require('json2csv').Parser;
....
const totalCount = await Collection.count(filters);
const limit = 1000;
const totalPages = Math.ceil(totalCount / limit);
const records = [];
logger.info({ totalCount,totalPages },`Total records ${totalCount}`)
for (let page = 0; page < totalPages; page++) {
    const skip = page * limit;
    const data = await Collection.find(filters,{ projection }).skip(skip).limit(limit).toArray();
    logger.info(`Records found in page ${page + 1}/${totalPages}: ${data.length}`)
    const records = data.map(ele => flatten(JSON.parse(JSON.stringify(ele))));

    const headers = getHeaders(records);

    const json2csvParser = new Json2csvParser({ fields: headers,header: page === 0 });
    const csvContent = json2csvParser.parse(records);

    fs.appendFileSync(fileName,csvContent,'utf8');
}

此处 getHeaders 通过展平文档从文档中的键中提取标题。例如,如果数据看起来像这样,

{
  orderId:"111012121",items: [
    {itemId:"BA29322",name:"Item A"},{itemId:"BA29323",name:"Item B"}
  ],value: 1000
}

然后标题看起来像这样

"orderId","items.0.itemId","items.0.name","items.1.itemId","items.1.name","value"

现在的问题是标题数量取决于在块的 items 属性中找到的最大元素数量。即,如果在前 1000 条记录的 items 中找到的最大元素数为 2,则标题将如上所示。但是如果它在下一组 1000 条记录中是 3,那么它看起来像下面

"orderId","items.2.itemId","items.2.name","value"

这意味着数据未显示在正确的标题下,如下所示。

enter image description here

我该如何处理。请原谅我的冗长问题。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其他元素将获得点击?
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。)
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbcDriver发生异常。为什么?
这是用Java进行XML解析的最佳库。
Java的PriorityQueue的内置迭代器不会以任何特定顺序遍历数据结构。为什么?
如何在Java中聆听按键时移动图像。
Java“Program to an interface”。这是什么意思?