如何解决如何使用python在neo4j中有效构建依赖图?
-
数据位于 npm 公共注册表 中。给定一个 JavaScript 包
name
,转到 https://registry.npmjs.org/name,我可以获得它的信息,包括它的依赖项。 -
现在我想将此信息导入到neo4j 数据库中,构建包的依赖关系图。给定添加到队列中的包名称
express
,我的步骤如下:- 通过https://registry.npmjs.org/pkg_name获取队列中前端包的JSON文件返回
- 解析文件并使用 Neo4j Python Driver 在 neo4j 中存储
express
及其依赖项之间的基本信息和关系。 - 对于每个依赖项,使用
set
检查它是否已添加到队列中。如果没有,则检查它的依赖图是否已在neo4j中构建。如果也没有,请将其添加到队列中。 - 重复直到
queue
为空。然后构建express
的依赖图。
-
结果是这样的:the dependency graph os JavaScript package of express。事情是在我的机器上单个包的整个过程大约需要50秒,太长了,更不用说npm上的所有包,大约100万个。
-
我能想到的一些原因:
谁能给我一些建议来加速依赖图的构建?
真诚的感谢!
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。