微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

DVC - 进行预定的 csv 转储

如何解决DVC - 进行预定的 csv 转储

假设我们有一些数据库(任何支持 csv 转储的数据库),实时收集原始数据,以便在 ML 中进一步使用。 另一方面,我们有 DVC,可以处理 csv 文件

我想使用日期时间参数组织存储 SELECT 到该数据库的预定运行(并且还支持手动运行),以制作新的 csv 文件,并将它们发送到 DVC。

在我发现的 DVC 文档和示例中,csv 文件已经存在。

我可以使用 DVC 本身与数据库进行这种交互吗,或者我出了什么问题,并且有一个单独的 csv 转储工具?

解决方法

这个过程有3个步骤:

  1. 创建 CSV 转储。许多数据库都有这些工具,但 DVC 本身并不支持。
  2. 版本 CSV 转储并将其移动到某个存储。 DVC 负责这项工作。
  3. 安排定期转储。您可以使用 Cron(简单)、AirFlow(不容易)或 periodical jobs in GitHub Actions/GitLab CI/CD。 DVC 团队的另一个项目可以帮助 CI/CD 选项:https://cml.dev

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。