微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

DVC 文件不完整

如何解决DVC 文件不完整

我在一个团队中使用 dvc 和 git 来控制数据文件。我们正在使用 dvc 1.3.1 和 S3 存储桶遥控器。在同事的分支上执行 dvc fetchdvc pull 时出现此错误

ERROR: Failed to fetch data from the cloud - DVC-file 'C:\Users\blah\Documents\repo\data\processed_data.dvc' format error: extra keys not allowed @ data['outs'][0]['size']

当我检查 dvc 文件中没有问题的缓存文件时,我看到:

md5: ded591aacbe363f0518ceb9c3bc1836b
outs:
- md5: efdab20e8b59903b9523cc188ff727e5
  path: completion_header.p
  cache: true
  metric: false
  persist: false

但有问题的文件只有这个:

outs:
- md5: f4e15187d9a0bbb328e629eabd8d1784.dir
  size: 112007
  nfiles: 3
  path: processed_data

在所有情况下,文件都使用命令 dvc add %dirname% 添加到 dvc。这是我第二次在同事的分支机构(2 个不同的人)上看到这种情况。

自从发帖后,我意识到我的同事 dvc'd 一个目录。我曾尝试先创建目录,然后调用 dvc fetch,但得到相同的错误

解决方法

在所有情况下,使用命令 dvc add %filename% 将文件添加到 dvc。

在较新版本的 dvc 中创建的 dvc 文件之一似乎很有可能您正尝试使用较旧版本进行操作。添加新文件时,您的所有同事是否都使用相同的 dvc 版本?

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。