如何解决对于以 ADX 作为源的复制活动,ADF 不支持以 MB (100) 为单位的接收块大小
我使用 ADF 复制活动,源作为 ADX 数据集,接收器作为 ADLSGen2。在接收器的设置中,我指定了 100 ,因此我预计写入的总数据为 1GB ,将产生约 100 个 blob。
当我运行管道时,尽管指定了 100 作为块大小,但还是有一个大小为 1.GGB 的 blob。我多次试验这个值,但我观察到它对接收器中产生的斑点数量没有影响。就好像完全被忽略了一样。或者只是这个设置在ADX为源时不起作用?
解决方法
当我运行管道时,有一个大小为 1.GGB 的 blob 尽管已将 100 指定为块大小。
实际上,它应该是单个 1.GGB 文件。在您的情况下,您将文件分成多个块并复制到 Azure Data Lake Gen2。这些块将连接在一起并成为 1.GGB 文件。您可以参考 this Documentation 以了解有关块 blob 的更多信息。
如果您想检查 Block size(MB) 选项是否有效,您可以检查 Azure Data Lake Gen2 的 $log 文件夹中的相应日志文件。它会告诉你块的数量。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。