批量上传文件到Azure(C#)的最快方法

批量上传文件 Azure Blob Storage的最快方法是什么?我尝试了两种方法,同步和异步上传,async显然是最快的,但我想知道是否有更好的方法?是否内置了对批量上传支持?我在文档中找不到任何内容但可能错过了它.

这是我跑的测试:

static void Main(string[] args)
{
    int totalFiles = 10; //10,50,100
    byte[] randomData = new byte[2097152]; //2mb
    for (int i = 0; i < randomData.Length; i++)
    {
        randomData[i] = 255;
    }

    CloudStorageAccount cloudStorageAccount = CloudStorageAccount.Parse(ConfigurationManager.AppSettings["StorageConnectionString"]);
    var blobClient = cloudStorageAccount.CreateCloudBlobClient();

    var container = blobClient.GetContainerReference("something");
    container.CreateIfNotExists();


    TimeSpan tsSync = Test1(totalFiles,randomData,container);
    TimeSpan tsAsync = Test2(totalFiles,container);

    Console.WriteLine($"Sync: {tsSync}");
    Console.WriteLine($"Async: {tsAsync}");

    Console.ReadLine();

}

public static TimeSpan Test2(int total,byte[] data,CloudBlobContainer container)
{
    Stopwatch sw = new Stopwatch();
    sw.Start();
    Task[] tasks = new Task[total];
    for (int i = 0; i < total; i++)
    {
        CloudBlockBlob blob = container.GetBlockBlobReference(Guid.NewGuid().ToString());
        tasks[i] = blob.UploadFromByteArrayAsync(data,data.Length);

    }
    Task.WaitAll(tasks);


    sw.Stop();
    return sw.Elapsed;
}

public static TimeSpan Test1(int total,CloudBlobContainer container)
{
    Stopwatch sw = new Stopwatch();
    sw.Start();
    for (int i = 0; i < total; i++)
    {
        CloudBlockBlob blob = container.GetBlockBlobReference(Guid.NewGuid().ToString());
        blob.UploadFromByteArray(data,data.Length);

    }
    sw.Stop();
    return sw.Elapsed;
}

这个输出是:

10个文件

Sync: 00:00:08.7251781
Async: 00:00:04.7553491
DMLib: 00:00:05.1961654

Sync: 00:00:08.1169861
Async: 00:00:05.2384105
DMLib: 00:00:05.4955403

Sync: 00:00:07.6122464
Async: 00:00:05.0495365
DMLib: 00:00:06.4714047

50个文件

Sync: 00:00:39.1595797
Async: 00:00:22.5757347
DMLib: 00:00:25.2897623

Sync: 00:00:40.4932800
Async: 00:00:22.3296490
DMLib: 00:00:26.0631829

Sync: 00:00:39.2879245
Async: 00:00:24.0746697
DMLib: 00:00:26.9243116

我希望这是一个有效的问题.

谢谢

编辑:

我已经用“DMLib”测试更新了结果,以回应到目前为止给出的答案. DMLib是一个没有配置更改的测试(见上文)没有性能提升

我用ServicePointManager.DefaultConnectionLimit = Environment.ProcessorCount * 8运行了一些测试;正如文档所推荐的那样,这增​​加了相当多的上传速度,但它也提高了我的异步方法上传速度.到目前为止,DMlib还没有给我任何值得的性能提升.我在下面的配置更改中添加了第二组测试结果.

我还设置了ServicePointManager.Expect100Continue = false;然而这对速度没有影响.

使用ServicePointManager.DefaultConnectionLimit = Environment.ProcessorCount * 8测试结果;

10个文件

Sync: 00:00:07.6199307
Async: 00:00:02.9615565
DMLib: 00:00:02.6629716

Sync: 00:00:08.7721797
Async: 00:00:02.8246599
DMLib: 00:00:02.7281091

Sync: 00:00:07.8437682
Async: 00:00:03.0171246
DMLib: 00:00:03.0190045

50个文件

Sync: 00:00:40.2395863
Async: 00:00:10.3157544
DMLib: 00:00:10.5107740

Sync: 00:00:40.2473358
Async: 00:00:10.8190161
DMLib: 00:00:10.2585441

Sync: 00:00:41.2646137
Async: 00:00:13.7188085
DMLib: 00:00:10.8686173

我是否错误地使用了库,因为它似乎没有提供比我自己的方法更好的性能.

解决方法

请使用 Azure Storage Data Movement Library,这是 AzCopy的核心.这个库正是解决问题的工具.

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


原文地址:http://msdn.microsoft.com/en-us/magazine/cc163791.aspx 原文发布日期: 9/19/2005 原文已经被 Microsoft 删除了,收集过程中发现很多文章图都不全,那是因为原文的图都不全,所以特收集完整全文。 目录 前言 CLR启动程序
前言 随着近些年微服务的流行,有越来越多的开发者和团队所采纳和使用,它的确提供了很多的优势也解决了很多的问题,但是我们也知道也并不是银弹,提供优势的同时它也给我们的开发人员和团队也带来了很多的挑战。 为了迎接或者采用这些新技术,开发团队需要更加注重一些流程或工具的使用,这样才能更好的适应这些新技术所
最近因为比较忙,好久没有写博客了,这篇主要给大家分享一下PLINQ中的分区。上一篇介绍了并行编程,这边详细介绍一下并行编程中的分区和自定义分区。 先做个假设,假设我们有一个200Mb的文本文件需要读取,怎么样才能做到最优的速度呢?对,很显然就是拆分,把文本文件拆分成很多个小文件,充分利用我们计算机中
在多核CPU在今天和不久的将来,计算机将拥有更多的内核,Microsoft为了利用这个硬件特性,于是在Visual Studio 2010 和 .NET Framework 4的发布及以上版本中,添加了并行编程这个新特性,我想它以后势必会改变我们的开发方式。 在以前或者说现在,我们在并行开发的时候可
c语言输入成绩怎么判断等级
字符型数据在内存中的存储形式是什么
c语言怎么求字符串的长度并输出
c语言函数的三种调用方式是什么
c语言中保留两位小数怎么表示
double的输入格式符是什么
长整型输出格式是什么
C语言中文件包含的命令关键字是什么
c程序如何编写x的y次方
c语言开根号代码是什么
c语言怎么进行字符串比较
c语言怎么进行强制类型转换
c语言运算符的优先级顺序是什么
c++用什么软件编程
中序遍历是怎么遍历的
h文件和c文件的关系是什么