技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

图像处理 – 将大图像时间发送到GPU

时间：2020-08-27分类：Lua作者：编程之家

我正在使用在Lua中使用Torch进行图像处理的CNN模型(AlexNet).我正在修改 Torch starter code.

我的问题是我用18个频道而不是3个频道制作图像来训练模型,并且为了将这些图像发送到GPU,它比用三个频道发送图像时需要大约20个(每批2.13秒).每批0.14s).我还试着看看将4个通道的图像发送到GPU需要多长时间.我看到,一旦通道数量增加到3个以上的通道,时间就增加了大约20倍.例如,即使对于具有4个通道的图像,每批次花费大约2秒,这比运行3通道图像大约多19倍.

我想知道是否有一个错误,这需要花费很多时间,如果没有任何错误,如果有任何方法,我可以减少这个运行时间？

解决方法

简答

这是一个不会消失的问题.这是cpu到GPU缓冲的带宽问题.您已经增加了必须通过总线发送的数据量.

可能的解决方法

您要做的事情的本质是在模型中包含先前的帧.如果这是你想要完成的,那么还有另一种方法.

如果训练批次不是随机选择的堆叠图像,则相反,训练批次是常规图像,但是所有顺序都是时间顺序的.

在第二种情况下,您只需3个频道即可发送图像,但图像不会出现故障.

让我们探索一下假设.

首先,您仍然可以通过更改每个批次的开始时间和结束时间来创建随机抽样,并随机选择要选择的视频.

其次,你可以使用[批量,高度,重量,通道]张量在GPU上生成一个新的张量

[ batch[1:],height,width,channel] - [ batch[:-1],channel]
and assign it to diffTensor

然后连接以下张量

origTensor [ batch[5:-0],channel] 
diffTensor [ batch[5:-0],channel] 
diffTensor [ batch[4:-1],channel] 
diffTensor [ batch[3:-2],channel] 
diffTensor [ batch[2:-3],channel] 
diffTensor [ batch[1:-4],channel] 
diffTensor [ batch[0:-5],channel]

如果你想5“回头看”

这将实现什么？好吧,如果你发送100张图像到GPU,那么这个网络将能够生成95个图像差异图像,网络价格仅发送100个图像,而不是你试图发送95个图像差异图像,每个图像有5层我必须支付发送500张图像的网络价格.基本上,您可以将网络成本降低近x5

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 dio@foxmail.com 举报，一经查实，本站将立刻删除。

上一篇：比较lua中的表,其中键是表下一篇：lua – 使用Torch-hdf5将Tensor保存

相关推荐

1.github代码实践源代码是lua脚本语言，下载th之后运行thmain.lua-netTypevgg-savevgg_cifar10/-S0.0001，报错：试看看安装lua:报错了，参考这篇文章：ubuntu18.04安装lua的步骤以及出现的问题_weixin_41355132的博客-CSDN博客问题解决，安装成功：情况并没有好转，出现相

作者：编程之家时间：2022-10-09

U3D性能优化之Lua与C#交互

此文为搬运帖,原帖地址https://www.cnblogs.com/zwywilliam/p/5999924.html前言在看了uwa之前发布的《Unity项目常见Lua解决方案性能比较》，决定动手写一篇关于lua+unity方案的性能优化文。整合lua是目前最强大的unity热更新方案，毕竟这是唯一可以支持ios热更新的办法。然而作

作者：编程之家时间：2022-10-09

RIME输入法获取当前时间一

Rime输入法通过定义lua文件，可以实现获取当前时间日期的功能。1.TIMERime是一款可以高度自定义的输入法，相关教程可以查看往期文章，关于时间获取是指输入一个指定关键字，输出当前时间，效果如下（我定义了time关键字）：实现如下：①在用户文件夹中新建一个rime.lua文件加入如下代码 ti

作者：编程之家时间：2022-10-09

cocos2d-lua 按钮果冻效果

localfunctiongenerate_action(params)localscale_action=cc.ScaleTo:create(params.time,params.scale_x,params.scale_y)localfade_action=cc.FadeIn:create(params.time)returncc.Spawn:create(scale_action,fade_action)end

作者：编程之家时间：2022-10-09

opm openresty的包管理器-中文文档

2022年1月11日13:57:45 官方：https://opm.openresty.org/官方文档：https://opm.openresty.org/docs#table-of-contents为什么建议使用opm不建议使用luarocks？http://openresty.org/cn/using-luarocks.html官方解释：请注意！LuaRocks并不是OpenResty官方推荐的装包方式。LuaRoc

作者：编程之家时间：2022-10-09

Lua 设置元表和元方法作用

在Lua中的table（表），就像c#中的HashMap（哈希表），key和value一一对应。元表：table的一个操作的拓展，里面包含关联了对应的方法，元方法就是其中一个。元方法：当你通过键来访问table的时候，如果这个键没有值，那么Lua就会寻找该table的metatable（假定有metatable）中的__index键。如果__inde

作者：编程之家时间：2022-10-09

表排序：table.sort(list[,comp])参数list：指定表，可选参数comp：排序函数，无参数时通常按升序排序。排序函数针对表中连续的序列，其间不可以存在空洞或nil，排序函数需要两个形参(对应表中每次参加比较的两个数据)，需要一个比较两个形参表达式的返回值，不能含有等于关系，例如>=，<=，==。do

作者：编程之家时间：2022-10-09

编译安装haproxy

一、安装lua环境1.1安装依赖包[root@centos7~]#yuminstallgccreadline-devel1.2下线lua源码包并解压[root@centos7~]#wgethttp://www.lua.org/ftp/lua-5.3.5.tar.gz[root@centos7~]#tarxvflua-5.3.5.tar.gz-C/usr/local/src1.3进行编译[root@centos7~]

作者：编程之家时间：2022-10-09

OpenResty 运维

官网OpenResty® 是一个基于 Nginx 与Lua的高性能Web平台，其内部集成了大量精良的Lua库、第三方模块以及大多数的依赖项。用于方便地搭建能够处理超高并发、扩展性极高的动态Web应用、Web服务和动态网关。OpenResty® 通过汇聚各种设计精良的 Nginx 模块（主要由

作者：编程之家时间：2022-10-09

lua学习笔记(三)--表

表参考《lua程序设计》可以认为，表是一种动态分配的对象，程序只能操作指向表的引用（或指针）。除此以外，Lua语言不会进行隐藏的拷贝（hiddencopies）或创建新的表--创建表a={}--创建空表k="x"a[k]=10--键“x”值10a[20]="great"--键20值“great”print(a["x"])-->10

作者：编程之家时间：2022-10-09

小编推荐

苹果市值2025年有望达4万亿美元