微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

algorithm – 如何将网页浏览与内存峰值相关联?

我在使用应用程序时遇到了一些内存问题,但要确切地知道它的确切位置有点困难.我有两组数据:

浏览量

>请求的页面
>请求页面的时间

内存使用

>正在使用的内存量
>记录此内存使用的时间

我想确切地看到哪些网页浏览量与高内存使用率相关.我的猜测是,我将进行某种类型的T测试,以确定哪些综合浏览量与增加的内存使用量相关.但是,对于要进行什么样的T检验,我有点不确定.有人至少可以指出我正确的方向吗?

解决方法

我建议用两列构建一个数据集.第一个是分布的最高内存使用时间中每个页面出现的比例,第二个是内存分布的其余值的那些(相同)页面的比例.

然后你必须进行配对测试以检查差异的中位数(高 – 休息)是否小于或等于零(H0),而另一个假设是差异的中位数大于零(H1).我建议使用非参数测试Wilcoxon Signed Ranks Test,这是Mann – Whitney Test对配对样本的变体.它还考虑了每对中差异的大小,这是其他测试忽略的(例如符号测试).

请记住,关系(零差异)在非参数方法的推导中存在许多问题,应该避免.处理关系的首选方法是在数据中添加一点“噪音”.也就是说,通过添加一个不会影响差异排名的足够小的随机变量来修改绑定值后完成测试

我希望测试结果和绘制差异分布图可以让您深入了解问题所在.

这是R language中的Wilcoxon Signed Ranks Test的实现

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐