如何解决使用哪种统计模型来确定平均RTT网络中的往返时间变化率,以确定网络问题
我正在用python写一个工具,通过感知avgRTT值的非正常趋势来确定由于网络引起的延迟(这些值来自类似于nfsiostat
输出的自定义工具,这是客户端之间的nfs挂载状态和服务器或挂载点)。此自定义工具将以5分钟为间隔输入以下avgRTT时间。我想确定平均RTT中的非正常趋势。例如,正常趋势如下:
| time | avgRTT (nfsiostat) |
|-------|--------------------|
| 10:30 | 5.1 |
| 10:35 | 4.2 |
| 10:40 | 4.8 |
| 10:45 | 18.9 |
| 10:50 | 4.0 |
| 10:55 | 8.5 |
| 11:00 | 4.6 |
| 11:30 | 5.2 |
| 11:35 | 4.5 |
| 11:40 | 5.0 |
^^的意思是,我不在乎单个离群值,而是在乎增长趋势。所以上面的输出是正常的。
这是一个非正常趋势,我希望我的工具提醒您可能存在网络问题。
| time | avgRTT (nfsiostat) |
|-------|--------------------|
| 10:30 | 5.1 |
| 10:35 | 4.2 |
| 10:40 | 4.8 |
| 10:45 | 18.9 |
| 10:50 | 21.9 |
| 10:55 | 20.9 |
| 11:00 | 19.7 |
| 11:30 | 18.8 |
| 11:35 | 4.5 |
| 11:40 | 5.0 |
从这里^^,在10:45到11:30之间存在非正常趋势。 (也许连续2或3个值都可以视为趋势)
就上下文而言,avgRTT在一段时间间隔内可能会变坏,然后恢复正常(如上表2所示),然后又变坏(这种情况发生在开关如“自我修复”和重新启动,或者流量不一定总是到达群集中的同一故障网络设备。
到目前为止,我已经考虑过:
- 标准差-我知道avgRTT的方式,我的标准差非常窄。然后,我可以查看我的模型跨越了多少(或者我的模型传播了多少sigma)。如果我的钟形曲线的扩展范围大于第一个标准偏差附近的幅度,那么我可以说存在异常值,并且我的趋势是非正态的。我在这里预期的问题是,这并没有真正给我“趋势”,整个数据中可能有6个单独的异常值,并且我的SD贝尔曲线会比应该的宽。因此,我认为这不适合此目的。如果我错了,请纠正我。
- 最小二乘最佳拟合模型-我在这里了解到,任何离群值都会改变线的斜率,因此可以准确表示avgRTT的“趋势”。这样做的好处是可以得到变化率,因为我在x轴上具有时间函数。谢谢您在这里的任何更多信息/或指出的任何漏洞。 我还考虑了移动平均模型,其中当我在列表中移动时,我一直在计算avgRTT值的平均RTT,并将新值与该平均值进行比较。如果在任何时候某个值显示出比所计算的平均值高100%,则停止计算移动平均值并冻结该值(例如,该移动平均值位于var
frozen_avg
中),并从此“异常值”读取下三个值”,这3个值是否也超过了Frozen_avg?如果是,则有趋势。我了解在这种情况下可能会有漏洞,如果您在此方法中发现任何明显的漏洞,也将不胜感激。
我需要知道可以依靠哪些统计模型/方法来感知时间戳平均中的这种非正常趋势。如上所述的RTT值。
感谢您的帮助!谢谢。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。