了解延迟有界 memcpy/memset x86_64

如何解决了解延迟有界 memcpy/memset x86_64

我一直在查看一些 stackoverflow 帖子(Why is std::fill(0) slower than std::fill(1)?Enhanced REP MOVSB for memcpy),决定最佳 memcpy/memset 策略的一个因素似乎是操作是否会受到延迟或 DRAM 带宽限制。要点之一是 rep movsb 的切换延迟比我不理解的正常写入更长。

为什么 ERMSB rep movsb 比 memcpy/memset 的 movaps(或任何其他正常写入)循环具有更长的切换延迟 em>

BeeOnRope commented 写:

上面描述的 rep movsb 与单个内核上不同缓冲区大小的显式 movap 循环的行为与我们之前在服务器内核上看到的非常一致。正如您所指出的,竞争是非 RFO 协议 [Read For Ownership] 和 RFO 协议之间的竞争。前者在所有缓存级别之间使用较少的带宽,但特别是在服务器芯片上,一直到内存的切换延迟很长。由于单核通常并发受限,延迟很重要,非 RFO 协议获胜,这就是您在 30 MB L3 以外的区域看到的

然而,在 Enhanced REP MOVSB for memcpy 中,BeeOnRope 说

但是,如果您的并发受限,情况就会平衡,但有时会逆转。您有 DRAM 带宽可供备用,因此 NT 存储无济于事,它们甚至会受到伤害,因为它们可能会增加延迟,因为线路缓冲区的切换时间可能比预取将 RFO 线路带入 LLC(甚至L2),然后存储在 LLC 中完成以有效降低延迟。最后,服务器 uncore 的 NT 存储往往比客户端慢得多(和高带宽),这加剧了这种影响。

我无法理解非 RFO 方法 (rep movsb) 如何具有更长的延迟切换,并解释了延迟切换来自何处是 LFB(行填充缓冲区)是否必须切换到缓存在 L2/LLC 或 DRAM 中。

Enhanced REP MOVSB for memcpy 帖子讨论了 rep movsb 的优点,其中:

立即准确地发出预取​​请求。硬件预取在检测类似 memcpy 的模式方面做得很好,但它仍然需要几次读取才能启动,并且会“过度预取”超出复制区域末尾的许多缓存行。 rep movsb 确切知道区域大小并且可以准确预取。

鉴于 rep movsb 正在预取(比 movaps 循环更有效),您是否期望 LFB 至少在L2/LLC 与 movaps 循环相比。如果是这种情况,我不明白:

前者在所有缓存级别之间使用的带宽较少,但特别是在服务器芯片上,一直到内存的切换延迟很长

特别是长延迟切换是否来自。

所以我的问题是

  1. rep movsb 中 LFB 的额外切换延迟来自哪里?
  2. 更一般地说,是什么导致了 rep movsb 和 memcpy/memset 中的延迟界限?

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


使用本地python环境可以成功执行 import pandas as pd import matplotlib.pyplot as plt # 设置字体 plt.rcParams['font.sans-serif'] = ['SimHei'] # 能正确显示负号 p
错误1:Request method ‘DELETE‘ not supported 错误还原:controller层有一个接口,访问该接口时报错:Request method ‘DELETE‘ not supported 错误原因:没有接收到前端传入的参数,修改为如下 参考 错误2:cannot r
错误1:启动docker镜像时报错:Error response from daemon: driver failed programming external connectivity on endpoint quirky_allen 解决方法:重启docker -> systemctl r
错误1:private field ‘xxx‘ is never assigned 按Altʾnter快捷键,选择第2项 参考:https://blog.csdn.net/shi_hong_fei_hei/article/details/88814070 错误2:启动时报错,不能找到主启动类 #
报错如下,通过源不能下载,最后警告pip需升级版本 Requirement already satisfied: pip in c:\users\ychen\appdata\local\programs\python\python310\lib\site-packages (22.0.4) Coll
错误1:maven打包报错 错误还原:使用maven打包项目时报错如下 [ERROR] Failed to execute goal org.apache.maven.plugins:maven-resources-plugin:3.2.0:resources (default-resources)
错误1:服务调用时报错 服务消费者模块assess通过openFeign调用服务提供者模块hires 如下为服务提供者模块hires的控制层接口 @RestController @RequestMapping("/hires") public class FeignControl
错误1:运行项目后报如下错误 解决方案 报错2:Failed to execute goal org.apache.maven.plugins:maven-compiler-plugin:3.8.1:compile (default-compile) on project sb 解决方案:在pom.
参考 错误原因 过滤器或拦截器在生效时,redisTemplate还没有注入 解决方案:在注入容器时就生效 @Component //项目运行时就注入Spring容器 public class RedisBean { @Resource private RedisTemplate<String
使用vite构建项目报错 C:\Users\ychen\work>npm init @vitejs/app @vitejs/create-app is deprecated, use npm init vite instead C:\Users\ychen\AppData\Local\npm-
参考1 参考2 解决方案 # 点击安装源 协议选择 http:// 路径填写 mirrors.aliyun.com/centos/8.3.2011/BaseOS/x86_64/os URL类型 软件库URL 其他路径 # 版本 7 mirrors.aliyun.com/centos/7/os/x86
报错1 [root@slave1 data_mocker]# kafka-console-consumer.sh --bootstrap-server slave1:9092 --topic topic_db [2023-12-19 18:31:12,770] WARN [Consumer clie
错误1 # 重写数据 hive (edu)> insert overwrite table dwd_trade_cart_add_inc > select data.id, > data.user_id, > data.course_id, > date_format(
错误1 hive (edu)> insert into huanhuan values(1,'haoge'); Query ID = root_20240110071417_fe1517ad-3607-41f4-bdcf-d00b98ac443e Total jobs = 1
报错1:执行到如下就不执行了,没有显示Successfully registered new MBean. [root@slave1 bin]# /usr/local/software/flume-1.9.0/bin/flume-ng agent -n a1 -c /usr/local/softwa
虚拟及没有启动任何服务器查看jps会显示jps,如果没有显示任何东西 [root@slave2 ~]# jps 9647 Jps 解决方案 # 进入/tmp查看 [root@slave1 dfs]# cd /tmp [root@slave1 tmp]# ll 总用量 48 drwxr-xr-x. 2
报错1 hive> show databases; OK Failed with exception java.io.IOException:java.lang.RuntimeException: Error in configuring object Time taken: 0.474 se
报错1 [root@localhost ~]# vim -bash: vim: 未找到命令 安装vim yum -y install vim* # 查看是否安装成功 [root@hadoop01 hadoop]# rpm -qa |grep vim vim-X11-7.4.629-8.el7_9.x
修改hadoop配置 vi /usr/local/software/hadoop-2.9.2/etc/hadoop/yarn-site.xml # 添加如下 <configuration> <property> <name>yarn.nodemanager.res