手机版
热门标签
站点地图
我要投稿
广告合作
联系我们
搜 索
广告位招租
广告位招租
切换导航
首页
编程教程
编程导航
编程百科
编程问答
编程博文
编程实例
硬件设备
网络运营
软件教程
移动数码
办公软件
操作系统
网络运维
设计教程
技术频道
▸ 编程语言
▸ 前端开发
▸ 移动开发
▸ 开发工具
▸ 程序设计
▸ 行业应用
▸ CMS系统
▸ 服务器
▸ 数据库
公众号推荐
微信公众号搜
"智元新知"
关注
微信扫一扫可直接关注哦!
micro-optimization
micro-optimization专题提供micro-optimization的最新资讯内容,帮你更好的了解micro-optimization。
了解vpermd或vpermps的优化顺序
基本上,假设您在编译时有一个置换索引列表,我试图了解x86_64的最佳指令选择顺序。 我了解大多
作者:佚名 时间:2022-06-04
将DWORD广播到YMM
我只是想知道下面的代码: <pre><code>mov eax, r9d ; eax = j mul n ; eax = n * j shl eax, 2 ; eax = 4 * n
作者:佚名 时间:2022-06-04
Y86体系结构立即VS寄存器算术效率问题
我正在与Y86程序的计算机体系结构类中的团队合作,以实现乘法函数imul。我们有一段有效的代码,但是
作者:佚名 时间:2022-06-03
返回Vs指针
这两种情况之间的性能会有多少不同? <pre><code>int func(int a, int b) { return a + b; } </code></pre> 和 <pre
作者:佚名 时间:2022-06-03
为什么使用寄存器R12时POP慢?
在最近的Intel CPU上,<code>POP</code>指令通常每个周期2条指令的吞吐量。但是,当使用寄存器<code>R12</code>
作者:佚名 时间:2022-06-03
使用内存映射文件在 C++ 中解析二进制文件太慢
我正在尝试以整数方式解析二进制文件,以检查整数值是否满足特定条件,但循环非常慢。 此外,
作者:佚名 时间:2022-06-02
AVX2 代码不能比 gcc 基础优化更快
我正在通过使用内联汇编编写 AVX 代码来学习 AVX。在这种情况下,我尝试在一个简单的函数中实现 AVX。
作者:佚名 时间:2022-06-02
C++ 中什么更快:mod (%) 或其他计数器? 使用递减计数器
冒着重复的风险,也许我现在找不到类似的帖子: 我正在用 C++ 编写(具体来说是 C++20)。我有一
作者:佚名 时间:2022-06-01
长度更改前缀 (LCP) 是否会导致简单的 x86_64 指令停顿?
考虑一个简单的指令,比如 <pre><code>mov RCX, RDI # 48 89 f9 </code></pre> 48 是 x86_64 的 REX 前缀。它<
作者:佚名 时间:2022-06-01
试图在常量大小/对齐指针上理解 clang/gcc __builtin_memset
基本上我试图理解为什么 gcc/clang 都使用 <code>xmm</code> 寄存器作为它们的 <code>__builtin_memset</code>,即使内
作者:佚名 时间:2022-06-01
理解`_mm_prefetch`
答案 <a href="https://stackoverflow.com/questions/46521694/what-are-mm-prefetch-locality-hints">What are _mm_prefetch() locality hints?
作者:佚名 时间:2022-05-31
优化这种“巧合搜索”算法,以提高速度
我编写了一个算法,旨在模拟实验产生的数据,然后对该数据执行“巧合搜索”(稍后会详细介绍...)
作者:佚名 时间:2022-05-31
在 C 中访问结构成员的速度有多快?
访问结构成员的过程是否比访问直接变量慢?如果我在多个地方使用了相同的 struct 成员,我是否应该在
作者:佚名 时间:2022-05-31
操纵 mips 汇编代码以降低缓存未命中率火星模拟器
如何优化汇编代码以降低缓存的未命中率?我知道更改放置策略/块大小/块替换策略会影响缓存未命中率
作者:佚名 时间:2022-05-30
ARM 汇编优化 - 基础
<pre><code>LDR R1, a LDR R2, b MOV R0, #0 loop ADD R0, R0, R1 SUB R2, R2, #1 CMP R2, #0 BNE loop STR R0, c </code></pre> <ol> <li>说明
作者:佚名 时间:2022-05-29
为什么某些 Windows booloader 代码使用 `sub` 而不是 `xor` 将寄存器归零?
鉴于 <a href="https://stackoverflow.com/a/33668295">https://stackoverflow.com/a/33668295</a> 中详述的考虑因素,似乎 <code>xo
作者:佚名 时间:2022-05-29
在 Coffee Lake (Skylake) 上进行 bigint 乘法的第一步中,ADD 比 ADC 慢
将下面突出显示的行中的 <code>add</code> 更改为 <code>adc</code> 可显着<strong>提高</strong>性能。我觉得这很违
作者:佚名 时间:2022-05-28
过度工程:在 Rust 中的 HashMap 键上使用引用借用?
我正在制作一个搜索算法 (BFS/DFS) 来搜索游戏状态树。 我已经用 C 语言完成了这个东西,但我想知道 Rust
作者:佚名 时间:2022-05-28
如何确定哪个 x86-64 (SSE) 指令更有效?
我想优化我的 x86-64 程序。 我如何确定哪些指令是“最好的”? 如何衡量某一段汇编代码比另一段快?<
作者:佚名 时间:2022-05-28
不一致的`perf annotate`内存加载/存储时间报告
我很难理解英特尔性能事件报告。 考虑以下主要读取/写入内存的简单程序: <pre><code>#include <
作者:佚名 时间:2022-05-28
上一页
1
2
3
4
5
下一页
小编推荐
苹果市值2025年有望达4万亿美元
• 苹果iPhone屏幕划痕如何去除?7个法子可
• iPhone SE 4首发!苹果自研5G基带第一个
• 史无前例:iPhone 16系列电池容量公布
• 首批iPhone 16在路上了!苹果已发货 明
• 绝!iPhone16开卖:北京上海用户暴雨中
• iPhone 18用上台积电2nm芯片!但苹果又
• 粉碎不支持iPhone谣言!微信官宣:朋友
热门标签
更多
python
JavaScript
java
HTML
PHP
reactjs
C#
Android
CSS
Node.js
sql
r
python-3.x
MysqL
jQuery
c++
pandas
Flutter
angular
IOS
django
linux
swift
typescript
路由器
JSON
路由器设置
无线路由器
h3c
华三
华三路由器设置
华三路由器
电脑软件教程
arrays
docker
软件图文教程
C
vue.js
laravel
spring-boot