Tag Archives: assembly

Low level code / Assembly

C/C++ Low Level Curriculum 这系列的 blog 简要介绍了(x86上)常用 C++ 的汇编code。 不过注意作者犯了一个比较大的错误:blog 中堆栈相关的汇编示例都是 cdecl,但作者的说明中写的都是 stdcall。应用 callee clean-up 的 stdcall 最显著的特征是用 ret xx 指令在函数返回的同时弹出堆栈,而 caller clean-up 的 cdecl 则直接用 ret 指令。我手上版本的 GCC 和 MSVC 的默认设置都是 cdecl。 实际看代码的话,就算同是 cdecl,GCC 生成的汇编和 MSVC 的也是有些差别的。比如 MSVC 进入函数后立刻 … Continue reading

Posted in Computer and Internet, Programming and Algorithm | Tagged | 1 Comment

Memory ordering & memory barrier

最近很惊异的发现(对称多处理器)ARM 架构的乱序执行技术对内存的读取/写入顺序几乎没有任何保证(嗯,我知道早就old了)。这方面 x86 架构好些,但也有一条: Loads may be reordered with older stores to different locations. 于是第一想到的就是古董的 Peterson lock(这个现在一般是用来说明为何需要处理器加入 test-and-set 之类的指令),代码如下: 果不其然,不管是 ARM 还是 x86,只要是多核心的,程序都会生成错误结果。 补救的方法是使用 memory barrier(或者 memory fence)处理器指令来强制限制内存操作的顺序。在上面的程序中便是 lock 函数中注释掉的两行汇编代码,dmb 是 ARM 的指令,mfence 是 x86 的指令。 虽然 Peterson lock 早已成为遗迹,但现今也还有栽在这个 … Continue reading

Posted in Computer and Internet, Programming and Algorithm | Tagged , | Leave a comment