青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

posts - 9,  comments - 19,  trackbacks - 0

0x0

前些天組里老司機@梁希在jvm的項目榨干機器性能之余,為了檢查下gcc編譯器和Intel Xoen CPU的正確性,寫了一組測試代碼測試了下mfence指令的效果

`
mfence Opcode : 0F AE /6

Performs a serializing operation on all load-from-memory and store-to-memory instructions that were issued prior the MFENCE instruction. This serializing operation guarantees that every load and store instruction that precedes in program order the MFENCE instruction is globally visible before any load or store instruction that follows the MFENCE instruction is globally visible. The MFENCE instruction is ordered with respect to all load and store instructions, other MFENCE instructions, any SFENCE and LFENCE instructions, and any serializing instructions (such as the CPUID instruction).
Weakly ordered memory types can be used to achieve higher processor performance through such techniques as out-of-order issue, speculative reads, write-combining, and write-collapsing.
The degree to which a consumer of data recognizes or knows that the data is weakly ordered varies among applications and may be unknown to the producer of this data. The MFENCE instruction provides a performance-efficient way of ensuring load and store ordering between routines that produce weakly-ordered results and routines that consume that data.
It should be noted that processors are free to speculatively fetch and cache data from system memory regions that are assigned a memory-type that permits speculative reads (that is, the WB, WC, and WT memory types). The PREFETCHh instruction is considered a hint to this speculative behavior. Because this speculative fetching can occur at any time and is not tied to instruction execution, the MFENCE instruction is not ordered with respect to PREFETCHh instructions or any other speculative fetching mechanism (that is, data could be speculatively loaded into the cache just before, during, or after the execution of an MFENCE instruction).
`

簡單來說就是一個可以在CPU亂序執(zhí)行中保證真實的load/store順序的指令

0x1
老司機寫了一個小程序(注:有誤版)
// file: order.c

#define _GNU_SOURCE
#include <pthread.h>
#include <stdio.h>
#include <stdlib.h>
#include <assert.h>

union p64 {
    int i;
    char padding[64];
    long align8;
};

volatile union p64 v1, v2;
int b;

void *
run1(void *ignore)
{
    for (;;) {
        while (!b);
        if (v1.i || v2.i) {
            puts("assert error 1");
            exit(-1);
        }
        v1.i = 1;
        asm ("sfence": : :"memory");
        v2.i = 1;
        asm ("sfence": : :"memory");
        b = 0; 
    }
}

int
main()
{
    pthread_t p;
    pthread_create(&p, NULL, run1, NULL);
    int cnt = 0;

    for (;; cnt++) {
        v1.i = v2.i = 0;
        asm ("sfence": : :"memory");
        b = 1;
        asm ("sfence": : :"memory");
        int icnt = 0;
        for (;; icnt++) {
            int i1 = v1.i;
            asm ("lfence": : :"memory");
            int i2 = v2.i;
            if (i1 && i2)   break;
            if (i1 < i2) {
                printf("assert error, cnt = %d, icnt = %d, i1 = %d, i2 = %d\n", cnt, icnt, i1, i2);
                exit(-1);
            }
        }
    }
    return 0;
}

大概邏輯是: 一共有3個變量,v1.iv2.ib ,起了2個線程,一個順序?qū)懭雟1和v2,一個讀v1和v2,互相通過改變b的值來通訊,然后兩個線程不停循環(huán)。

這個程序會掛在
printf("assert error, cnt = %d, icnt = %d, i1 = %d, i2 = %d\n", cnt, icnt, i1, i2); 
這條斷言上,意思是線程1在順序?qū)懭雟1和v2,但是主線程卻出現(xiàn)讀到 v1=0,v2=1的情況。

0x2

然后我?guī)兔θタ戳艘幌拢X得這種寫法甚是粗暴,于是原樣照搬了一個c++11版:

#include <stdio.h>
#include <stdlib.h>
#include <assert.h>

#include <atomic>
#include <thread>

using namespace std;

union p64 {
    atomic<int> i;
    char padding[64];
    long align8;
};

volatile union p64 v1, v2;
atomic<int> b;

void *
run1()
{
    int rcnt = 0;
    for (;; rcnt++) {
        while (!b.load());
        if (v1.i.load() || v2.i.load()) {
            puts("assert error 1");
            exit(-1);
        }
        v1.i.store(1);
        v2.i.store(1);
        b.store(0);
    }
}

int
main()
{
    // init
    v1.i.store(0);
    v2.i.store(0);
    thread t(run1);
    int cnt = 0;
    for (;; cnt++) {
        v1.i.store(0);
        v2.i.store(0);
        b.store(1);
        int icnt = 0;
        for (;; icnt++) {
            int b2 = b.load();
            int i1 = v1.i.load();       // *****
            int i2 = v2.i.load();       // *****
            if (i1 && i2)   break;
            if (i1 < i2) {
                printf("assert error, cnt = %d, icnt = %d, i1 = %d, i2 = %d\n", cnt, icnt, i1, i2);
                exit(-1);
            }
            if (i1 == 0 && i2 == 0 && b2 == 0) break;
        }
    }
    return 0;
}

因為是原樣照搬,所以肯定還是會掛,但是畢竟語義上更好理解了

我們先來分析一下為什么會掛

  • 線程1對于v1,v2的寫入順序一定是一致的
  • Memory Barrier也保證了他們寫入順序?qū)ζ渌€程的可見性(很有迷惑性的一點)
  • 但是主線程卻可以讀到 v1=0,v2=1的情況
  • 所以情況就是雖然順序?qū)懭肓耍莿e的線程沒有看到正確的順序?
  • Intel: 并不是!
  • 原因是搞錯了因果關(guān)系,他真正保證的順序是當你讀到v2的new value的時候,那么v1也一定被寫入了。
  • 解決方案就是互換上面代碼中我用**星號**標注出的兩行
  • done

在舊寫法中,掛掉的情況是線程1寫入v1 = 1,主線程讀v1,沒有讀到,那么主線程認為v1是0,然后線程1繼續(xù)寫入v2,主線程讀到了,主線程認為v2是1。 然后掛在了斷言上。

兩行互換后,主線程首先讀取v2,如果v2已經(jīng)是1了,那么v1也一定是1,反之亦然。

0x3

當然,想讓跑通那個例子不需要那么多的atomic<>,精簡之后利用c++11的memory_order可以寫成如下:

#include <stdio.h>
#include <stdlib.h>
#include <assert.h>

#include <atomic>
#include <thread>

using namespace std;

union p64 {
    int i;
    char padding[64];
    long align8;
};

volatile union p64 v1, v2;
atomic<int> b;    // variable b as a guard

void *
run1()
{
    int rcnt = 0;
    for (;; rcnt++) {
        while (!b.load());
        if (v1.i || v2.i) {
            puts("assert error 1");
            exit(-1);
        }
        v1.i = 1;
        v2.i = 1;
        b.store(0, memory_order_release);
    }
}
int
main()
{
    // init
    v1.i = 0;
    v2.i = 0;
    thread t(run1);
    int cnt = 0;

    for (;; cnt++) {
        v1.i = 0;
        v2.i = 0;
        b.store(1, memory_order_release);
        int icnt = 0;
        for (;; icnt++) {
            int b2 = b.load(memory_order_acquire);
            if (b2 != 0) {
                continue
            }
            int i1 = v1.i;
            int i2 = v2.i;
            if (i1 && i2)   break;
            if (i1 < i2) {
                printf("assert error 2, cnt = %d, icnt =  %d, i1 = %d, i2 = %d\n", cnt, icnt, i1, i2);
                exit(-1);
            }
        }
    }
    return 0;
}

利用變量b在兩個線程之間同步,如下圖

 (Thead 1)

   v1.i = 1;
   v2.i = 1;
   
   b.store(0, memory_order_release) <---+
                                                             |
                                                synchronize with b
                                                 (happend before)
                                                             |
                                                            +----->  b.load(memory_order_acquire)
                                                                          
                                                                        i1 = v1.i
                                                                        i2 = v2.i

                                                                       (Thread 2)

我們查看下生成的代碼
g++ -std=c++11 -pthread -g -O2 order.cpp

 v1.i = 1;
  400be6:       c7 05 d0 10 20 00 01    movl   $0x1,0x2010d0(%rip)        # 601cc0 <v1>
  400bed:       00 00 00 
        v2.i = 1;
  400bf0:       c7 05 86 10 20 00 01    movl   $0x1,0x201086(%rip)        # 601c80 <v2>
  400bf7:       00 00 00 
        memory_order __b = __m & __memory_order_mask;
        __glibcxx_assert(__b != memory_order_acquire);
        __glibcxx_assert(__b != memory_order_acq_rel);
        __glibcxx_assert(__b != memory_order_consume);

        __atomic_store_n(&_M_i, __i, __m);
  400bfa:       c7 05 5c 10 20 00 00    movl   $0x0,0x20105c(%rip)        # 601c60 <b>
  400c01:       00 00 00 
        b.store(0, memory_order_release);

  

  400a58:       8b 05 02 12 20 00       mov    0x201202(%rip),%eax        # 601c60 <b>
            int b2 = b.load(memory_order_consume);
            if (b2 != 0) {
  400a5e:       85 c0                   test   %eax,%eax
  400a60:       75 f3                   jne    400a55 <main+0x55>
                continue
            }
            int i1 = v1.i;
  400a62:       8b 0d 58 12 20 00       mov    0x201258(%rip),%ecx        # 601cc0 <v1>
            int i2 = v2.i;
  400a68:       44 8b 05 11 12 20 00    mov    0x201211(%rip),%r8d        # 601c80 <v2>

看來Intel的Strong Memory Model已經(jīng)保證了這一點,Memory Barrier都不需要了

(雖然標題里面有MemoryBarrier,但是內(nèi)容里面根本沒涉及的樣子。。)

posted on 2016-01-19 16:13 右席 閱讀(16798) 評論(1)  編輯 收藏 引用 所屬分類: 搬磚之路
青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            99视频一区二区| 亚洲精品国产视频| 亚洲欧洲av一区二区三区久久| 国产精品扒开腿做爽爽爽视频| 性欧美长视频| 久久婷婷av| 亚洲另类黄色| 亚洲自拍电影| 亚洲福利久久| 夜夜夜久久久| 狠狠干综合网| 亚洲理论在线观看| 国产亚洲欧洲一区高清在线观看| 美女成人午夜| 欧美私人啪啪vps| 久久伊伊香蕉| 欧美日韩色婷婷| 久久免费视频观看| 欧美精品在线观看| 久久久久久高潮国产精品视| 欧美国产日本| 久久久www成人免费精品| 欧美激情小视频| 久久精品国产一区二区三区| 欧美精品高清视频| 久久久精品国产一区二区三区| 欧美精品v国产精品v日韩精品| 美女精品在线| 亚洲一区二区免费在线| 老鸭窝毛片一区二区三区| 亚洲欧美一区二区三区久久 | 欧美一区高清| 亚洲精品日产精品乱码不卡| 小辣椒精品导航| 在线午夜精品| 欧美大片一区二区| 久久男人av资源网站| 国产精品久久久| 亚洲国产欧美另类丝袜| 国内精品免费在线观看| 亚洲午夜精品国产| 99精品视频免费观看视频| 久久亚洲精品一区二区| 久久国产精品99久久久久久老狼| 欧美日韩国产探花| 亚洲黄一区二区| 亚洲国产成人精品视频| 久久免费国产精品| 久久香蕉精品| 国内视频一区| 欧美一区久久| 久久精品网址| 国产婷婷精品| 久久成人羞羞网站| 久久久久久久91| 国产主播精品在线| 欧美一区二区成人| 久久久久久久性| 国产一区二区高清不卡| 欧美中在线观看| 久久久久久高潮国产精品视| 国产性色一区二区| 久久国产一区二区| 免费人成网站在线观看欧美高清| 精品成人a区在线观看| 久久动漫亚洲| 久久免费视频网| 亚洲国产乱码最新视频| 欧美mv日韩mv国产网站| 亚洲精品乱码久久久久久按摩观 | 亚洲欧美日韩专区| 国产精品一卡二卡| 欧美在线观看视频一区二区| 久久久一区二区三区| 在线欧美影院| 欧美日韩国产成人高清视频| 一区二区三区你懂的| 欧美一区综合| 在线观看国产精品淫| 欧美二区视频| 亚洲午夜视频| 久久综合99re88久久爱| 亚洲精品乱码久久久久久| 欧美日韩美女| 欧美资源在线观看| 亚洲国产日韩一级| 欧美一区二区免费| 亚洲韩国青草视频| 欧美性片在线观看| 久久精品人人做人人爽电影蜜月| 国产精品网站在线观看| 久久国产精品亚洲77777| 亚洲国产欧美在线| 欧美一区日韩一区| 亚洲精品一级| 国产亚洲成av人片在线观看桃| 噜噜噜久久亚洲精品国产品小说| 亚洲精选91| 久久这里只精品最新地址| 一本色道久久综合亚洲精品小说| 国产视频欧美视频| 欧美精品在线观看| 久久久久久香蕉网| 亚洲资源av| 99re6这里只有精品视频在线观看| 欧美一级大片在线观看| 99精品视频一区二区三区| 国产综合色在线| 国产精品狼人久久影院观看方式| 狼人社综合社区| 欧美一级专区免费大片| 一区二区三区导航| 暖暖成人免费视频| 久久www免费人成看片高清| 一本一本大道香蕉久在线精品| 国产一区二区三区免费观看| 欧美性猛交一区二区三区精品| 欧美插天视频在线播放| 久久久久.com| 欧美一级大片在线观看| 亚洲一区二区三区四区视频| 亚洲精品乱码久久久久久蜜桃麻豆 | 免费在线观看精品| 久久精品视频在线| 亚洲欧美三级在线| 亚洲一级免费视频| 一区二区三区产品免费精品久久75| 欧美激情中文字幕在线| 欧美刺激午夜性久久久久久久| 久久美女艺术照精彩视频福利播放| 午夜国产精品视频免费体验区| 一区二区三区四区五区在线| 日韩午夜电影av| 一本一本久久a久久精品综合麻豆| 亚洲韩国精品一区| 亚洲区一区二| 亚洲精品日本| 中文一区二区在线观看| 99国产精品国产精品久久| 亚洲精品欧美一区二区三区| 亚洲理伦在线| 亚洲一区二区三区777| 亚洲午夜久久久| 亚洲欧美视频一区| 欧美在线观看一区| 欧美激情在线免费观看| 欧美国产日韩二区| 欧美日韩免费一区| 国产精品久久久久久久浪潮网站 | 亚洲欧美日韩综合一区| 欧美一区二区三区婷婷月色| 久久国产日韩| 免费亚洲网站| 亚洲日本中文字幕免费在线不卡| 亚洲精品影视在线观看| 一本色道久久综合亚洲精品高清| 亚洲视频狠狠| 久久久久综合网| 欧美日韩第一页| 国产精品一区二区三区四区| 激情婷婷久久| 99精品热视频| 久久久99国产精品免费| 亚洲国产精品第一区二区| 99国产欧美久久久精品| 欧美一级片一区| 欧美高清hd18日本| 国产精品一二一区| 亚洲第一狼人社区| 亚洲一区二区在线看| 久久精品国产视频| 亚洲国产精品视频| 午夜精品视频| 欧美精品一二三| 国产人久久人人人人爽| 亚洲精品在线免费观看视频| 午夜老司机精品| 亚洲国产精品成人久久综合一区| 亚洲伊人第一页| 欧美成在线视频| 国产视频精品网| 一片黄亚洲嫩模| 免费国产一区二区| 亚洲一区免费看| 欧美成人自拍| 在线成人国产| 性欧美在线看片a免费观看| 亚洲国产片色| 久久久www成人免费精品| 国产精品高潮呻吟久久av黑人| 亚洲高清视频的网址| 欧美在线观看天堂一区二区三区 | 欧美国产日韩免费| 午夜国产一区| 欧美性理论片在线观看片免费| 亚洲国产欧美不卡在线观看| 久久久久国内| 亚洲一区在线播放| 欧美日韩免费观看一区二区三区 | 亚洲私人黄色宅男|