青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

posts - 9,  comments - 19,  trackbacks - 0

0x0

前些天組里老司機@梁希在jvm的項目榨干機器性能之余,為了檢查下gcc編譯器和Intel Xoen CPU的正確性,寫了一組測試代碼測試了下mfence指令的效果

`
mfence Opcode : 0F AE /6

Performs a serializing operation on all load-from-memory and store-to-memory instructions that were issued prior the MFENCE instruction. This serializing operation guarantees that every load and store instruction that precedes in program order the MFENCE instruction is globally visible before any load or store instruction that follows the MFENCE instruction is globally visible. The MFENCE instruction is ordered with respect to all load and store instructions, other MFENCE instructions, any SFENCE and LFENCE instructions, and any serializing instructions (such as the CPUID instruction).
Weakly ordered memory types can be used to achieve higher processor performance through such techniques as out-of-order issue, speculative reads, write-combining, and write-collapsing.
The degree to which a consumer of data recognizes or knows that the data is weakly ordered varies among applications and may be unknown to the producer of this data. The MFENCE instruction provides a performance-efficient way of ensuring load and store ordering between routines that produce weakly-ordered results and routines that consume that data.
It should be noted that processors are free to speculatively fetch and cache data from system memory regions that are assigned a memory-type that permits speculative reads (that is, the WB, WC, and WT memory types). The PREFETCHh instruction is considered a hint to this speculative behavior. Because this speculative fetching can occur at any time and is not tied to instruction execution, the MFENCE instruction is not ordered with respect to PREFETCHh instructions or any other speculative fetching mechanism (that is, data could be speculatively loaded into the cache just before, during, or after the execution of an MFENCE instruction).
`

簡單來說就是一個可以在CPU亂序執行中保證真實的load/store順序的指令

0x1
老司機寫了一個小程序(注:有誤版)
// file: order.c

#define _GNU_SOURCE
#include <pthread.h>
#include <stdio.h>
#include <stdlib.h>
#include <assert.h>

union p64 {
    int i;
    char padding[64];
    long align8;
};

volatile union p64 v1, v2;
int b;

void *
run1(void *ignore)
{
    for (;;) {
        while (!b);
        if (v1.i || v2.i) {
            puts("assert error 1");
            exit(-1);
        }
        v1.i = 1;
        asm ("sfence": : :"memory");
        v2.i = 1;
        asm ("sfence": : :"memory");
        b = 0; 
    }
}

int
main()
{
    pthread_t p;
    pthread_create(&p, NULL, run1, NULL);
    int cnt = 0;

    for (;; cnt++) {
        v1.i = v2.i = 0;
        asm ("sfence": : :"memory");
        b = 1;
        asm ("sfence": : :"memory");
        int icnt = 0;
        for (;; icnt++) {
            int i1 = v1.i;
            asm ("lfence": : :"memory");
            int i2 = v2.i;
            if (i1 && i2)   break;
            if (i1 < i2) {
                printf("assert error, cnt = %d, icnt = %d, i1 = %d, i2 = %d\n", cnt, icnt, i1, i2);
                exit(-1);
            }
        }
    }
    return 0;
}

大概邏輯是: 一共有3個變量,v1.iv2.ib ,起了2個線程,一個順序寫入v1和v2,一個讀v1和v2,互相通過改變b的值來通訊,然后兩個線程不停循環。

這個程序會掛在
printf("assert error, cnt = %d, icnt = %d, i1 = %d, i2 = %d\n", cnt, icnt, i1, i2); 
這條斷言上,意思是線程1在順序寫入v1和v2,但是主線程卻出現讀到 v1=0,v2=1的情況。

0x2

然后我幫忙去看了一下,覺得這種寫法甚是粗暴,于是原樣照搬了一個c++11版:

#include <stdio.h>
#include <stdlib.h>
#include <assert.h>

#include <atomic>
#include <thread>

using namespace std;

union p64 {
    atomic<int> i;
    char padding[64];
    long align8;
};

volatile union p64 v1, v2;
atomic<int> b;

void *
run1()
{
    int rcnt = 0;
    for (;; rcnt++) {
        while (!b.load());
        if (v1.i.load() || v2.i.load()) {
            puts("assert error 1");
            exit(-1);
        }
        v1.i.store(1);
        v2.i.store(1);
        b.store(0);
    }
}

int
main()
{
    // init
    v1.i.store(0);
    v2.i.store(0);
    thread t(run1);
    int cnt = 0;
    for (;; cnt++) {
        v1.i.store(0);
        v2.i.store(0);
        b.store(1);
        int icnt = 0;
        for (;; icnt++) {
            int b2 = b.load();
            int i1 = v1.i.load();       // *****
            int i2 = v2.i.load();       // *****
            if (i1 && i2)   break;
            if (i1 < i2) {
                printf("assert error, cnt = %d, icnt = %d, i1 = %d, i2 = %d\n", cnt, icnt, i1, i2);
                exit(-1);
            }
            if (i1 == 0 && i2 == 0 && b2 == 0) break;
        }
    }
    return 0;
}

因為是原樣照搬,所以肯定還是會掛,但是畢竟語義上更好理解了

我們先來分析一下為什么會掛

  • 線程1對于v1,v2的寫入順序一定是一致的
  • Memory Barrier也保證了他們寫入順序對其他線程的可見性(很有迷惑性的一點)
  • 但是主線程卻可以讀到 v1=0,v2=1的情況
  • 所以情況就是雖然順序寫入了,但是別的線程沒有看到正確的順序?
  • Intel: 并不是!
  • 原因是搞錯了因果關系,他真正保證的順序是當你讀到v2的new value的時候,那么v1也一定被寫入了。
  • 解決方案就是互換上面代碼中我用**星號**標注出的兩行
  • done

在舊寫法中,掛掉的情況是線程1寫入v1 = 1,主線程讀v1,沒有讀到,那么主線程認為v1是0,然后線程1繼續寫入v2,主線程讀到了,主線程認為v2是1。 然后掛在了斷言上。

兩行互換后,主線程首先讀取v2,如果v2已經是1了,那么v1也一定是1,反之亦然。

0x3

當然,想讓跑通那個例子不需要那么多的atomic<>,精簡之后利用c++11的memory_order可以寫成如下:

#include <stdio.h>
#include <stdlib.h>
#include <assert.h>

#include <atomic>
#include <thread>

using namespace std;

union p64 {
    int i;
    char padding[64];
    long align8;
};

volatile union p64 v1, v2;
atomic<int> b;    // variable b as a guard

void *
run1()
{
    int rcnt = 0;
    for (;; rcnt++) {
        while (!b.load());
        if (v1.i || v2.i) {
            puts("assert error 1");
            exit(-1);
        }
        v1.i = 1;
        v2.i = 1;
        b.store(0, memory_order_release);
    }
}
int
main()
{
    // init
    v1.i = 0;
    v2.i = 0;
    thread t(run1);
    int cnt = 0;

    for (;; cnt++) {
        v1.i = 0;
        v2.i = 0;
        b.store(1, memory_order_release);
        int icnt = 0;
        for (;; icnt++) {
            int b2 = b.load(memory_order_acquire);
            if (b2 != 0) {
                continue
            }
            int i1 = v1.i;
            int i2 = v2.i;
            if (i1 && i2)   break;
            if (i1 < i2) {
                printf("assert error 2, cnt = %d, icnt =  %d, i1 = %d, i2 = %d\n", cnt, icnt, i1, i2);
                exit(-1);
            }
        }
    }
    return 0;
}

利用變量b在兩個線程之間同步,如下圖

 (Thead 1)

   v1.i = 1;
   v2.i = 1;
   
   b.store(0, memory_order_release) <---+
                                                             |
                                                synchronize with b
                                                 (happend before)
                                                             |
                                                            +----->  b.load(memory_order_acquire)
                                                                          
                                                                        i1 = v1.i
                                                                        i2 = v2.i

                                                                       (Thread 2)

我們查看下生成的代碼
g++ -std=c++11 -pthread -g -O2 order.cpp

 v1.i = 1;
  400be6:       c7 05 d0 10 20 00 01    movl   $0x1,0x2010d0(%rip)        # 601cc0 <v1>
  400bed:       00 00 00 
        v2.i = 1;
  400bf0:       c7 05 86 10 20 00 01    movl   $0x1,0x201086(%rip)        # 601c80 <v2>
  400bf7:       00 00 00 
        memory_order __b = __m & __memory_order_mask;
        __glibcxx_assert(__b != memory_order_acquire);
        __glibcxx_assert(__b != memory_order_acq_rel);
        __glibcxx_assert(__b != memory_order_consume);

        __atomic_store_n(&_M_i, __i, __m);
  400bfa:       c7 05 5c 10 20 00 00    movl   $0x0,0x20105c(%rip)        # 601c60 <b>
  400c01:       00 00 00 
        b.store(0, memory_order_release);

  

  400a58:       8b 05 02 12 20 00       mov    0x201202(%rip),%eax        # 601c60 <b>
            int b2 = b.load(memory_order_consume);
            if (b2 != 0) {
  400a5e:       85 c0                   test   %eax,%eax
  400a60:       75 f3                   jne    400a55 <main+0x55>
                continue
            }
            int i1 = v1.i;
  400a62:       8b 0d 58 12 20 00       mov    0x201258(%rip),%ecx        # 601cc0 <v1>
            int i2 = v2.i;
  400a68:       44 8b 05 11 12 20 00    mov    0x201211(%rip),%r8d        # 601c80 <v2>

看來Intel的Strong Memory Model已經保證了這一點,Memory Barrier都不需要了

(雖然標題里面有MemoryBarrier,但是內容里面根本沒涉及的樣子。。)

posted on 2016-01-19 16:13 右席 閱讀(16808) 評論(1)  編輯 收藏 引用 所屬分類: 搬磚之路
青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            久久精品亚洲精品| 久久米奇亚洲| 日韩午夜免费视频| 欧美日韩国产成人在线观看| 一本色道久久加勒比88综合| 亚洲精品国产精品国产自| 欧美福利视频一区| 一区二区三区高清在线| 一区二区三区精品视频| 欧美视频中文一区二区三区在线观看| 在线综合欧美| 亚洲一区亚洲二区| 激情偷拍久久| 亚洲免费观看高清完整版在线观看| 欧美日韩网址| 久久久99精品免费观看不卡| 久久一区视频| 亚洲婷婷综合久久一本伊一区| 亚洲图片激情小说| 激情av一区二区| 日韩一二三区视频| 国内精品久久久| 亚洲另类一区二区| 国产精品亚洲综合一区在线观看| 久久久夜夜夜| 欧美日韩免费在线| 久久色在线播放| 欧美日韩亚洲另类| 久久躁日日躁aaaaxxxx| 欧美日韩国产经典色站一区二区三区| 欧美在线播放视频| 欧美精品一区二区三区久久久竹菊| 午夜伦理片一区| 欧美成人午夜视频| 久久九九国产精品| 欧美视频中文一区二区三区在线观看 | 欧美激情在线| 久久激情网站| 欧美视频在线观看 亚洲欧| 久久久久久噜噜噜久久久精品| 欧美日韩国产精品专区| 蜜臀91精品一区二区三区| 国产精品久久久久久超碰| 欧美国产欧美亚洲国产日韩mv天天看完整 | 欧美mv日韩mv国产网站app| 欧美色另类天堂2015| 亚洲大片av| 影院欧美亚洲| 欧美亚洲一级| 欧美影片第一页| 国产精品v欧美精品v日本精品动漫| 欧美成年人视频网站欧美| 国产精品日韩电影| 一本久道综合久久精品| 亚洲伦理在线观看| 牛牛精品成人免费视频| 毛片一区二区三区| 韩国福利一区| 久久精品水蜜桃av综合天堂| 午夜久久黄色| 国产精品国产福利国产秒拍| 亚洲精品综合久久中文字幕| 亚洲精品色图| 欧美另类videos死尸| 亚洲福利国产精品| 亚洲精品国精品久久99热| 久久久久女教师免费一区| 久久综合九色99| 一区二区三区在线不卡| 久久久91精品国产| 男男成人高潮片免费网站| 亚洲电影免费观看高清| 久久午夜精品| 亚洲国产一区二区a毛片| 日韩视频一区二区三区| 欧美区高清在线| 99国产精品久久| 午夜精品国产| 狠狠色伊人亚洲综合成人| 久久夜色精品一区| 亚洲电影观看| 亚洲无限乱码一二三四麻| 国产精品av免费在线观看| 午夜国产精品视频| 久久夜色精品亚洲噜噜国产mv| 亚洲福利久久| 欧美精品在线免费观看| 中文精品视频| 久久久久久久网| 亚洲精品久久嫩草网站秘色| 欧美日韩在线一区| 欧美一区二区三区视频免费| 欧美成人黄色小视频| 在线一区二区视频| 国内精品久久久久影院 日本资源| 久久久久99精品国产片| 亚洲欧洲在线观看| 欧美一区综合| 亚洲精品国精品久久99热| 国产精品va在线播放我和闺蜜| 欧美一区影院| 亚洲精品免费一二三区| 午夜久久一区| 亚洲精品护士| 国产亚洲精品久久久久婷婷瑜伽| 浪潮色综合久久天堂| 亚洲图片激情小说| 欧美激情亚洲综合一区| 欧美一级片在线播放| 亚洲精品国产精品国自产观看| 国产精品亚洲一区| 欧美日韩免费观看一区=区三区| 亚洲欧美中日韩| 最近看过的日韩成人| 久久久久www| 亚洲午夜精品视频| 亚洲破处大片| 一区二区三区中文在线观看 | 性久久久久久| 一区二区三区国产精品| 欧美国产精品专区| 久久综合一区| 久久久国产精品一区| 亚洲自拍偷拍一区| 日韩一级视频免费观看在线| 伊人久久男人天堂| 国产欧美日韩在线视频| 欧美日韩三级一区二区| 欧美大片在线观看一区| 久久全国免费视频| 久久激情视频| 久久精品99无色码中文字幕| 亚洲婷婷综合色高清在线| 日韩视频一区二区三区在线播放免费观看 | 1024国产精品| 狠狠色狠狠色综合日日tαg | 国产精品一卡二卡| 欧美日韩国产一中文字不卡| 免费不卡在线视频| 久久免费视频这里只有精品| 久久9热精品视频| 久久精品主播| 久久久国产一区二区三区| 欧美亚洲日本国产| 欧美一区1区三区3区公司| 亚洲欧美中文在线视频| 欧美一区二区久久久| 欧美一区三区二区在线观看| 欧美中文在线观看国产| 欧美一级艳片视频免费观看| 欧美亚洲视频| 久久亚洲国产精品日日av夜夜| 久久久久国产精品一区| 蜜臀久久99精品久久久久久9 | 美国成人直播| 欧美护士18xxxxhd| 欧美日韩国产页| 国产精品麻豆成人av电影艾秋| 国产精品私人影院| 国产综合精品| 亚洲精品乱码久久久久久黑人| 日韩亚洲欧美在线观看| 亚洲综合久久久久| 久久国产精品亚洲va麻豆| 美女国产精品| 亚洲美女网站| 性娇小13――14欧美| 久色成人在线| 欧美三级特黄| 国产视频在线观看一区二区| 樱花yy私人影院亚洲| 99国产精品自拍| 久久精品日产第一区二区| 巨乳诱惑日韩免费av| 亚洲精品无人区| 欧美亚洲综合久久| 免费久久精品视频| 国产精品豆花视频| 雨宫琴音一区二区在线| 亚洲图片激情小说| 久久深夜福利免费观看| 亚洲人成在线观看网站高清| 亚洲一区二区综合| 牛人盗摄一区二区三区视频| 国产精品美女久久久| 亚洲国产精品久久久久秋霞不卡 | 香蕉国产精品偷在线观看不卡| 开元免费观看欧美电视剧网站| 亚洲国产高清在线观看视频| 午夜精品久久99蜜桃的功能介绍| 久久中文字幕一区二区三区| 欧美午夜久久| 亚洲欧洲一区二区在线播放| 欧美在线视频在线播放完整版免费观看| 久久综合九色综合欧美就去吻| 一区二区三区久久| 欧美成人首页| 亚洲大胆女人| 久久精品二区三区| 一区二区三区四区五区精品视频|