青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

posts - 9,  comments - 19,  trackbacks - 0

0x0

前些天組里老司機@梁希在jvm的項目榨干機器性能之余,為了檢查下gcc編譯器和Intel Xoen CPU的正確性,寫了一組測試代碼測試了下mfence指令的效果

`
mfence Opcode : 0F AE /6

Performs a serializing operation on all load-from-memory and store-to-memory instructions that were issued prior the MFENCE instruction. This serializing operation guarantees that every load and store instruction that precedes in program order the MFENCE instruction is globally visible before any load or store instruction that follows the MFENCE instruction is globally visible. The MFENCE instruction is ordered with respect to all load and store instructions, other MFENCE instructions, any SFENCE and LFENCE instructions, and any serializing instructions (such as the CPUID instruction).
Weakly ordered memory types can be used to achieve higher processor performance through such techniques as out-of-order issue, speculative reads, write-combining, and write-collapsing.
The degree to which a consumer of data recognizes or knows that the data is weakly ordered varies among applications and may be unknown to the producer of this data. The MFENCE instruction provides a performance-efficient way of ensuring load and store ordering between routines that produce weakly-ordered results and routines that consume that data.
It should be noted that processors are free to speculatively fetch and cache data from system memory regions that are assigned a memory-type that permits speculative reads (that is, the WB, WC, and WT memory types). The PREFETCHh instruction is considered a hint to this speculative behavior. Because this speculative fetching can occur at any time and is not tied to instruction execution, the MFENCE instruction is not ordered with respect to PREFETCHh instructions or any other speculative fetching mechanism (that is, data could be speculatively loaded into the cache just before, during, or after the execution of an MFENCE instruction).
`

簡單來說就是一個可以在CPU亂序執(zhí)行中保證真實的load/store順序的指令

0x1
老司機寫了一個小程序(注:有誤版)
// file: order.c

#define _GNU_SOURCE
#include <pthread.h>
#include <stdio.h>
#include <stdlib.h>
#include <assert.h>

union p64 {
    int i;
    char padding[64];
    long align8;
};

volatile union p64 v1, v2;
int b;

void *
run1(void *ignore)
{
    for (;;) {
        while (!b);
        if (v1.i || v2.i) {
            puts("assert error 1");
            exit(-1);
        }
        v1.i = 1;
        asm ("sfence": : :"memory");
        v2.i = 1;
        asm ("sfence": : :"memory");
        b = 0; 
    }
}

int
main()
{
    pthread_t p;
    pthread_create(&p, NULL, run1, NULL);
    int cnt = 0;

    for (;; cnt++) {
        v1.i = v2.i = 0;
        asm ("sfence": : :"memory");
        b = 1;
        asm ("sfence": : :"memory");
        int icnt = 0;
        for (;; icnt++) {
            int i1 = v1.i;
            asm ("lfence": : :"memory");
            int i2 = v2.i;
            if (i1 && i2)   break;
            if (i1 < i2) {
                printf("assert error, cnt = %d, icnt = %d, i1 = %d, i2 = %d\n", cnt, icnt, i1, i2);
                exit(-1);
            }
        }
    }
    return 0;
}

大概邏輯是: 一共有3個變量,v1.iv2.ib ,起了2個線程,一個順序?qū)懭雟1和v2,一個讀v1和v2,互相通過改變b的值來通訊,然后兩個線程不停循環(huán)。

這個程序會掛在
printf("assert error, cnt = %d, icnt = %d, i1 = %d, i2 = %d\n", cnt, icnt, i1, i2); 
這條斷言上,意思是線程1在順序?qū)懭雟1和v2,但是主線程卻出現(xiàn)讀到 v1=0,v2=1的情況。

0x2

然后我?guī)兔θタ戳艘幌拢X得這種寫法甚是粗暴,于是原樣照搬了一個c++11版:

#include <stdio.h>
#include <stdlib.h>
#include <assert.h>

#include <atomic>
#include <thread>

using namespace std;

union p64 {
    atomic<int> i;
    char padding[64];
    long align8;
};

volatile union p64 v1, v2;
atomic<int> b;

void *
run1()
{
    int rcnt = 0;
    for (;; rcnt++) {
        while (!b.load());
        if (v1.i.load() || v2.i.load()) {
            puts("assert error 1");
            exit(-1);
        }
        v1.i.store(1);
        v2.i.store(1);
        b.store(0);
    }
}

int
main()
{
    // init
    v1.i.store(0);
    v2.i.store(0);
    thread t(run1);
    int cnt = 0;
    for (;; cnt++) {
        v1.i.store(0);
        v2.i.store(0);
        b.store(1);
        int icnt = 0;
        for (;; icnt++) {
            int b2 = b.load();
            int i1 = v1.i.load();       // *****
            int i2 = v2.i.load();       // *****
            if (i1 && i2)   break;
            if (i1 < i2) {
                printf("assert error, cnt = %d, icnt = %d, i1 = %d, i2 = %d\n", cnt, icnt, i1, i2);
                exit(-1);
            }
            if (i1 == 0 && i2 == 0 && b2 == 0) break;
        }
    }
    return 0;
}

因為是原樣照搬,所以肯定還是會掛,但是畢竟語義上更好理解了

我們先來分析一下為什么會掛

  • 線程1對于v1,v2的寫入順序一定是一致的
  • Memory Barrier也保證了他們寫入順序?qū)ζ渌€程的可見性(很有迷惑性的一點)
  • 但是主線程卻可以讀到 v1=0,v2=1的情況
  • 所以情況就是雖然順序?qū)懭肓耍莿e的線程沒有看到正確的順序?
  • Intel: 并不是!
  • 原因是搞錯了因果關(guān)系,他真正保證的順序是當你讀到v2的new value的時候,那么v1也一定被寫入了。
  • 解決方案就是互換上面代碼中我用**星號**標注出的兩行
  • done

在舊寫法中,掛掉的情況是線程1寫入v1 = 1,主線程讀v1,沒有讀到,那么主線程認為v1是0,然后線程1繼續(xù)寫入v2,主線程讀到了,主線程認為v2是1。 然后掛在了斷言上。

兩行互換后,主線程首先讀取v2,如果v2已經(jīng)是1了,那么v1也一定是1,反之亦然。

0x3

當然,想讓跑通那個例子不需要那么多的atomic<>,精簡之后利用c++11的memory_order可以寫成如下:

#include <stdio.h>
#include <stdlib.h>
#include <assert.h>

#include <atomic>
#include <thread>

using namespace std;

union p64 {
    int i;
    char padding[64];
    long align8;
};

volatile union p64 v1, v2;
atomic<int> b;    // variable b as a guard

void *
run1()
{
    int rcnt = 0;
    for (;; rcnt++) {
        while (!b.load());
        if (v1.i || v2.i) {
            puts("assert error 1");
            exit(-1);
        }
        v1.i = 1;
        v2.i = 1;
        b.store(0, memory_order_release);
    }
}
int
main()
{
    // init
    v1.i = 0;
    v2.i = 0;
    thread t(run1);
    int cnt = 0;

    for (;; cnt++) {
        v1.i = 0;
        v2.i = 0;
        b.store(1, memory_order_release);
        int icnt = 0;
        for (;; icnt++) {
            int b2 = b.load(memory_order_acquire);
            if (b2 != 0) {
                continue
            }
            int i1 = v1.i;
            int i2 = v2.i;
            if (i1 && i2)   break;
            if (i1 < i2) {
                printf("assert error 2, cnt = %d, icnt =  %d, i1 = %d, i2 = %d\n", cnt, icnt, i1, i2);
                exit(-1);
            }
        }
    }
    return 0;
}

利用變量b在兩個線程之間同步,如下圖

 (Thead 1)

   v1.i = 1;
   v2.i = 1;
   
   b.store(0, memory_order_release) <---+
                                                             |
                                                synchronize with b
                                                 (happend before)
                                                             |
                                                            +----->  b.load(memory_order_acquire)
                                                                          
                                                                        i1 = v1.i
                                                                        i2 = v2.i

                                                                       (Thread 2)

我們查看下生成的代碼
g++ -std=c++11 -pthread -g -O2 order.cpp

 v1.i = 1;
  400be6:       c7 05 d0 10 20 00 01    movl   $0x1,0x2010d0(%rip)        # 601cc0 <v1>
  400bed:       00 00 00 
        v2.i = 1;
  400bf0:       c7 05 86 10 20 00 01    movl   $0x1,0x201086(%rip)        # 601c80 <v2>
  400bf7:       00 00 00 
        memory_order __b = __m & __memory_order_mask;
        __glibcxx_assert(__b != memory_order_acquire);
        __glibcxx_assert(__b != memory_order_acq_rel);
        __glibcxx_assert(__b != memory_order_consume);

        __atomic_store_n(&_M_i, __i, __m);
  400bfa:       c7 05 5c 10 20 00 00    movl   $0x0,0x20105c(%rip)        # 601c60 <b>
  400c01:       00 00 00 
        b.store(0, memory_order_release);

  

  400a58:       8b 05 02 12 20 00       mov    0x201202(%rip),%eax        # 601c60 <b>
            int b2 = b.load(memory_order_consume);
            if (b2 != 0) {
  400a5e:       85 c0                   test   %eax,%eax
  400a60:       75 f3                   jne    400a55 <main+0x55>
                continue
            }
            int i1 = v1.i;
  400a62:       8b 0d 58 12 20 00       mov    0x201258(%rip),%ecx        # 601cc0 <v1>
            int i2 = v2.i;
  400a68:       44 8b 05 11 12 20 00    mov    0x201211(%rip),%r8d        # 601c80 <v2>

看來Intel的Strong Memory Model已經(jīng)保證了這一點,Memory Barrier都不需要了

(雖然標題里面有MemoryBarrier,但是內(nèi)容里面根本沒涉及的樣子。。)

posted on 2016-01-19 16:13 右席 閱讀(16812) 評論(1)  編輯 收藏 引用 所屬分類: 搬磚之路
青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            久久一二三四| 欧美三级网址| 亚洲福利专区| 亚洲大片在线| 欧美成年人视频网站欧美| 日韩视频精品在线观看| 亚洲精品美女在线| 欧美性视频网站| 亚洲欧美一区二区三区在线| 亚洲欧美中文日韩v在线观看| 国产精一区二区三区| 久久国产99| 久久影视精品| 一区二区久久| 午夜精品久久久久久久久久久久久| 国产深夜精品福利| 欧美国产成人在线| 欧美日韩第一区日日骚| 欧美在线啊v一区| 久久综合久久久久88| 一区二区高清视频在线观看| 亚洲欧美日本在线| 亚洲国产精品电影在线观看| 夜夜嗨av一区二区三区| 国产一区二区观看| 亚洲精品美女91| 国产一区欧美| 亚洲精品日韩久久| 国产一区二区三区在线免费观看| 亚洲电影免费观看高清| 国产精品萝li| 亚洲激情图片小说视频| 国产日产欧美a一级在线| 亚洲国产99精品国自产| 国产精品视频一区二区高潮| 欧美国产国产综合| 国产精品乱码久久久久久| 欧美国产免费| 国产欧美一区二区三区久久 | 欧美日韩中文在线观看| 久久精品理论片| 欧美日韩在线免费视频| 欧美www视频在线观看| 国产精品视区| 亚洲人成在线影院| 在线观看国产精品网站| 西瓜成人精品人成网站| 亚洲午夜av在线| 免费毛片一区二区三区久久久| 久久av最新网址| 欧美日韩一区精品| 亚洲大胆美女视频| 好吊成人免视频| 亚洲欧美日韩国产综合| 一区二区三区日韩精品| 欧美凹凸一区二区三区视频| 免费成年人欧美视频| 国产综合色产在线精品| 亚洲欧美日韩精品久久久| 中文国产成人精品| 欧美日韩视频不卡| 91久久久久久久久| 亚洲精选在线| 欧美激情aⅴ一区二区三区| 亚洲电影免费观看高清完整版| 激情成人中文字幕| 久久久久成人精品| 欧美成人按摩| 亚洲精选国产| 欧美日韩国产在线播放网站| 亚洲精品国产系列| 国产精品99久久久久久久vr | 欧美午夜影院| 亚洲一卡久久| 香蕉成人久久| 国产视频在线观看一区| 久久电影一区| 欧美国产日产韩国视频| 99v久久综合狠狠综合久久| 欧美精品亚洲精品| 99re6热只有精品免费观看| 亚洲一区二区三区在线| 国产精品乱码一区二区三区| 亚洲欧美网站| 蜜桃精品久久久久久久免费影院| 亚洲高清视频在线| 欧美精品99| 亚洲一区二区在| 久久尤物电影视频在线观看| 亚洲人成7777| 国产精品嫩草99av在线| 久久精品72免费观看| 亚洲黄色一区| 亚洲免费视频成人| 韩日精品在线| 欧美日韩国产999| 亚洲你懂的在线视频| 久久永久免费| 亚洲午夜精品一区二区| 国产综合av| 欧美日韩精品二区第二页| 亚洲欧美日韩视频二区| 亚洲国产成人精品久久久国产成人一区| 夜夜嗨av一区二区三区网站四季av| 国产麻豆视频精品| 欧美99在线视频观看| 亚洲欧美日韩精品一区二区| 亚洲国产精品一区| 欧美一级久久| 一区二区三区国产在线观看| 极品尤物av久久免费看| 欧美日韩在线一二三| 久久久久网址| 亚洲在线观看免费视频| 亚洲国产婷婷| 久久久精品性| 亚洲——在线| 一区二区日韩欧美| 亚洲大片在线| 国产主播在线一区| 国产精品久久中文| 欧美日本国产精品| 久久综合色8888| 久久精品国产77777蜜臀 | 裸体歌舞表演一区二区| 亚洲永久视频| 99国内精品| 亚洲激情一区二区| 精品1区2区3区4区| 国产欧美日韩专区发布| 国产精品久久久久久久久久久久| 老司机亚洲精品| 久久久精品国产一区二区三区| 亚洲男人av电影| 亚洲深爱激情| 一区二区三区国产盗摄| 亚洲人成在线观看一区二区| 亚洲大胆美女视频| 欧美大片第1页| 欧美国产综合| 欧美高清不卡| 亚洲激情成人在线| 亚洲精品乱码久久久久久日本蜜臀| 欧美.com| 亚洲国产精品久久久久| 欧美成人日本| 欧美激情一区在线观看| 亚洲国产精品一区二区www在线| 欧美成人久久| 亚洲精品久久久蜜桃| 亚洲免费av网站| 一本色道久久88精品综合| 一区二区三区视频免费在线观看 | 久久五月天婷婷| 久久久久欧美精品| 久久在线视频| 欧美国产日韩一区二区三区| 亚洲经典三级| 99精品欧美一区| 亚洲免费中文| 久久精品理论片| 欧美jizz19性欧美| 欧美日韩亚洲高清一区二区| 国产精品久久久久久久久久免费| 国产精品亚洲第一区在线暖暖韩国| 国产精品色在线| 黄色在线成人| 日韩亚洲欧美精品| 亚洲欧美中日韩| 久久婷婷久久| 亚洲人成啪啪网站| 亚洲欧美国产精品桃花| 久久久久久久一区| 欧美激情第三页| 国产欧美一二三区| 亚洲精选国产| 欧美中文字幕在线| 亚洲国产日韩欧美一区二区三区| 一区二区国产在线观看| 久久aⅴ国产紧身牛仔裤| 欧美a级一区| 国产日韩欧美麻豆| 亚洲区免费影片| 欧美在线影院| 亚洲区在线播放| 久久精品综合一区| 欧美日韩在线一区| 在线观看视频欧美| 亚洲综合好骚| 欧美激情一区二区三区在线视频 | 亚洲一区二区三区中文字幕 | 99re66热这里只有精品3直播| 午夜欧美电影在线观看| 欧美精品一区在线观看| 狠狠操狠狠色综合网| 亚洲在线视频免费观看| 亚洲国产精品成人| 欧美一区二区三区播放老司机 | 欧美一级久久| 欧美日韩一区二区三区在线观看免|