青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

posts - 9,  comments - 19,  trackbacks - 0

0x0

前些天組里老司機(jī)@梁希在jvm的項(xiàng)目榨干機(jī)器性能之余,為了檢查下gcc編譯器和Intel Xoen CPU的正確性,寫了一組測(cè)試代碼測(cè)試了下mfence指令的效果

`
mfence Opcode : 0F AE /6

Performs a serializing operation on all load-from-memory and store-to-memory instructions that were issued prior the MFENCE instruction. This serializing operation guarantees that every load and store instruction that precedes in program order the MFENCE instruction is globally visible before any load or store instruction that follows the MFENCE instruction is globally visible. The MFENCE instruction is ordered with respect to all load and store instructions, other MFENCE instructions, any SFENCE and LFENCE instructions, and any serializing instructions (such as the CPUID instruction).
Weakly ordered memory types can be used to achieve higher processor performance through such techniques as out-of-order issue, speculative reads, write-combining, and write-collapsing.
The degree to which a consumer of data recognizes or knows that the data is weakly ordered varies among applications and may be unknown to the producer of this data. The MFENCE instruction provides a performance-efficient way of ensuring load and store ordering between routines that produce weakly-ordered results and routines that consume that data.
It should be noted that processors are free to speculatively fetch and cache data from system memory regions that are assigned a memory-type that permits speculative reads (that is, the WB, WC, and WT memory types). The PREFETCHh instruction is considered a hint to this speculative behavior. Because this speculative fetching can occur at any time and is not tied to instruction execution, the MFENCE instruction is not ordered with respect to PREFETCHh instructions or any other speculative fetching mechanism (that is, data could be speculatively loaded into the cache just before, during, or after the execution of an MFENCE instruction).
`

簡(jiǎn)單來(lái)說(shuō)就是一個(gè)可以在CPU亂序執(zhí)行中保證真實(shí)的load/store順序的指令

0x1
老司機(jī)寫了一個(gè)小程序(注:有誤版)
// file: order.c

#define _GNU_SOURCE
#include <pthread.h>
#include <stdio.h>
#include <stdlib.h>
#include <assert.h>

union p64 {
    int i;
    char padding[64];
    long align8;
};

volatile union p64 v1, v2;
int b;

void *
run1(void *ignore)
{
    for (;;) {
        while (!b);
        if (v1.i || v2.i) {
            puts("assert error 1");
            exit(-1);
        }
        v1.i = 1;
        asm ("sfence": : :"memory");
        v2.i = 1;
        asm ("sfence": : :"memory");
        b = 0; 
    }
}

int
main()
{
    pthread_t p;
    pthread_create(&p, NULL, run1, NULL);
    int cnt = 0;

    for (;; cnt++) {
        v1.i = v2.i = 0;
        asm ("sfence": : :"memory");
        b = 1;
        asm ("sfence": : :"memory");
        int icnt = 0;
        for (;; icnt++) {
            int i1 = v1.i;
            asm ("lfence": : :"memory");
            int i2 = v2.i;
            if (i1 && i2)   break;
            if (i1 < i2) {
                printf("assert error, cnt = %d, icnt = %d, i1 = %d, i2 = %d\n", cnt, icnt, i1, i2);
                exit(-1);
            }
        }
    }
    return 0;
}

大概邏輯是: 一共有3個(gè)變量,v1.iv2.ib ,起了2個(gè)線程,一個(gè)順序?qū)懭雟1和v2,一個(gè)讀v1和v2,互相通過(guò)改變b的值來(lái)通訊,然后兩個(gè)線程不停循環(huán)。

這個(gè)程序會(huì)掛在
printf("assert error, cnt = %d, icnt = %d, i1 = %d, i2 = %d\n", cnt, icnt, i1, i2); 
這條斷言上,意思是線程1在順序?qū)懭雟1和v2,但是主線程卻出現(xiàn)讀到 v1=0,v2=1的情況。

0x2

然后我?guī)兔θタ戳艘幌拢X(jué)得這種寫法甚是粗暴,于是原樣照搬了一個(gè)c++11版:

#include <stdio.h>
#include <stdlib.h>
#include <assert.h>

#include <atomic>
#include <thread>

using namespace std;

union p64 {
    atomic<int> i;
    char padding[64];
    long align8;
};

volatile union p64 v1, v2;
atomic<int> b;

void *
run1()
{
    int rcnt = 0;
    for (;; rcnt++) {
        while (!b.load());
        if (v1.i.load() || v2.i.load()) {
            puts("assert error 1");
            exit(-1);
        }
        v1.i.store(1);
        v2.i.store(1);
        b.store(0);
    }
}

int
main()
{
    // init
    v1.i.store(0);
    v2.i.store(0);
    thread t(run1);
    int cnt = 0;
    for (;; cnt++) {
        v1.i.store(0);
        v2.i.store(0);
        b.store(1);
        int icnt = 0;
        for (;; icnt++) {
            int b2 = b.load();
            int i1 = v1.i.load();       // *****
            int i2 = v2.i.load();       // *****
            if (i1 && i2)   break;
            if (i1 < i2) {
                printf("assert error, cnt = %d, icnt = %d, i1 = %d, i2 = %d\n", cnt, icnt, i1, i2);
                exit(-1);
            }
            if (i1 == 0 && i2 == 0 && b2 == 0) break;
        }
    }
    return 0;
}

因?yàn)槭窃瓨诱瞻幔钥隙ㄟ€是會(huì)掛,但是畢竟語(yǔ)義上更好理解了

我們先來(lái)分析一下為什么會(huì)掛

  • 線程1對(duì)于v1,v2的寫入順序一定是一致的
  • Memory Barrier也保證了他們寫入順序?qū)ζ渌€程的可見(jiàn)性(很有迷惑性的一點(diǎn))
  • 但是主線程卻可以讀到 v1=0,v2=1的情況
  • 所以情況就是雖然順序?qū)懭肓耍莿e的線程沒(méi)有看到正確的順序?
  • Intel: 并不是!
  • 原因是搞錯(cuò)了因果關(guān)系,他真正保證的順序是當(dāng)你讀到v2的new value的時(shí)候,那么v1也一定被寫入了。
  • 解決方案就是互換上面代碼中我用**星號(hào)**標(biāo)注出的兩行
  • done

在舊寫法中,掛掉的情況是線程1寫入v1 = 1,主線程讀v1,沒(méi)有讀到,那么主線程認(rèn)為v1是0,然后線程1繼續(xù)寫入v2,主線程讀到了,主線程認(rèn)為v2是1。 然后掛在了斷言上。

兩行互換后,主線程首先讀取v2,如果v2已經(jīng)是1了,那么v1也一定是1,反之亦然。

0x3

當(dāng)然,想讓跑通那個(gè)例子不需要那么多的atomic<>,精簡(jiǎn)之后利用c++11的memory_order可以寫成如下:

#include <stdio.h>
#include <stdlib.h>
#include <assert.h>

#include <atomic>
#include <thread>

using namespace std;

union p64 {
    int i;
    char padding[64];
    long align8;
};

volatile union p64 v1, v2;
atomic<int> b;    // variable b as a guard

void *
run1()
{
    int rcnt = 0;
    for (;; rcnt++) {
        while (!b.load());
        if (v1.i || v2.i) {
            puts("assert error 1");
            exit(-1);
        }
        v1.i = 1;
        v2.i = 1;
        b.store(0, memory_order_release);
    }
}
int
main()
{
    // init
    v1.i = 0;
    v2.i = 0;
    thread t(run1);
    int cnt = 0;

    for (;; cnt++) {
        v1.i = 0;
        v2.i = 0;
        b.store(1, memory_order_release);
        int icnt = 0;
        for (;; icnt++) {
            int b2 = b.load(memory_order_acquire);
            if (b2 != 0) {
                continue
            }
            int i1 = v1.i;
            int i2 = v2.i;
            if (i1 && i2)   break;
            if (i1 < i2) {
                printf("assert error 2, cnt = %d, icnt =  %d, i1 = %d, i2 = %d\n", cnt, icnt, i1, i2);
                exit(-1);
            }
        }
    }
    return 0;
}

利用變量b在兩個(gè)線程之間同步,如下圖

 (Thead 1)

   v1.i = 1;
   v2.i = 1;
   
   b.store(0, memory_order_release) <---+
                                                             |
                                                synchronize with b
                                                 (happend before)
                                                             |
                                                            +----->  b.load(memory_order_acquire)
                                                                          
                                                                        i1 = v1.i
                                                                        i2 = v2.i

                                                                       (Thread 2)

我們查看下生成的代碼
g++ -std=c++11 -pthread -g -O2 order.cpp

 v1.i = 1;
  400be6:       c7 05 d0 10 20 00 01    movl   $0x1,0x2010d0(%rip)        # 601cc0 <v1>
  400bed:       00 00 00 
        v2.i = 1;
  400bf0:       c7 05 86 10 20 00 01    movl   $0x1,0x201086(%rip)        # 601c80 <v2>
  400bf7:       00 00 00 
        memory_order __b = __m & __memory_order_mask;
        __glibcxx_assert(__b != memory_order_acquire);
        __glibcxx_assert(__b != memory_order_acq_rel);
        __glibcxx_assert(__b != memory_order_consume);

        __atomic_store_n(&_M_i, __i, __m);
  400bfa:       c7 05 5c 10 20 00 00    movl   $0x0,0x20105c(%rip)        # 601c60 <b>
  400c01:       00 00 00 
        b.store(0, memory_order_release);

  

  400a58:       8b 05 02 12 20 00       mov    0x201202(%rip),%eax        # 601c60 <b>
            int b2 = b.load(memory_order_consume);
            if (b2 != 0) {
  400a5e:       85 c0                   test   %eax,%eax
  400a60:       75 f3                   jne    400a55 <main+0x55>
                continue
            }
            int i1 = v1.i;
  400a62:       8b 0d 58 12 20 00       mov    0x201258(%rip),%ecx        # 601cc0 <v1>
            int i2 = v2.i;
  400a68:       44 8b 05 11 12 20 00    mov    0x201211(%rip),%r8d        # 601c80 <v2>

看來(lái)Intel的Strong Memory Model已經(jīng)保證了這一點(diǎn),Memory Barrier都不需要了

(雖然標(biāo)題里面有MemoryBarrier,但是內(nèi)容里面根本沒(méi)涉及的樣子。。)

posted on 2016-01-19 16:13 右席 閱讀(16808) 評(píng)論(1)  編輯 收藏 引用 所屬分類: 搬磚之路
青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            亚洲视频在线观看| 亚洲在线一区| 欧美精品999| 亚洲免费av片| 欧美一区二区三区免费看| 国产免费成人| 久久欧美中文字幕| 亚洲精品一区二区三区av| 亚洲欧美日韩中文视频| 国产一区二区三区丝袜| 欧美freesex交免费视频| 夜夜爽www精品| 久久久中精品2020中文| 亚洲精品久久久久久久久久久久| 欧美日韩视频| 欧美一区网站| 亚洲国产日韩欧美综合久久| 亚洲图片欧美一区| 今天的高清视频免费播放成人| 欧美成人蜜桃| 亚洲欧美国内爽妇网| 欧美高清在线精品一区| 亚洲夜间福利| 亚洲国产成人av在线| 国产精品久久久久av免费| 久久综合久色欧美综合狠狠| 一区二区三区精品在线 | 久久深夜福利| 中文av一区特黄| 好吊妞这里只有精品| 欧美色视频在线| 久久久久久久久久久久久女国产乱| 99riav久久精品riav| 蘑菇福利视频一区播放| 香蕉亚洲视频| 一区二区激情小说| 亚洲国产日本| 国产一区二区精品| 国产精品vvv| 亚洲先锋成人| 亚洲精选中文字幕| 伊大人香蕉综合8在线视| 欧美特黄一级| 欧美理论电影网| 久久在精品线影院精品国产| 亚洲欧美中文日韩在线| 一本一本a久久| 亚洲日本免费电影| 欧美成熟视频| 美女国产一区| 久久蜜桃资源一区二区老牛| 性久久久久久久久| 亚洲一区二区不卡免费| 一区二区免费在线播放| 亚洲精品国产品国语在线app| 国产在线不卡精品| 国产欧美日韩亚洲一区二区三区| 欧美日韩国产成人在线91| 麻豆精品在线观看| 蜜臀a∨国产成人精品| 久久青草久久| 久久一区二区三区四区| 久久婷婷色综合| 久久久视频精品| 久久久久一区二区三区| 久久精品国产精品亚洲综合| 欧美一区二区三区免费视频| 亚洲欧美日韩在线高清直播| 亚洲一区二区三区涩| 亚洲一区免费视频| 亚洲综合精品四区| 欧美一级片久久久久久久| 午夜精品久久久久久久蜜桃app| 亚洲在线观看视频网站| 午夜电影亚洲| 久久大逼视频| 免费欧美高清视频| 欧美激情在线免费观看| 欧美日韩国产综合新一区| 欧美日韩一级黄| 国产精品久久久久三级| 国产伦精品一区二区三区高清| 国产精品一区二区久久国产| 国产日韩一区在线| 在线日韩中文| 日韩午夜激情| 午夜精品福利在线| 久久日韩精品| 亚洲国产高清一区| 在线一区二区三区四区五区| 亚洲欧美日韩区| 久久资源在线| 欧美日韩一区二区高清| 国产区在线观看成人精品| 黑丝一区二区| 亚洲美女视频网| 午夜精品久久久久久久男人的天堂| 欧美专区中文字幕| 欧美风情在线观看| 夜夜精品视频| 久久精品国产一区二区三区| 欧美波霸影院| 国产精品免费一区豆花| 亚洲激情影视| 欧美一级艳片视频免费观看| 久久综合成人精品亚洲另类欧美 | 中文精品在线| 亚欧成人精品| 亚洲国产岛国毛片在线| 亚洲综合色噜噜狠狠| 久久五月激情| 国产精品视频一二| 亚洲第一网站| 新片速递亚洲合集欧美合集| 欧美成人小视频| 亚洲一区免费视频| 欧美成人亚洲| 国产一区日韩一区| 亚洲视屏一区| 欧美福利一区二区| 午夜精品久久久久久久久| 欧美精品观看| 激情亚洲成人| 久久av一区二区三区| 亚洲精品一区二区三区樱花| 欧美在线网站| 国产精品午夜春色av| 亚洲美女尤物影院| 老司机午夜免费精品视频| 亚洲视频国产视频| 欧美精品一区视频| 亚洲第一视频| 久久久综合精品| 亚洲欧美成人网| 欧美日韩国产二区| 91久久中文| 蜜臀va亚洲va欧美va天堂| 亚洲欧美在线高清| 国产精品久久久久久影视| 一本久久综合亚洲鲁鲁| 欧美国内亚洲| 久久夜色精品国产欧美乱| 国产一区二区三区奇米久涩| 亚洲欧美成人一区二区在线电影| 亚洲经典三级| 欧美成人国产va精品日本一级| 国外成人在线视频| 久久精品一区二区三区不卡牛牛 | 久久精品动漫| 国产亚洲美州欧州综合国| 性欧美激情精品| 制服丝袜亚洲播放| 国产精品草草| 亚洲你懂的在线视频| 在线视频欧美日韩精品| 欧美日韩在线影院| 一区二区三区黄色| 99re成人精品视频| 欧美视频一区二区三区四区| 一区二区三区精品视频在线观看| 亚洲人成在线播放| 欧美日韩成人在线| 一区二区免费看| 一二美女精品欧洲| 国产精品激情av在线播放| 亚洲在线播放电影| 亚洲免费在线视频一区 二区| 国产精品日韩精品欧美在线| 校园春色综合网| 欧美一级片在线播放| 黄色成人小视频| 免费在线成人| 欧美激情成人在线视频| 一本色道久久加勒比88综合| 国产日韩专区| 欧美xart系列在线观看| 老司机一区二区三区| 99国产精品视频免费观看一公开| 亚洲精品日韩久久| 国产精品久久久久久久久免费桃花 | 亚洲福利久久| 亚洲精品乱码久久久久久| 欧美日本在线看| 午夜精品短视频| 久久久天天操| 一区二区av在线| 午夜精品久久久久久久蜜桃app | 亚洲福利视频一区二区| 亚洲第一精品在线| 欧美三级不卡| 久久精品1区| 免费黄网站欧美| 亚洲欧美日韩直播| 久久久久一区| 亚洲图片在区色| 久久久久国产精品一区二区| 一本一本久久a久久精品综合麻豆 一本一本久久a久久精品牛牛影视 | 亚洲一区免费网站| 欧美一级在线播放| 亚洲精品一区二区在线|