青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

posts - 9,  comments - 19,  trackbacks - 0

0x0

前些天組里老司機@梁希在jvm的項目榨干機器性能之余,為了檢查下gcc編譯器和Intel Xoen CPU的正確性,寫了一組測試代碼測試了下mfence指令的效果

`
mfence Opcode : 0F AE /6

Performs a serializing operation on all load-from-memory and store-to-memory instructions that were issued prior the MFENCE instruction. This serializing operation guarantees that every load and store instruction that precedes in program order the MFENCE instruction is globally visible before any load or store instruction that follows the MFENCE instruction is globally visible. The MFENCE instruction is ordered with respect to all load and store instructions, other MFENCE instructions, any SFENCE and LFENCE instructions, and any serializing instructions (such as the CPUID instruction).
Weakly ordered memory types can be used to achieve higher processor performance through such techniques as out-of-order issue, speculative reads, write-combining, and write-collapsing.
The degree to which a consumer of data recognizes or knows that the data is weakly ordered varies among applications and may be unknown to the producer of this data. The MFENCE instruction provides a performance-efficient way of ensuring load and store ordering between routines that produce weakly-ordered results and routines that consume that data.
It should be noted that processors are free to speculatively fetch and cache data from system memory regions that are assigned a memory-type that permits speculative reads (that is, the WB, WC, and WT memory types). The PREFETCHh instruction is considered a hint to this speculative behavior. Because this speculative fetching can occur at any time and is not tied to instruction execution, the MFENCE instruction is not ordered with respect to PREFETCHh instructions or any other speculative fetching mechanism (that is, data could be speculatively loaded into the cache just before, during, or after the execution of an MFENCE instruction).
`

簡單來說就是一個可以在CPU亂序執行中保證真實的load/store順序的指令

0x1
老司機寫了一個小程序(注:有誤版)
// file: order.c

#define _GNU_SOURCE
#include <pthread.h>
#include <stdio.h>
#include <stdlib.h>
#include <assert.h>

union p64 {
    int i;
    char padding[64];
    long align8;
};

volatile union p64 v1, v2;
int b;

void *
run1(void *ignore)
{
    for (;;) {
        while (!b);
        if (v1.i || v2.i) {
            puts("assert error 1");
            exit(-1);
        }
        v1.i = 1;
        asm ("sfence": : :"memory");
        v2.i = 1;
        asm ("sfence": : :"memory");
        b = 0; 
    }
}

int
main()
{
    pthread_t p;
    pthread_create(&p, NULL, run1, NULL);
    int cnt = 0;

    for (;; cnt++) {
        v1.i = v2.i = 0;
        asm ("sfence": : :"memory");
        b = 1;
        asm ("sfence": : :"memory");
        int icnt = 0;
        for (;; icnt++) {
            int i1 = v1.i;
            asm ("lfence": : :"memory");
            int i2 = v2.i;
            if (i1 && i2)   break;
            if (i1 < i2) {
                printf("assert error, cnt = %d, icnt = %d, i1 = %d, i2 = %d\n", cnt, icnt, i1, i2);
                exit(-1);
            }
        }
    }
    return 0;
}

大概邏輯是: 一共有3個變量,v1.iv2.ib ,起了2個線程,一個順序寫入v1和v2,一個讀v1和v2,互相通過改變b的值來通訊,然后兩個線程不停循環。

這個程序會掛在
printf("assert error, cnt = %d, icnt = %d, i1 = %d, i2 = %d\n", cnt, icnt, i1, i2); 
這條斷言上,意思是線程1在順序寫入v1和v2,但是主線程卻出現讀到 v1=0,v2=1的情況。

0x2

然后我幫忙去看了一下,覺得這種寫法甚是粗暴,于是原樣照搬了一個c++11版:

#include <stdio.h>
#include <stdlib.h>
#include <assert.h>

#include <atomic>
#include <thread>

using namespace std;

union p64 {
    atomic<int> i;
    char padding[64];
    long align8;
};

volatile union p64 v1, v2;
atomic<int> b;

void *
run1()
{
    int rcnt = 0;
    for (;; rcnt++) {
        while (!b.load());
        if (v1.i.load() || v2.i.load()) {
            puts("assert error 1");
            exit(-1);
        }
        v1.i.store(1);
        v2.i.store(1);
        b.store(0);
    }
}

int
main()
{
    // init
    v1.i.store(0);
    v2.i.store(0);
    thread t(run1);
    int cnt = 0;
    for (;; cnt++) {
        v1.i.store(0);
        v2.i.store(0);
        b.store(1);
        int icnt = 0;
        for (;; icnt++) {
            int b2 = b.load();
            int i1 = v1.i.load();       // *****
            int i2 = v2.i.load();       // *****
            if (i1 && i2)   break;
            if (i1 < i2) {
                printf("assert error, cnt = %d, icnt = %d, i1 = %d, i2 = %d\n", cnt, icnt, i1, i2);
                exit(-1);
            }
            if (i1 == 0 && i2 == 0 && b2 == 0) break;
        }
    }
    return 0;
}

因為是原樣照搬,所以肯定還是會掛,但是畢竟語義上更好理解了

我們先來分析一下為什么會掛

  • 線程1對于v1,v2的寫入順序一定是一致的
  • Memory Barrier也保證了他們寫入順序對其他線程的可見性(很有迷惑性的一點)
  • 但是主線程卻可以讀到 v1=0,v2=1的情況
  • 所以情況就是雖然順序寫入了,但是別的線程沒有看到正確的順序?
  • Intel: 并不是!
  • 原因是搞錯了因果關系,他真正保證的順序是當你讀到v2的new value的時候,那么v1也一定被寫入了。
  • 解決方案就是互換上面代碼中我用**星號**標注出的兩行
  • done

在舊寫法中,掛掉的情況是線程1寫入v1 = 1,主線程讀v1,沒有讀到,那么主線程認為v1是0,然后線程1繼續寫入v2,主線程讀到了,主線程認為v2是1。 然后掛在了斷言上。

兩行互換后,主線程首先讀取v2,如果v2已經是1了,那么v1也一定是1,反之亦然。

0x3

當然,想讓跑通那個例子不需要那么多的atomic<>,精簡之后利用c++11的memory_order可以寫成如下:

#include <stdio.h>
#include <stdlib.h>
#include <assert.h>

#include <atomic>
#include <thread>

using namespace std;

union p64 {
    int i;
    char padding[64];
    long align8;
};

volatile union p64 v1, v2;
atomic<int> b;    // variable b as a guard

void *
run1()
{
    int rcnt = 0;
    for (;; rcnt++) {
        while (!b.load());
        if (v1.i || v2.i) {
            puts("assert error 1");
            exit(-1);
        }
        v1.i = 1;
        v2.i = 1;
        b.store(0, memory_order_release);
    }
}
int
main()
{
    // init
    v1.i = 0;
    v2.i = 0;
    thread t(run1);
    int cnt = 0;

    for (;; cnt++) {
        v1.i = 0;
        v2.i = 0;
        b.store(1, memory_order_release);
        int icnt = 0;
        for (;; icnt++) {
            int b2 = b.load(memory_order_acquire);
            if (b2 != 0) {
                continue
            }
            int i1 = v1.i;
            int i2 = v2.i;
            if (i1 && i2)   break;
            if (i1 < i2) {
                printf("assert error 2, cnt = %d, icnt =  %d, i1 = %d, i2 = %d\n", cnt, icnt, i1, i2);
                exit(-1);
            }
        }
    }
    return 0;
}

利用變量b在兩個線程之間同步,如下圖

 (Thead 1)

   v1.i = 1;
   v2.i = 1;
   
   b.store(0, memory_order_release) <---+
                                                             |
                                                synchronize with b
                                                 (happend before)
                                                             |
                                                            +----->  b.load(memory_order_acquire)
                                                                          
                                                                        i1 = v1.i
                                                                        i2 = v2.i

                                                                       (Thread 2)

我們查看下生成的代碼
g++ -std=c++11 -pthread -g -O2 order.cpp

 v1.i = 1;
  400be6:       c7 05 d0 10 20 00 01    movl   $0x1,0x2010d0(%rip)        # 601cc0 <v1>
  400bed:       00 00 00 
        v2.i = 1;
  400bf0:       c7 05 86 10 20 00 01    movl   $0x1,0x201086(%rip)        # 601c80 <v2>
  400bf7:       00 00 00 
        memory_order __b = __m & __memory_order_mask;
        __glibcxx_assert(__b != memory_order_acquire);
        __glibcxx_assert(__b != memory_order_acq_rel);
        __glibcxx_assert(__b != memory_order_consume);

        __atomic_store_n(&_M_i, __i, __m);
  400bfa:       c7 05 5c 10 20 00 00    movl   $0x0,0x20105c(%rip)        # 601c60 <b>
  400c01:       00 00 00 
        b.store(0, memory_order_release);

  

  400a58:       8b 05 02 12 20 00       mov    0x201202(%rip),%eax        # 601c60 <b>
            int b2 = b.load(memory_order_consume);
            if (b2 != 0) {
  400a5e:       85 c0                   test   %eax,%eax
  400a60:       75 f3                   jne    400a55 <main+0x55>
                continue
            }
            int i1 = v1.i;
  400a62:       8b 0d 58 12 20 00       mov    0x201258(%rip),%ecx        # 601cc0 <v1>
            int i2 = v2.i;
  400a68:       44 8b 05 11 12 20 00    mov    0x201211(%rip),%r8d        # 601c80 <v2>

看來Intel的Strong Memory Model已經保證了這一點,Memory Barrier都不需要了

(雖然標題里面有MemoryBarrier,但是內容里面根本沒涉及的樣子。。)

posted on 2016-01-19 16:13 右席 閱讀(16808) 評論(1)  編輯 收藏 引用 所屬分類: 搬磚之路
青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            亚洲第一二三四五区| 亚洲国产欧美国产综合一区| 久久综合中文| 欧美中文字幕| 国产精品福利网| 亚洲国产毛片完整版| 精品1区2区3区4区| 亚洲男人天堂2024| 亚洲午夜电影在线观看| 欧美成人午夜激情视频| 美女黄网久久| 国产日韩一区二区三区在线播放| 日韩视频中文字幕| 亚洲精品资源| 欧美大片国产精品| 欧美成人午夜激情在线| 尤物九九久久国产精品的特点 | 欧美日韩亚洲综合| 亚洲国产日韩欧美在线99| 黄色日韩精品| 久久精品视频免费| 久久综合色播五月| 在线高清一区| 久久五月天婷婷| 狂野欧美激情性xxxx| 国产综合色精品一区二区三区| 午夜精品亚洲| 久久国产免费| 好吊妞这里只有精品| 午夜久久久久久| 久久久久久一区二区三区| 国产婷婷色综合av蜜臀av| 午夜精品久久久久久久99樱桃| 欧美影院在线播放| 亚洲视频电影图片偷拍一区| 日韩一级精品视频在线观看| 欧美精品激情| 夜色激情一区二区| 亚洲女人天堂av| 国产免费亚洲高清| 欧美在线观看你懂的| 蜜桃精品一区二区三区| 亚洲国产另类久久久精品极度| 狼狼综合久久久久综合网| 亚洲高清在线观看| 亚洲私人影吧| 国产九色精品成人porny| 欧美一区二区三区久久精品| 麻豆精品视频在线观看| 亚洲精品系列| 国产精品av一区二区| 午夜伦欧美伦电影理论片| 另类欧美日韩国产在线| 亚洲精品一线二线三线无人区| 欧美日韩国产欧美日美国产精品| 亚洲一区二区影院| 麻豆成人综合网| 在线视频你懂得一区| 国产亚洲欧美一区二区三区| 免费在线日韩av| 亚洲色图综合久久| 男男成人高潮片免费网站| 亚洲无限av看| 一区二区三区在线视频观看| 欧美日韩另类丝袜其他| 欧美一区二区三区在线观看| 亚洲国产精品一区制服丝袜 | 久久久精品视频成人| 亚洲国产mv| 国产精品伦理| 农村妇女精品| 欧美一级免费视频| 亚洲日本aⅴ片在线观看香蕉| 欧美与欧洲交xxxx免费观看| 亚洲人成毛片在线播放| 国产欧美精品xxxx另类| 欧美精品1区2区3区| 欧美在线视频网站| 在线午夜精品自拍| 亚洲高清久久| 久久蜜臀精品av| 亚洲在线1234| 日韩视频免费大全中文字幕| 国产在线高清精品| 国产精品卡一卡二卡三| 欧美大秀在线观看| 久久久久久穴| 午夜视频久久久久久| 夜夜嗨av一区二区三区中文字幕 | 一区二区三区黄色| 亚洲国产成人精品女人久久久 | 午夜在线a亚洲v天堂网2018| 亚洲理论电影网| 欧美黄色免费| 老牛影视一区二区三区| 欧美一区视频| 亚洲欧美日韩区| 亚洲无限av看| 亚洲午夜精品一区二区三区他趣 | 99综合在线| 亚洲三级观看| 亚洲国产日韩一区| 亚洲大胆在线| 亚洲国产精品久久久久婷婷884| 国产视频欧美| 国产午夜精品福利| 国产日韩欧美麻豆| 国产欧美精品日韩| 国产日韩欧美| 国产一区日韩欧美| 国内精品美女在线观看| 国产亚洲精品久久久久婷婷瑜伽| 国产精品一区在线观看| 国产精品免费小视频| 国产精品嫩草99av在线| 国产精品美女午夜av| 国产精品夜夜夜| 国产欧美一级| 国产一区久久久| 极品av少妇一区二区| 亚洲成人直播| 亚洲精品视频在线播放| 日韩视频免费大全中文字幕| 一本色道久久综合| 亚洲一区免费网站| 欧美一区二区三区视频免费| 久久精品色图| 欧美福利一区二区| 亚洲精品麻豆| 亚洲性图久久| 久久国产黑丝| 欧美77777| 欧美日韩在线亚洲一区蜜芽| 国产精品国产福利国产秒拍| 国产免费亚洲高清| 在线观看91久久久久久| 亚洲精品一区二区三区婷婷月| 亚洲视频每日更新| 欧美伊久线香蕉线新在线| 另类尿喷潮videofree| 91久久精品一区二区三区| 中国av一区| 久久免费黄色| 欧美天天视频| 激情综合五月天| 亚洲视频axxx| 久久夜色精品国产噜噜av| 亚洲国产美女| 亚洲欧美中日韩| 免费成人小视频| 国产精品福利在线观看| 在线精品观看| 午夜免费久久久久| 欧美福利视频在线| 亚洲午夜激情网页| 美女精品网站| 国产日韩欧美日韩| 99精品视频免费| 久久五月天婷婷| 9国产精品视频| 老司机精品导航| 国产免费一区二区三区香蕉精| 亚洲国产岛国毛片在线| 性伦欧美刺激片在线观看| 亚洲福利视频三区| 欧美一二三视频| 欧美日韩精品一本二本三本| 在线观看日韩欧美| 欧美一区激情| 夜夜爽av福利精品导航| 美腿丝袜亚洲色图| 国产在线欧美| 欧美一区二区三区四区视频| 91久久国产精品91久久性色| 久久国产精品久久精品国产| 国产精品久久久久aaaa九色| 亚洲美女在线视频| 男人天堂欧美日韩| 欧美一区二区三区四区夜夜大片 | 亚洲三级观看| 美日韩精品免费观看视频| 国产噜噜噜噜噜久久久久久久久 | 亚洲精品乱码久久久久久蜜桃91 | 黑人极品videos精品欧美裸| 亚洲一区二区成人在线观看| 亚洲国产精品www| 美女脱光内衣内裤视频久久网站| 国产亚洲综合在线| 亚洲欧美视频一区| av成人天堂| 欧美日韩亚洲综合一区| 艳女tv在线观看国产一区| 亚洲丰满在线| 嫩模写真一区二区三区三州| 永久域名在线精品| 久久夜色精品国产亚洲aⅴ| 欧美一级片久久久久久久| 国产精品亚洲产品| 欧美一区二区在线| 午夜视频一区|