青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

posts - 9,  comments - 19,  trackbacks - 0

0x0

前些天組里老司機@梁希在jvm的項目榨干機器性能之余,為了檢查下gcc編譯器和Intel Xoen CPU的正確性,寫了一組測試代碼測試了下mfence指令的效果

`
mfence Opcode : 0F AE /6

Performs a serializing operation on all load-from-memory and store-to-memory instructions that were issued prior the MFENCE instruction. This serializing operation guarantees that every load and store instruction that precedes in program order the MFENCE instruction is globally visible before any load or store instruction that follows the MFENCE instruction is globally visible. The MFENCE instruction is ordered with respect to all load and store instructions, other MFENCE instructions, any SFENCE and LFENCE instructions, and any serializing instructions (such as the CPUID instruction).
Weakly ordered memory types can be used to achieve higher processor performance through such techniques as out-of-order issue, speculative reads, write-combining, and write-collapsing.
The degree to which a consumer of data recognizes or knows that the data is weakly ordered varies among applications and may be unknown to the producer of this data. The MFENCE instruction provides a performance-efficient way of ensuring load and store ordering between routines that produce weakly-ordered results and routines that consume that data.
It should be noted that processors are free to speculatively fetch and cache data from system memory regions that are assigned a memory-type that permits speculative reads (that is, the WB, WC, and WT memory types). The PREFETCHh instruction is considered a hint to this speculative behavior. Because this speculative fetching can occur at any time and is not tied to instruction execution, the MFENCE instruction is not ordered with respect to PREFETCHh instructions or any other speculative fetching mechanism (that is, data could be speculatively loaded into the cache just before, during, or after the execution of an MFENCE instruction).
`

簡單來說就是一個可以在CPU亂序執行中保證真實的load/store順序的指令

0x1
老司機寫了一個小程序(注:有誤版)
// file: order.c

#define _GNU_SOURCE
#include <pthread.h>
#include <stdio.h>
#include <stdlib.h>
#include <assert.h>

union p64 {
    int i;
    char padding[64];
    long align8;
};

volatile union p64 v1, v2;
int b;

void *
run1(void *ignore)
{
    for (;;) {
        while (!b);
        if (v1.i || v2.i) {
            puts("assert error 1");
            exit(-1);
        }
        v1.i = 1;
        asm ("sfence": : :"memory");
        v2.i = 1;
        asm ("sfence": : :"memory");
        b = 0; 
    }
}

int
main()
{
    pthread_t p;
    pthread_create(&p, NULL, run1, NULL);
    int cnt = 0;

    for (;; cnt++) {
        v1.i = v2.i = 0;
        asm ("sfence": : :"memory");
        b = 1;
        asm ("sfence": : :"memory");
        int icnt = 0;
        for (;; icnt++) {
            int i1 = v1.i;
            asm ("lfence": : :"memory");
            int i2 = v2.i;
            if (i1 && i2)   break;
            if (i1 < i2) {
                printf("assert error, cnt = %d, icnt = %d, i1 = %d, i2 = %d\n", cnt, icnt, i1, i2);
                exit(-1);
            }
        }
    }
    return 0;
}

大概邏輯是: 一共有3個變量,v1.iv2.ib ,起了2個線程,一個順序寫入v1和v2,一個讀v1和v2,互相通過改變b的值來通訊,然后兩個線程不停循環。

這個程序會掛在
printf("assert error, cnt = %d, icnt = %d, i1 = %d, i2 = %d\n", cnt, icnt, i1, i2); 
這條斷言上,意思是線程1在順序寫入v1和v2,但是主線程卻出現讀到 v1=0,v2=1的情況。

0x2

然后我幫忙去看了一下,覺得這種寫法甚是粗暴,于是原樣照搬了一個c++11版:

#include <stdio.h>
#include <stdlib.h>
#include <assert.h>

#include <atomic>
#include <thread>

using namespace std;

union p64 {
    atomic<int> i;
    char padding[64];
    long align8;
};

volatile union p64 v1, v2;
atomic<int> b;

void *
run1()
{
    int rcnt = 0;
    for (;; rcnt++) {
        while (!b.load());
        if (v1.i.load() || v2.i.load()) {
            puts("assert error 1");
            exit(-1);
        }
        v1.i.store(1);
        v2.i.store(1);
        b.store(0);
    }
}

int
main()
{
    // init
    v1.i.store(0);
    v2.i.store(0);
    thread t(run1);
    int cnt = 0;
    for (;; cnt++) {
        v1.i.store(0);
        v2.i.store(0);
        b.store(1);
        int icnt = 0;
        for (;; icnt++) {
            int b2 = b.load();
            int i1 = v1.i.load();       // *****
            int i2 = v2.i.load();       // *****
            if (i1 && i2)   break;
            if (i1 < i2) {
                printf("assert error, cnt = %d, icnt = %d, i1 = %d, i2 = %d\n", cnt, icnt, i1, i2);
                exit(-1);
            }
            if (i1 == 0 && i2 == 0 && b2 == 0) break;
        }
    }
    return 0;
}

因為是原樣照搬,所以肯定還是會掛,但是畢竟語義上更好理解了

我們先來分析一下為什么會掛

  • 線程1對于v1,v2的寫入順序一定是一致的
  • Memory Barrier也保證了他們寫入順序對其他線程的可見性(很有迷惑性的一點)
  • 但是主線程卻可以讀到 v1=0,v2=1的情況
  • 所以情況就是雖然順序寫入了,但是別的線程沒有看到正確的順序?
  • Intel: 并不是!
  • 原因是搞錯了因果關系,他真正保證的順序是當你讀到v2的new value的時候,那么v1也一定被寫入了。
  • 解決方案就是互換上面代碼中我用**星號**標注出的兩行
  • done

在舊寫法中,掛掉的情況是線程1寫入v1 = 1,主線程讀v1,沒有讀到,那么主線程認為v1是0,然后線程1繼續寫入v2,主線程讀到了,主線程認為v2是1。 然后掛在了斷言上。

兩行互換后,主線程首先讀取v2,如果v2已經是1了,那么v1也一定是1,反之亦然。

0x3

當然,想讓跑通那個例子不需要那么多的atomic<>,精簡之后利用c++11的memory_order可以寫成如下:

#include <stdio.h>
#include <stdlib.h>
#include <assert.h>

#include <atomic>
#include <thread>

using namespace std;

union p64 {
    int i;
    char padding[64];
    long align8;
};

volatile union p64 v1, v2;
atomic<int> b;    // variable b as a guard

void *
run1()
{
    int rcnt = 0;
    for (;; rcnt++) {
        while (!b.load());
        if (v1.i || v2.i) {
            puts("assert error 1");
            exit(-1);
        }
        v1.i = 1;
        v2.i = 1;
        b.store(0, memory_order_release);
    }
}
int
main()
{
    // init
    v1.i = 0;
    v2.i = 0;
    thread t(run1);
    int cnt = 0;

    for (;; cnt++) {
        v1.i = 0;
        v2.i = 0;
        b.store(1, memory_order_release);
        int icnt = 0;
        for (;; icnt++) {
            int b2 = b.load(memory_order_acquire);
            if (b2 != 0) {
                continue
            }
            int i1 = v1.i;
            int i2 = v2.i;
            if (i1 && i2)   break;
            if (i1 < i2) {
                printf("assert error 2, cnt = %d, icnt =  %d, i1 = %d, i2 = %d\n", cnt, icnt, i1, i2);
                exit(-1);
            }
        }
    }
    return 0;
}

利用變量b在兩個線程之間同步,如下圖

 (Thead 1)

   v1.i = 1;
   v2.i = 1;
   
   b.store(0, memory_order_release) <---+
                                                             |
                                                synchronize with b
                                                 (happend before)
                                                             |
                                                            +----->  b.load(memory_order_acquire)
                                                                          
                                                                        i1 = v1.i
                                                                        i2 = v2.i

                                                                       (Thread 2)

我們查看下生成的代碼
g++ -std=c++11 -pthread -g -O2 order.cpp

 v1.i = 1;
  400be6:       c7 05 d0 10 20 00 01    movl   $0x1,0x2010d0(%rip)        # 601cc0 <v1>
  400bed:       00 00 00 
        v2.i = 1;
  400bf0:       c7 05 86 10 20 00 01    movl   $0x1,0x201086(%rip)        # 601c80 <v2>
  400bf7:       00 00 00 
        memory_order __b = __m & __memory_order_mask;
        __glibcxx_assert(__b != memory_order_acquire);
        __glibcxx_assert(__b != memory_order_acq_rel);
        __glibcxx_assert(__b != memory_order_consume);

        __atomic_store_n(&_M_i, __i, __m);
  400bfa:       c7 05 5c 10 20 00 00    movl   $0x0,0x20105c(%rip)        # 601c60 <b>
  400c01:       00 00 00 
        b.store(0, memory_order_release);

  

  400a58:       8b 05 02 12 20 00       mov    0x201202(%rip),%eax        # 601c60 <b>
            int b2 = b.load(memory_order_consume);
            if (b2 != 0) {
  400a5e:       85 c0                   test   %eax,%eax
  400a60:       75 f3                   jne    400a55 <main+0x55>
                continue
            }
            int i1 = v1.i;
  400a62:       8b 0d 58 12 20 00       mov    0x201258(%rip),%ecx        # 601cc0 <v1>
            int i2 = v2.i;
  400a68:       44 8b 05 11 12 20 00    mov    0x201211(%rip),%r8d        # 601c80 <v2>

看來Intel的Strong Memory Model已經保證了這一點,Memory Barrier都不需要了

(雖然標題里面有MemoryBarrier,但是內容里面根本沒涉及的樣子。。)

posted on 2016-01-19 16:13 右席 閱讀(16808) 評論(1)  編輯 收藏 引用 所屬分類: 搬磚之路
青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            欧美激情一区二区三区蜜桃视频 | 亚洲国产精品一区在线观看不卡| 亚洲一区在线免费| 国产精品成人av性教育| 亚洲欧美日韩第一区| 亚洲视频1区| 国产亚洲成年网址在线观看| 久久伊人精品天天| 免费久久久一本精品久久区| 一区二区欧美日韩| 亚洲一区二区影院| 狠狠干综合网| 亚洲精品美女91| 国产精品在线看| 老妇喷水一区二区三区| 美日韩精品免费| 亚洲影院一区| 久久人人97超碰国产公开结果| 亚洲国产精品久久91精品| 亚洲精品影视| 国产自产女人91一区在线观看| 欧美黄色影院| 国产精品久久久久高潮| 狂野欧美激情性xxxx| 欧美日韩天天操| 久久久亚洲影院你懂的| 欧美激情小视频| 久久久久欧美精品| 欧美日韩国产成人| 欧美.日韩.国产.一区.二区| 欧美日韩1区| 麻豆91精品| 国产精品日韩在线播放| 亚洲高清不卡| 韩国一区电影| 亚洲午夜三级在线| 日韩一区二区免费高清| 久久激情综合网| 午夜影视日本亚洲欧洲精品| 欧美电影免费观看大全| 麻豆成人在线| 国产精品区一区二区三区| 亚洲国产另类 国产精品国产免费| 国产精品揄拍一区二区| 亚洲日本在线观看| 亚洲国产精品悠悠久久琪琪| 亚洲欧美成人综合| 亚洲与欧洲av电影| 欧美日韩国产免费观看| 欧美激情一区二区三区在线视频观看 | 国精品一区二区三区| 一本色道久久88精品综合| 亚洲国产综合在线| 久久久久久久网| 久久成人一区二区| 国产精品美女久久久免费| 亚洲精品国产无天堂网2021| 亚洲人体1000| 欧美不卡一区| 亚洲国产精品国自产拍av秋霞| 黑丝一区二区三区| 久久精品盗摄| 美国十次成人| 亚洲电影自拍| 欧美国产精品v| 亚洲精品五月天| 中文在线不卡| 国产精品成人v| 亚洲欧美在线免费观看| 欧美一区2区三区4区公司二百 | 久久久久久久久久久久久9999| 欧美一区二区三区播放老司机 | 久热精品在线视频| 欧美成人中文字幕| 亚洲伦理久久| 国产精品对白刺激久久久| 亚洲午夜激情免费视频| 欧美一区二区观看视频| 国产一区二区高清| 久久亚洲春色中文字幕久久久| 美日韩精品免费观看视频| 91久久精品国产91久久性色| 欧美激情第二页| 亚洲图色在线| 老司机精品视频一区二区三区| 亚洲国产精品激情在线观看| 欧美精品手机在线| 中文国产成人精品| 久久夜色精品国产欧美乱极品| 在线观看亚洲一区| 欧美激情在线免费观看| 亚洲一区二区三区精品在线| 久久人人爽爽爽人久久久| 最新中文字幕一区二区三区| 欧美日韩亚洲精品内裤| 亚洲欧美综合精品久久成人| 欧美成人资源| 亚洲一区影音先锋| 在线观看91久久久久久| 欧美日韩网址| 久久精品国产亚洲aⅴ| 亚洲精品午夜精品| 久久精品国产77777蜜臀| 亚洲三级电影全部在线观看高清| 国产精品久久久久久影视| 久久免费高清视频| 亚洲一区二区成人在线观看| 欧美国产乱视频| 久久国产精品久久久久久电车| 亚洲人成在线播放| 国产主播在线一区| 欧美手机在线| 欧美精品xxxxbbbb| 久久久久国产精品午夜一区| 亚洲视频视频在线| 亚洲黄色免费电影| 久久亚洲春色中文字幕久久久| 亚洲无线视频| 亚洲激情一区二区| 国产综合久久久久久| 国产精品久久毛片a| 欧美岛国在线观看| 久久亚洲精品一区二区| 午夜精品一区二区三区四区| 亚洲免费观看高清在线观看| 欧美电影免费观看高清| 久久精品视频va| 午夜精品久久久久久99热| 日韩亚洲综合在线| 91久久精品日日躁夜夜躁国产| 国产一区二区三区久久久久久久久| 欧美日韩精品免费| 欧美另类人妖| 欧美片网站免费| 欧美成人国产| 欧美成人a∨高清免费观看| 久久理论片午夜琪琪电影网| 欧美有码在线观看视频| 午夜精品久久| 欧美一区二区视频在线| 亚洲欧美在线免费观看| 亚洲欧美综合网| 西西裸体人体做爰大胆久久久| 亚洲综合色丁香婷婷六月图片| 一区二区高清视频| 一区二区日韩精品| 中文国产成人精品| 亚洲女同精品视频| 亚洲欧美日韩综合国产aⅴ| 亚洲免费一级电影| 新狼窝色av性久久久久久| 欧美一二区视频| 久久精品视频导航| 久久综合五月| 欧美二区在线看| 欧美日韩精品一区二区三区| 国产精品ⅴa在线观看h| 国产精品视频第一区| 国产一区二区黄色| 亚洲国产精品一区二区www在线 | 国产精品网站视频| 国产综合色一区二区三区| 在线观看亚洲一区| 亚洲狼人综合| 香蕉久久夜色精品| 狼人社综合社区| 91久久综合| 亚洲欧美综合网| 老司机久久99久久精品播放免费| 欧美福利视频在线观看| 欧美午夜精品理论片a级大开眼界| 国产精品免费网站| 一区二区在线视频观看| 99re66热这里只有精品3直播| 亚洲综合国产| 欧美aⅴ一区二区三区视频| 亚洲激情成人| 欧美一级午夜免费电影| 欧美极品一区二区三区| 国产日产欧产精品推荐色 | 夜夜夜久久久| 久久国产主播精品| 亚洲国产一成人久久精品| 亚洲婷婷免费| 免费看黄裸体一级大秀欧美| 国产精品乱码| 亚洲美女在线国产| 久久久久.com| 一本到12不卡视频在线dvd| 久久精品女人| 国产精品不卡在线| 亚洲精品日韩精品| 久久久久88色偷偷免费| 一区二区电影免费观看| 久久综合九色综合网站| 国产日韩视频| 亚洲免费一级电影| 亚洲人成小说网站色在线| 久久久久久一区二区| 国产精品综合久久久|