青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

posts - 9,  comments - 19,  trackbacks - 0

0x0

前些天組里老司機@梁希在jvm的項目榨干機器性能之余,為了檢查下gcc編譯器和Intel Xoen CPU的正確性,寫了一組測試代碼測試了下mfence指令的效果

`
mfence Opcode : 0F AE /6

Performs a serializing operation on all load-from-memory and store-to-memory instructions that were issued prior the MFENCE instruction. This serializing operation guarantees that every load and store instruction that precedes in program order the MFENCE instruction is globally visible before any load or store instruction that follows the MFENCE instruction is globally visible. The MFENCE instruction is ordered with respect to all load and store instructions, other MFENCE instructions, any SFENCE and LFENCE instructions, and any serializing instructions (such as the CPUID instruction).
Weakly ordered memory types can be used to achieve higher processor performance through such techniques as out-of-order issue, speculative reads, write-combining, and write-collapsing.
The degree to which a consumer of data recognizes or knows that the data is weakly ordered varies among applications and may be unknown to the producer of this data. The MFENCE instruction provides a performance-efficient way of ensuring load and store ordering between routines that produce weakly-ordered results and routines that consume that data.
It should be noted that processors are free to speculatively fetch and cache data from system memory regions that are assigned a memory-type that permits speculative reads (that is, the WB, WC, and WT memory types). The PREFETCHh instruction is considered a hint to this speculative behavior. Because this speculative fetching can occur at any time and is not tied to instruction execution, the MFENCE instruction is not ordered with respect to PREFETCHh instructions or any other speculative fetching mechanism (that is, data could be speculatively loaded into the cache just before, during, or after the execution of an MFENCE instruction).
`

簡單來說就是一個可以在CPU亂序執行中保證真實的load/store順序的指令

0x1
老司機寫了一個小程序(注:有誤版)
// file: order.c

#define _GNU_SOURCE
#include <pthread.h>
#include <stdio.h>
#include <stdlib.h>
#include <assert.h>

union p64 {
    int i;
    char padding[64];
    long align8;
};

volatile union p64 v1, v2;
int b;

void *
run1(void *ignore)
{
    for (;;) {
        while (!b);
        if (v1.i || v2.i) {
            puts("assert error 1");
            exit(-1);
        }
        v1.i = 1;
        asm ("sfence": : :"memory");
        v2.i = 1;
        asm ("sfence": : :"memory");
        b = 0; 
    }
}

int
main()
{
    pthread_t p;
    pthread_create(&p, NULL, run1, NULL);
    int cnt = 0;

    for (;; cnt++) {
        v1.i = v2.i = 0;
        asm ("sfence": : :"memory");
        b = 1;
        asm ("sfence": : :"memory");
        int icnt = 0;
        for (;; icnt++) {
            int i1 = v1.i;
            asm ("lfence": : :"memory");
            int i2 = v2.i;
            if (i1 && i2)   break;
            if (i1 < i2) {
                printf("assert error, cnt = %d, icnt = %d, i1 = %d, i2 = %d\n", cnt, icnt, i1, i2);
                exit(-1);
            }
        }
    }
    return 0;
}

大概邏輯是: 一共有3個變量,v1.iv2.ib ,起了2個線程,一個順序寫入v1和v2,一個讀v1和v2,互相通過改變b的值來通訊,然后兩個線程不停循環。

這個程序會掛在
printf("assert error, cnt = %d, icnt = %d, i1 = %d, i2 = %d\n", cnt, icnt, i1, i2); 
這條斷言上,意思是線程1在順序寫入v1和v2,但是主線程卻出現讀到 v1=0,v2=1的情況。

0x2

然后我幫忙去看了一下,覺得這種寫法甚是粗暴,于是原樣照搬了一個c++11版:

#include <stdio.h>
#include <stdlib.h>
#include <assert.h>

#include <atomic>
#include <thread>

using namespace std;

union p64 {
    atomic<int> i;
    char padding[64];
    long align8;
};

volatile union p64 v1, v2;
atomic<int> b;

void *
run1()
{
    int rcnt = 0;
    for (;; rcnt++) {
        while (!b.load());
        if (v1.i.load() || v2.i.load()) {
            puts("assert error 1");
            exit(-1);
        }
        v1.i.store(1);
        v2.i.store(1);
        b.store(0);
    }
}

int
main()
{
    // init
    v1.i.store(0);
    v2.i.store(0);
    thread t(run1);
    int cnt = 0;
    for (;; cnt++) {
        v1.i.store(0);
        v2.i.store(0);
        b.store(1);
        int icnt = 0;
        for (;; icnt++) {
            int b2 = b.load();
            int i1 = v1.i.load();       // *****
            int i2 = v2.i.load();       // *****
            if (i1 && i2)   break;
            if (i1 < i2) {
                printf("assert error, cnt = %d, icnt = %d, i1 = %d, i2 = %d\n", cnt, icnt, i1, i2);
                exit(-1);
            }
            if (i1 == 0 && i2 == 0 && b2 == 0) break;
        }
    }
    return 0;
}

因為是原樣照搬,所以肯定還是會掛,但是畢竟語義上更好理解了

我們先來分析一下為什么會掛

  • 線程1對于v1,v2的寫入順序一定是一致的
  • Memory Barrier也保證了他們寫入順序對其他線程的可見性(很有迷惑性的一點)
  • 但是主線程卻可以讀到 v1=0,v2=1的情況
  • 所以情況就是雖然順序寫入了,但是別的線程沒有看到正確的順序?
  • Intel: 并不是!
  • 原因是搞錯了因果關系,他真正保證的順序是當你讀到v2的new value的時候,那么v1也一定被寫入了。
  • 解決方案就是互換上面代碼中我用**星號**標注出的兩行
  • done

在舊寫法中,掛掉的情況是線程1寫入v1 = 1,主線程讀v1,沒有讀到,那么主線程認為v1是0,然后線程1繼續寫入v2,主線程讀到了,主線程認為v2是1。 然后掛在了斷言上。

兩行互換后,主線程首先讀取v2,如果v2已經是1了,那么v1也一定是1,反之亦然。

0x3

當然,想讓跑通那個例子不需要那么多的atomic<>,精簡之后利用c++11的memory_order可以寫成如下:

#include <stdio.h>
#include <stdlib.h>
#include <assert.h>

#include <atomic>
#include <thread>

using namespace std;

union p64 {
    int i;
    char padding[64];
    long align8;
};

volatile union p64 v1, v2;
atomic<int> b;    // variable b as a guard

void *
run1()
{
    int rcnt = 0;
    for (;; rcnt++) {
        while (!b.load());
        if (v1.i || v2.i) {
            puts("assert error 1");
            exit(-1);
        }
        v1.i = 1;
        v2.i = 1;
        b.store(0, memory_order_release);
    }
}
int
main()
{
    // init
    v1.i = 0;
    v2.i = 0;
    thread t(run1);
    int cnt = 0;

    for (;; cnt++) {
        v1.i = 0;
        v2.i = 0;
        b.store(1, memory_order_release);
        int icnt = 0;
        for (;; icnt++) {
            int b2 = b.load(memory_order_acquire);
            if (b2 != 0) {
                continue
            }
            int i1 = v1.i;
            int i2 = v2.i;
            if (i1 && i2)   break;
            if (i1 < i2) {
                printf("assert error 2, cnt = %d, icnt =  %d, i1 = %d, i2 = %d\n", cnt, icnt, i1, i2);
                exit(-1);
            }
        }
    }
    return 0;
}

利用變量b在兩個線程之間同步,如下圖

 (Thead 1)

   v1.i = 1;
   v2.i = 1;
   
   b.store(0, memory_order_release) <---+
                                                             |
                                                synchronize with b
                                                 (happend before)
                                                             |
                                                            +----->  b.load(memory_order_acquire)
                                                                          
                                                                        i1 = v1.i
                                                                        i2 = v2.i

                                                                       (Thread 2)

我們查看下生成的代碼
g++ -std=c++11 -pthread -g -O2 order.cpp

 v1.i = 1;
  400be6:       c7 05 d0 10 20 00 01    movl   $0x1,0x2010d0(%rip)        # 601cc0 <v1>
  400bed:       00 00 00 
        v2.i = 1;
  400bf0:       c7 05 86 10 20 00 01    movl   $0x1,0x201086(%rip)        # 601c80 <v2>
  400bf7:       00 00 00 
        memory_order __b = __m & __memory_order_mask;
        __glibcxx_assert(__b != memory_order_acquire);
        __glibcxx_assert(__b != memory_order_acq_rel);
        __glibcxx_assert(__b != memory_order_consume);

        __atomic_store_n(&_M_i, __i, __m);
  400bfa:       c7 05 5c 10 20 00 00    movl   $0x0,0x20105c(%rip)        # 601c60 <b>
  400c01:       00 00 00 
        b.store(0, memory_order_release);

  

  400a58:       8b 05 02 12 20 00       mov    0x201202(%rip),%eax        # 601c60 <b>
            int b2 = b.load(memory_order_consume);
            if (b2 != 0) {
  400a5e:       85 c0                   test   %eax,%eax
  400a60:       75 f3                   jne    400a55 <main+0x55>
                continue
            }
            int i1 = v1.i;
  400a62:       8b 0d 58 12 20 00       mov    0x201258(%rip),%ecx        # 601cc0 <v1>
            int i2 = v2.i;
  400a68:       44 8b 05 11 12 20 00    mov    0x201211(%rip),%r8d        # 601c80 <v2>

看來Intel的Strong Memory Model已經保證了這一點,Memory Barrier都不需要了

(雖然標題里面有MemoryBarrier,但是內容里面根本沒涉及的樣子。。)

posted on 2016-01-19 16:13 右席 閱讀(16808) 評論(1)  編輯 收藏 引用 所屬分類: 搬磚之路
青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            亚洲一区二区黄色| 另类激情亚洲| 亚洲网站在线观看| 国产精品久久午夜| 久久精品二区三区| 美女视频黄免费的久久| 亚洲日韩第九十九页| 99香蕉国产精品偷在线观看| 欧美三日本三级三级在线播放| 亚洲小少妇裸体bbw| 亚洲免费小视频| 伊人成人开心激情综合网| 免费成人小视频| 欧美日韩免费高清一区色橹橹| 亚洲一区二区少妇| 欧美亚洲专区| 亚洲人成小说网站色在线| 日韩一级大片| 国语精品中文字幕| 亚洲黄色免费电影| 欧美系列亚洲系列| 欧美成人精品在线观看| 欧美日韩一区在线观看视频| 久久狠狠久久综合桃花| 欧美不卡高清| 久久成人国产| 欧美欧美在线| 开心色5月久久精品| 欧美日韩国产首页在线观看| 久久精品国产2020观看福利| 女女同性女同一区二区三区91| 亚洲一区二区三区四区中文| 久久米奇亚洲| 欧美在线观看视频一区二区三区| 老司机午夜精品视频| 亚洲欧美一区二区三区久久 | 欧美一级视频| 每日更新成人在线视频| 欧美在线一二三四区| 欧美福利视频网站| 美女91精品| 国产酒店精品激情| 亚洲最新在线视频| 亚洲精品国产精品乱码不99| 亚洲欧美日韩成人高清在线一区| 日韩午夜免费视频| 久久在线播放| 久久免费黄色| 国产亚洲一区二区三区| 一区二区欧美在线| 99精品视频免费| 美女脱光内衣内裤视频久久网站| 欧美在线黄色| 国产乱码精品一区二区三区五月婷| 亚洲国产精品va| 在线日韩电影| 久久久一二三| 久久亚洲二区| 在线观看91精品国产入口| 欧美一区二区三区婷婷月色| 午夜老司机精品| 国产精品久久久久久久久久三级 | 欧美 日韩 国产在线| 国产主播一区二区三区| 午夜视频一区| 久久日韩粉嫩一区二区三区| 国产欧美日韩一区二区三区| 亚洲女人天堂成人av在线| 亚洲欧美在线网| 国产精品日本| 欧美在线观看天堂一区二区三区 | 亚洲国产精品一区二区三区| 老鸭窝91久久精品色噜噜导演| 老司机一区二区三区| 一区二区在线视频播放| 久久亚洲视频| 亚洲精品社区| 亚洲欧美在线看| 国产亚洲欧美一级| 久久视频国产精品免费视频在线 | 西西裸体人体做爰大胆久久久| 国产精品高清一区二区三区| 亚洲桃色在线一区| 久久免费国产精品| 亚洲欧洲视频| 国产精品久久久久久久午夜片| 亚洲一区二区三区在线看| 久久精品日韩一区二区三区| 在线日韩精品视频| 欧美破处大片在线视频| 亚洲欧美另类在线| 男女视频一区二区| 亚洲视频999| 黑丝一区二区三区| 欧美精品一区二区精品网| 亚洲视频免费观看| 久久一日本道色综合久久| 亚洲日本理论电影| 国产精品私拍pans大尺度在线 | 亚洲欧洲日韩综合二区| 亚洲免费在线视频| 在线观看视频一区二区| 欧美日韩视频专区在线播放 | 欧美在线视频观看| 亚洲精品视频在线观看网站| 欧美一区二区三区免费视频| 91久久精品久久国产性色也91| 国产精品电影网站| 久热re这里精品视频在线6| 一区二区三区四区国产| 美女露胸一区二区三区| 亚洲欧美区自拍先锋| 亚洲国产精品久久精品怡红院| 国产精品久久久久久影院8一贰佰 国产精品久久久久久影视 | 亚洲精品少妇| 国产一区二区三区精品欧美日韩一区二区三区 | 亚洲精品国产拍免费91在线| 久久精品日产第一区二区三区| 亚洲精品欧洲精品| 国产一区二区三区在线观看精品 | 亚洲欧洲日本一区二区三区| 国产日韩欧美在线视频观看| 欧美日本不卡高清| 欧美**字幕| 久久久久久高潮国产精品视| 亚洲欧美国产高清| 99精品福利视频| 亚洲欧洲精品一区| 欧美成人午夜激情| 毛片精品免费在线观看| 欧美主播一区二区三区| 亚洲综合国产激情另类一区| 亚洲乱码国产乱码精品精98午夜| …久久精品99久久香蕉国产 | 欧美天堂亚洲电影院在线观看| 欧美成人免费va影院高清| 久久免费精品视频| 久久理论片午夜琪琪电影网| 午夜欧美大尺度福利影院在线看| 亚洲午夜一区二区三区| 一区二区三区精品视频| 一道本一区二区| 亚洲视频精选| 亚洲永久精品大片| 亚洲欧美99| 亚洲欧美国产精品桃花| 亚洲欧美国产高清| 欧美一区国产二区| 久久国产加勒比精品无码| 欧美在线网站| 久久亚洲色图| 欧美精品成人| 欧美午夜一区二区三区免费大片| 欧美无砖砖区免费| 国产麻豆一精品一av一免费| 国产亚洲欧美在线| 亚洲国产精品久久久久久女王| 最新成人av在线| 一区二区成人精品| 亚洲欧美在线另类| 久久免费视频在线| 亚洲风情在线资源站| 亚洲精品乱码久久久久久蜜桃91 | 一本色道**综合亚洲精品蜜桃冫| 亚洲另类自拍| 亚洲欧美在线另类| 久久一区二区三区av| 欧美成人一区二区在线| 欧美午夜视频在线观看| 国产午夜精品久久久久久免费视| 伊人精品在线| 一区二区欧美国产| 久久久精彩视频| 亚洲欧洲精品一区二区精品久久久| 日韩网站在线观看| 欧美中文字幕| 欧美日韩中文在线观看| 国产午夜精品福利| av成人国产| 久久这里有精品视频| 最近中文字幕日韩精品 | 午夜精彩视频在线观看不卡| 久久综合色一综合色88| 国产精品福利av| 亚洲国产一区二区三区a毛片| 亚洲一区二区三区四区五区午夜| 久久综合亚州| 夜夜嗨av一区二区三区网站四季av | 9i看片成人免费高清| 久久不射电影网| 亚洲精品影院在线观看| 久久精品人人| 国产精品丝袜久久久久久app| 亚洲国产欧美在线人成| 久久精品72免费观看| 日韩午夜免费视频| 美女视频网站黄色亚洲| 国产一区二区你懂的| 亚洲欧美精品在线| 亚洲三级性片|