青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

posts - 9,  comments - 19,  trackbacks - 0

0x0

前些天組里老司機@梁希在jvm的項目榨干機器性能之余,為了檢查下gcc編譯器和Intel Xoen CPU的正確性,寫了一組測試代碼測試了下mfence指令的效果

`
mfence Opcode : 0F AE /6

Performs a serializing operation on all load-from-memory and store-to-memory instructions that were issued prior the MFENCE instruction. This serializing operation guarantees that every load and store instruction that precedes in program order the MFENCE instruction is globally visible before any load or store instruction that follows the MFENCE instruction is globally visible. The MFENCE instruction is ordered with respect to all load and store instructions, other MFENCE instructions, any SFENCE and LFENCE instructions, and any serializing instructions (such as the CPUID instruction).
Weakly ordered memory types can be used to achieve higher processor performance through such techniques as out-of-order issue, speculative reads, write-combining, and write-collapsing.
The degree to which a consumer of data recognizes or knows that the data is weakly ordered varies among applications and may be unknown to the producer of this data. The MFENCE instruction provides a performance-efficient way of ensuring load and store ordering between routines that produce weakly-ordered results and routines that consume that data.
It should be noted that processors are free to speculatively fetch and cache data from system memory regions that are assigned a memory-type that permits speculative reads (that is, the WB, WC, and WT memory types). The PREFETCHh instruction is considered a hint to this speculative behavior. Because this speculative fetching can occur at any time and is not tied to instruction execution, the MFENCE instruction is not ordered with respect to PREFETCHh instructions or any other speculative fetching mechanism (that is, data could be speculatively loaded into the cache just before, during, or after the execution of an MFENCE instruction).
`

簡單來說就是一個可以在CPU亂序執(zhí)行中保證真實的load/store順序的指令

0x1
老司機寫了一個小程序(注:有誤版)
// file: order.c

#define _GNU_SOURCE
#include <pthread.h>
#include <stdio.h>
#include <stdlib.h>
#include <assert.h>

union p64 {
    int i;
    char padding[64];
    long align8;
};

volatile union p64 v1, v2;
int b;

void *
run1(void *ignore)
{
    for (;;) {
        while (!b);
        if (v1.i || v2.i) {
            puts("assert error 1");
            exit(-1);
        }
        v1.i = 1;
        asm ("sfence": : :"memory");
        v2.i = 1;
        asm ("sfence": : :"memory");
        b = 0; 
    }
}

int
main()
{
    pthread_t p;
    pthread_create(&p, NULL, run1, NULL);
    int cnt = 0;

    for (;; cnt++) {
        v1.i = v2.i = 0;
        asm ("sfence": : :"memory");
        b = 1;
        asm ("sfence": : :"memory");
        int icnt = 0;
        for (;; icnt++) {
            int i1 = v1.i;
            asm ("lfence": : :"memory");
            int i2 = v2.i;
            if (i1 && i2)   break;
            if (i1 < i2) {
                printf("assert error, cnt = %d, icnt = %d, i1 = %d, i2 = %d\n", cnt, icnt, i1, i2);
                exit(-1);
            }
        }
    }
    return 0;
}

大概邏輯是: 一共有3個變量,v1.iv2.ib ,起了2個線程,一個順序寫入v1和v2,一個讀v1和v2,互相通過改變b的值來通訊,然后兩個線程不停循環(huán)。

這個程序會掛在
printf("assert error, cnt = %d, icnt = %d, i1 = %d, i2 = %d\n", cnt, icnt, i1, i2); 
這條斷言上,意思是線程1在順序寫入v1和v2,但是主線程卻出現(xiàn)讀到 v1=0,v2=1的情況。

0x2

然后我?guī)兔θタ戳艘幌拢X得這種寫法甚是粗暴,于是原樣照搬了一個c++11版:

#include <stdio.h>
#include <stdlib.h>
#include <assert.h>

#include <atomic>
#include <thread>

using namespace std;

union p64 {
    atomic<int> i;
    char padding[64];
    long align8;
};

volatile union p64 v1, v2;
atomic<int> b;

void *
run1()
{
    int rcnt = 0;
    for (;; rcnt++) {
        while (!b.load());
        if (v1.i.load() || v2.i.load()) {
            puts("assert error 1");
            exit(-1);
        }
        v1.i.store(1);
        v2.i.store(1);
        b.store(0);
    }
}

int
main()
{
    // init
    v1.i.store(0);
    v2.i.store(0);
    thread t(run1);
    int cnt = 0;
    for (;; cnt++) {
        v1.i.store(0);
        v2.i.store(0);
        b.store(1);
        int icnt = 0;
        for (;; icnt++) {
            int b2 = b.load();
            int i1 = v1.i.load();       // *****
            int i2 = v2.i.load();       // *****
            if (i1 && i2)   break;
            if (i1 < i2) {
                printf("assert error, cnt = %d, icnt = %d, i1 = %d, i2 = %d\n", cnt, icnt, i1, i2);
                exit(-1);
            }
            if (i1 == 0 && i2 == 0 && b2 == 0) break;
        }
    }
    return 0;
}

因為是原樣照搬,所以肯定還是會掛,但是畢竟語義上更好理解了

我們先來分析一下為什么會掛

  • 線程1對于v1,v2的寫入順序一定是一致的
  • Memory Barrier也保證了他們寫入順序對其他線程的可見性(很有迷惑性的一點)
  • 但是主線程卻可以讀到 v1=0,v2=1的情況
  • 所以情況就是雖然順序寫入了,但是別的線程沒有看到正確的順序?
  • Intel: 并不是!
  • 原因是搞錯了因果關系,他真正保證的順序是當你讀到v2的new value的時候,那么v1也一定被寫入了。
  • 解決方案就是互換上面代碼中我用**星號**標注出的兩行
  • done

在舊寫法中,掛掉的情況是線程1寫入v1 = 1,主線程讀v1,沒有讀到,那么主線程認為v1是0,然后線程1繼續(xù)寫入v2,主線程讀到了,主線程認為v2是1。 然后掛在了斷言上。

兩行互換后,主線程首先讀取v2,如果v2已經(jīng)是1了,那么v1也一定是1,反之亦然。

0x3

當然,想讓跑通那個例子不需要那么多的atomic<>,精簡之后利用c++11的memory_order可以寫成如下:

#include <stdio.h>
#include <stdlib.h>
#include <assert.h>

#include <atomic>
#include <thread>

using namespace std;

union p64 {
    int i;
    char padding[64];
    long align8;
};

volatile union p64 v1, v2;
atomic<int> b;    // variable b as a guard

void *
run1()
{
    int rcnt = 0;
    for (;; rcnt++) {
        while (!b.load());
        if (v1.i || v2.i) {
            puts("assert error 1");
            exit(-1);
        }
        v1.i = 1;
        v2.i = 1;
        b.store(0, memory_order_release);
    }
}
int
main()
{
    // init
    v1.i = 0;
    v2.i = 0;
    thread t(run1);
    int cnt = 0;

    for (;; cnt++) {
        v1.i = 0;
        v2.i = 0;
        b.store(1, memory_order_release);
        int icnt = 0;
        for (;; icnt++) {
            int b2 = b.load(memory_order_acquire);
            if (b2 != 0) {
                continue
            }
            int i1 = v1.i;
            int i2 = v2.i;
            if (i1 && i2)   break;
            if (i1 < i2) {
                printf("assert error 2, cnt = %d, icnt =  %d, i1 = %d, i2 = %d\n", cnt, icnt, i1, i2);
                exit(-1);
            }
        }
    }
    return 0;
}

利用變量b在兩個線程之間同步,如下圖

 (Thead 1)

   v1.i = 1;
   v2.i = 1;
   
   b.store(0, memory_order_release) <---+
                                                             |
                                                synchronize with b
                                                 (happend before)
                                                             |
                                                            +----->  b.load(memory_order_acquire)
                                                                          
                                                                        i1 = v1.i
                                                                        i2 = v2.i

                                                                       (Thread 2)

我們查看下生成的代碼
g++ -std=c++11 -pthread -g -O2 order.cpp

 v1.i = 1;
  400be6:       c7 05 d0 10 20 00 01    movl   $0x1,0x2010d0(%rip)        # 601cc0 <v1>
  400bed:       00 00 00 
        v2.i = 1;
  400bf0:       c7 05 86 10 20 00 01    movl   $0x1,0x201086(%rip)        # 601c80 <v2>
  400bf7:       00 00 00 
        memory_order __b = __m & __memory_order_mask;
        __glibcxx_assert(__b != memory_order_acquire);
        __glibcxx_assert(__b != memory_order_acq_rel);
        __glibcxx_assert(__b != memory_order_consume);

        __atomic_store_n(&_M_i, __i, __m);
  400bfa:       c7 05 5c 10 20 00 00    movl   $0x0,0x20105c(%rip)        # 601c60 <b>
  400c01:       00 00 00 
        b.store(0, memory_order_release);

  

  400a58:       8b 05 02 12 20 00       mov    0x201202(%rip),%eax        # 601c60 <b>
            int b2 = b.load(memory_order_consume);
            if (b2 != 0) {
  400a5e:       85 c0                   test   %eax,%eax
  400a60:       75 f3                   jne    400a55 <main+0x55>
                continue
            }
            int i1 = v1.i;
  400a62:       8b 0d 58 12 20 00       mov    0x201258(%rip),%ecx        # 601cc0 <v1>
            int i2 = v2.i;
  400a68:       44 8b 05 11 12 20 00    mov    0x201211(%rip),%r8d        # 601c80 <v2>

看來Intel的Strong Memory Model已經(jīng)保證了這一點,Memory Barrier都不需要了

(雖然標題里面有MemoryBarrier,但是內(nèi)容里面根本沒涉及的樣子。。)

posted on 2016-01-19 16:13 右席 閱讀(16802) 評論(1)  編輯 收藏 引用 所屬分類: 搬磚之路
青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            激情婷婷久久| 母乳一区在线观看| 亚洲一区二区三区午夜| 国产精品久久久久天堂| 欧美一区二区三区精品电影| 欧美电影免费| 久久精品视频在线看| 99日韩精品| 亚洲人成网站影音先锋播放| 国产日韩欧美精品在线| 欧美日韩国内| 午夜精品短视频| 免费在线欧美视频| 欧美一级久久久| 亚洲欧美日韩高清| 一本一道久久综合狠狠老精东影业 | 亚洲电影观看| 免费成人高清视频| 蜜臀av国产精品久久久久| 亚洲一区二区精品视频| 亚洲激情女人| 亚洲国产合集| 亚洲精品一区二区三区蜜桃久| 欧美成人综合| 91久久精品一区| 亚洲欧洲精品一区二区三区 | 亚洲精品社区| 亚洲精品一区久久久久久| 久久亚洲午夜电影| 免费亚洲电影在线| 欧美激情亚洲| 日韩视频欧美视频| 亚洲免费在线视频| 久久米奇亚洲| 欧美区亚洲区| 国产精品日韩高清| 美女精品在线观看| 欧美电影免费观看高清| 久久久久99| 免费成人av在线| 欧美国产先锋| 国产精品a久久久久| 欧美午夜精品| 在线观看亚洲精品视频| 国产一区深夜福利| 亚洲美女视频网| 亚洲一区二区在线| 欧美大秀在线观看| 亚洲无亚洲人成网站77777 | 欧美自拍偷拍| 欧美一站二站| 久久久久成人网| 国产一区二区三区电影在线观看 | 亚洲精品四区| 性欧美1819sex性高清| 欧美精品首页| 国产精品久久久久一区二区三区| 在线观看国产成人av片| 性欧美1819性猛交| 老司机一区二区三区| 亚洲一区二区三区视频播放| 欧美激情精品久久久久久久变态| 一色屋精品视频在线观看网站| 亚洲欧美激情视频在线观看一区二区三区 | 一区二区三区四区五区精品| 久久婷婷综合激情| 国产欧美日韩91| 香蕉免费一区二区三区在线观看| 亚洲国产精品va在线看黑人 | 夜夜精品视频| 尤物在线观看一区| 久久全球大尺度高清视频| 久久激五月天综合精品| 国产曰批免费观看久久久| 久久婷婷蜜乳一本欲蜜臀| 国产精品裸体一区二区三区| 国内精品久久久久影院薰衣草| 香蕉av福利精品导航| 亚洲欧美日韩精品一区二区| 国产欧美大片| 欧美国产一区二区三区激情无套| 欧美成人精品h版在线观看| 韩国成人福利片在线播放| 久久国产精品黑丝| 午夜国产一区| 欧美性jizz18性欧美| 在线看片一区| 亚洲日本欧美日韩高观看| 欧美日本不卡| 国产午夜精品全部视频播放| 久久亚洲欧洲| 欧美日韩ab| 六月丁香综合| 国产精品久久久久久一区二区三区 | 久久成人精品电影| 亚洲人成在线观看一区二区| 一区二区三区日韩欧美精品| 国产自产2019最新不卡| 91久久精品国产91久久| 国产综合久久久久影院| 一本高清dvd不卡在线观看| 伊人成人在线视频| 亚洲欧美乱综合| 在线视频精品| 欧美激情一区| 欧美国产免费| 亚洲色图制服丝袜| 亚洲高清在线播放| 亚洲影音先锋| 一区二区三区国产盗摄| 欧美成人免费小视频| 久久裸体视频| 亚洲午夜精品一区二区| 国产精品www色诱视频| 亚洲国产日韩欧美| 亚洲国产精品一区| 久久免费黄色| 欧美国产精品日韩| 亚洲国产一成人久久精品| 久久久精品一品道一区| 亚洲一区制服诱惑| 欧美三级电影精品| 亚洲一区国产| 99这里只有精品| 欧美精品九九| 欧美激情一区二区三区在线视频观看 | 伊人婷婷久久| 裸体一区二区三区| 亚洲福利在线视频| 亚洲美女啪啪| 国产精品一卡二卡| 亚洲精品久久嫩草网站秘色| 一区二区激情| 国产一本一道久久香蕉| 久久久久国产精品www| 欧美日韩国产精品一卡| 99国产精品视频免费观看| 欧美一级片一区| 亚洲精品视频在线观看免费| 国产精品夜夜夜| 麻豆9191精品国产| 香蕉尹人综合在线观看| 亚洲国产1区| 久久久不卡网国产精品一区| 伊人成人开心激情综合网| 欧美精品手机在线| 亚洲一区免费在线观看| 久久免费高清视频| 亚洲欧美综合网| 在线精品国产欧美| 欧美成人精品一区二区| 一区二区三区 在线观看视| 翔田千里一区二区| 欧美日韩不卡| 久久亚洲欧洲| 一区二区三区高清在线| 久久婷婷蜜乳一本欲蜜臀| 亚洲天堂成人在线观看| 国产在线不卡视频| 国产欧美日韩亚洲精品| 欧美激情国产日韩精品一区18| 亚洲午夜一区二区三区| 久久久夜色精品亚洲| 欧美中文字幕在线观看| 亚洲一区在线免费观看| 亚洲女人天堂成人av在线| 亚洲少妇一区| 亚洲欧美视频一区| 性伦欧美刺激片在线观看| 午夜国产一区| 久久久久综合网| 另类国产ts人妖高潮视频| 欧美α欧美αv大片| 欧美激情精品久久久久| 亚洲国产一区二区三区青草影视| 欧美激情视频一区二区三区免费 | 国产香蕉97碰碰久久人人| 国产精品美女久久久久av超清| 国产精品久久午夜夜伦鲁鲁| 国产精品萝li| 在线看日韩av| 亚洲欧美日韩国产综合在线 | 日韩视频久久| 免费久久精品视频| 欧美日韩三级在线| 国产精品爽黄69| 精品动漫3d一区二区三区免费版 | 久久精品国产综合| 欧美大片专区| 亚洲天堂网在线观看| 欧美一区二区在线免费观看| 欧美大胆人体视频| 国产一区二区三区在线观看视频 | 亚洲国产综合视频在线观看| 亚洲日本电影| 午夜视频在线观看一区二区三区 | 欧美日韩国产系列| 亚洲黄色在线看| 欧美激情欧美激情在线五月| 久久久久久一区二区|