• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            巢穴

            about:blank

            【轉(zhuǎn)】線程同步-自旋鎖與Mutex/信號量的區(qū)別和聯(lián)系

            POSIX threads(簡稱Pthreads)是在多核平臺上進行并行編程的一套常用的API。線程同步(Thread Synchronization)是并行編程中非常重要的通訊手段,其中最典型的應用就是用Pthreads提供的鎖機制(lock)來對多個線程之間共 享的臨界區(qū)(Critical Section)進行保護(另一種常用的同步機制是barrier)。

            Pthreads提供了多種鎖機制:
            (1) Mutex(互斥量):pthread_mutex_***
            (2) Spin lock(自旋鎖):pthread_spin_***
            (3) Condition Variable(條件變量):pthread_con_***
            (4) Read/Write lock(讀寫鎖):pthread_rwlock_***

            Pthreads提供的Mutex鎖操作相關(guān)的API主要有:
            pthread_mutex_lock (pthread_mutex_t *mutex);
            pthread_mutex_trylock (pthread_mutex_t *mutex);
            pthread_mutex_unlock (pthread_mutex_t *mutex);

            Pthreads提供的與Spin Lock鎖操作相關(guān)的API主要有:
            pthread_spin_lock (pthread_spinlock_t *lock);
            pthread_spin_trylock (pthread_spinlock_t *lock);
            pthread_spin_unlock (pthread_spinlock_t *lock);

            從實現(xiàn)原理上來講,Mutex屬于sleep-waiting類型的鎖。例如在一個雙核的機器上有兩個線程(線程A和線程B),它們分別運行在Core0和Core1上。假設線程A想要通過pthread_mutex_lock操作去得到一個臨界區(qū)的鎖,而此時這個鎖正被線程B所持有,那么線程A就會被阻塞(blocking),Core0 會在此時進行上下文切換(Context Switch)將線程A置于等待隊列中,此時Core0就可以運行其他的任務(例如另一個線程C)而不必進行忙等待。而Spin lock則不然,它屬于busy-waiting類型的鎖,如果線程A是使用pthread_spin_lock操作去請求鎖,那么線程A就會一直在 Core0上進行忙等待并不停的進行鎖請求,直到得到這個鎖為止。

            如果大家去查閱Linux glibc中對pthreads API的實現(xiàn)NPTL(Native POSIX Thread Library) 的源碼的話(使用”getconf GNU_LIBPTHREAD_VERSION”命令可以得到我們系統(tǒng)中NPTL的版本號),就會發(fā)現(xiàn)pthread_mutex_lock()操作如果沒有鎖成功的話就會調(diào)用system_wait()的系統(tǒng)調(diào)用并將當前線程加入該mutex的等待隊列里。而spin lock則可以理解為在一個while(1)循環(huán)中用內(nèi)嵌的匯編代碼實現(xiàn)的鎖操作(印象中看過一篇論文介紹說在linux內(nèi)核中spin lock操作只需要兩條CPU指令,解鎖操作只用一條指令就可以完成)。有興趣的朋友可以參考另一個名為sanos的微內(nèi)核中pthreds API的實現(xiàn):mutex.c spinlock.c,盡管與NPTL中的代碼實現(xiàn)不盡相同,但是因為它的實現(xiàn)非常簡單易懂,對我們理解spin lock和mutex的特性還是很有幫助的。

            那么在實際編程中mutex和spin lcok哪個的性能更好呢?我們知道spin lock在Linux內(nèi)核中有非常廣泛的利用,那么這是不是說明spin lock的性能更好呢?下面讓我們來用實際的代碼測試一下(請確保你的系統(tǒng)中已經(jīng)安裝了最近的g++)。

            查看源代碼打印幫助001 // Name: spinlockvsmutex1.cc  

            002 // Source: [url]http://www.alexonlinux.com/pthread-mutex-vs-pthread-spinlock[/url]  

            003 // Compiler(<FONT style="BACKGROUND-COLOR: #00ffff">spin lock</FONT> version): g++ -o spin_version -DUSE_SPINLOCK spinlockvsmutex1.cc -lpthread  

            004 // Compiler(mutex version): g++ -o mutex_version spinlockvsmutex1.cc -lpthread  

            005 #include <stdio.h>  

            006 #include <unistd.h>  

            007 #include <sys/syscall.h>  

            008 #include <errno.h>  

            009 #include <sys/time.h>  

            010 #include <list>  

            011 #include <pthread.h>  

            012   

            013 #define LOOPS 50000000  

            014   

            015 using namespace std;  

            016   

            017 list<int> the_list;  

            018   

            019 #ifdef USE_SPINLOCK  

            020 pthread_spinlock_t spinlock;  

            021 #else  

            022 pthread_mutex_t mutex;  

            023 #endif  

            024   

            025 //Get the thread id  

            026 pid_t gettid() { return syscall( __NR_gettid ); }  

            027   

            028 void *consumer(void *ptr)  

            029 {  

            030     int i;  

            031   

            032     printf("Consumer TID %lun", (unsigned long)gettid());  

            033   

            034     while (1)  

            035     {  

            036 #ifdef USE_SPINLOCK  

            037         pthread_spin_lock(&spinlock);  

            038 #else  

            039         pthread_mutex_lock(&mutex);  

            040 #endif  

            041   

            042         if (the_list.empty())  

            043         {  

            044 #ifdef USE_SPINLOCK  

            045             pthread_spin_unlock(&spinlock);  

            046 #else  

            047             pthread_mutex_unlock(&mutex);  

            048 #endif  

            049             break;  

            050         }  

            051   

            052         i = the_list.front();  

            053         the_list.pop_front();  

            054   

            055 #ifdef USE_SPINLOCK  

            056         pthread_spin_unlock(&spinlock);  

            057 #else  

            058         pthread_mutex_unlock(&mutex);  

            059 #endif  

            060     }  

            061   

            062     return NULL;  

            063 }  

            064   

            065 int main()  

            066 {  

            067     int i;  

            068     pthread_t thr1, thr2;  

            069     struct timeval tv1, tv2;  

            070   

            071 #ifdef USE_SPINLOCK  

            072     pthread_spin_init(&spinlock, 0);  

            073 #else  

            074     pthread_mutex_init(&mutex, NULL);  

            075 #endif  

            076   

            077     // Creating the list content...  

            078     for (i = 0; i < LOOPS; i++)  

            079         the_list.push_back(i);  

            080   

            081     // Measuring time before starting the threads...  

            082     gettimeofday(&tv1, NULL);  

            083   

            084     pthread_create(&thr1, NULL, consumer, NULL);  

            085     pthread_create(&thr2, NULL, consumer, NULL);  

            086   

            087     pthread_join(thr1, NULL);  

            088     pthread_join(thr2, NULL);  

            089   

            090     // Measuring time after threads finished...  

            091     gettimeofday(&tv2, NULL);  

            092   

            093     if (tv1.tv_usec > tv2.tv_usec)  

            094     {  

            095         tv2.tv_sec--;  

            096         tv2.tv_usec += 1000000;  

            097     }  

            098   

            099     printf("Result - %ld.%ldn", tv2.tv_sec - tv1.tv_sec,  

            100         tv2.tv_usec - tv1.tv_usec);  

            101   

            102 #ifdef USE_SPINLOCK  

            103     pthread_spin_destroy(&spinlock);  

            104 #else  

            105     pthread_mutex_destroy(&mutex);  

            106 #endif  

            107   

            108     return 0;  

            109 }

            該程序運行過程如下:主線程先初始化一個list結(jié)構(gòu),并根據(jù)LOOPS的值將對應數(shù)量的entry插入該list,之后創(chuàng)建兩個新線程,它們都執(zhí)行consumer()這個任務。兩個被創(chuàng)建的新線程同時對這個list進行pop操作。主線程會計算從創(chuàng)建兩個新線程到兩個新線程結(jié)束之間所用的時間,輸出為下文中的”Result “。

            測試機器參數(shù):
            Ubuntu 9.04 X86_64
            Intel(R) Core(TM)2 Duo CPU E8400 @ 3.00GHz
            4.0 GB Memory

            從下面是測試結(jié)果:

            查看源代碼打印幫助01 pxcwan@pxcwan-desktop:~/Workspace/mutex$ g++ -o spin_version -DUSE_SPINLOCK spinvsmutex1.cc -lpthread  

            02 pxcwan@pxcwan-desktop:~/Workspace/mutex$ g++ -o mutex_version spinvsmutex1.cc -lpthread  

            03 pxcwan@pxcwan-desktop:~/Workspace/mutex$ time ./spin_version  

            04 Consumer TID 5520  

            05 Consumer TID 5521  

            06 Result - 5.888750  

            07   

            08 real    0m10.918s  

            09 user    0m15.601s  

            10 sys    0m0.804s  

            11   

            12 pxcwan@pxcwan-desktop:~/Workspace/mutex$ time ./mutex_version  

            13 Consumer TID 5691  

            14 Consumer TID 5692  

            15 Result - 9.116376  

            16   

            17 real    0m14.031s  

            18 user    0m12.245s  

            19 sys    0m4.368s

            可以看見spin lock的版本在該程序中表現(xiàn)出來的性能更好。另外值得注意的是sys時間,mutex版本花費了更多的系統(tǒng)調(diào)用時間,這就是因為mutex會在鎖沖突時調(diào)用system wait造成的。

            但是,是不是說spin lock就一定更好了呢?讓我們再來看一個鎖沖突程度非常劇烈的實例程序:

            查看源代碼打印幫助01 //Name: svm2.c  

            02 //Source: [url]http://www.solarisinternals.com/wiki/index.php/DTrace_Topics_Locks[/url]  

            03 //Compile(<FONT style="BACKGROUND-COLOR: #00ffff">spin lock</FONT> version): gcc -o spin -DUSE_SPINLOCK svm2.c -lpthread  

            04 //Compile(mutex version): gcc -o mutex svm2.c -lpthread  

            05 #include <stdio.h>  

            06 #include <stdlib.h>  

            07 #include <pthread.h>  

            08 #include <sys/syscall.h>  

            09   

            10 #define        THREAD_NUM     2  

            11   

            12 pthread_t g_thread[THREAD_NUM];  

            13 #ifdef USE_SPINLOCK  

            14 pthread_spinlock_t g_spin;  

            15 #else  

            16 pthread_mutex_t g_mutex;  

            17 #endif  

            18 __uint64_t g_count;  

            19   

            20 pid_t gettid()  

            21 {  

            22     return syscall(SYS_gettid);  

            23 }  

            24   

            25 void *run_amuck(void *arg)  

            26 {  

            27        int i, j;  

            28   

            29        printf("Thread %lu started.n", (unsigned long)gettid());  

            30   

            31        for (i = 0; i < 10000; i++) {  

            32 #ifdef USE_SPINLOCK  

            33            pthread_spin_lock(&g_spin);  

            34 #else  

            35                pthread_mutex_lock(&g_mutex);  

            36 #endif  

            37                for (j = 0; j < 100000; j++) {  

            38                        if (g_count++ == 123456789)  

            39                                printf("Thread %lu wins!n", (unsigned long)gettid());  

            40                }  

            41 #ifdef USE_SPINLOCK  

            42            pthread_spin_unlock(&g_spin);  

            43 #else  

            44                pthread_mutex_unlock(&g_mutex);  

            45 #endif  

            46        }  

            47   

            48        printf("Thread %lu finished!n", (unsigned long)gettid());  

            49   

            50        return (NULL);  

            51 }  

            52   

            53 int main(int argc, char *argv[])  

            54 {  

            55        int i, threads = THREAD_NUM;  

            56   

            57        printf("Creating %d threads...n", threads);  

            58 #ifdef USE_SPINLOCK  

            59        pthread_spin_init(&g_spin, 0);  

            60 #else  

            61        pthread_mutex_init(&g_mutex, NULL);  

            62 #endif  

            63        for (i = 0; i < threads; i++)  

            64                pthread_create(&g_thread[i], NULL, run_amuck, (void *) i);  

            65   

            66        for (i = 0; i < threads; i++)  

            67                pthread_join(g_thread[i], NULL);  

            68   

            69        printf("Done.n");  

            70   

            71        return (0);  

            72 }

            這個程序的特征就是臨界區(qū)非常大,這樣兩個線程的鎖競爭會非常的劇烈。當然這個是一個極端情況,實際應用程序中臨界區(qū)不會如此大,鎖競爭也不會如此激烈。測試結(jié)果顯示mutex版本性能更好:

            查看源代碼打印幫助01 pxcwan@pxcwan-desktop:~/Workspace/mutex$ time ./spin  

            02 Creating 2 threads...  

            03 Thread 31796 started.  

            04 Thread 31797 started.  

            05 Thread 31797 wins!  

            06 Thread 31797 finished!  

            07 Thread 31796 finished!  

            08 Done.  

            09   

            10 real    0m5.748s  

            11 user    0m10.257s  

            12 sys    0m0.004s  

            13   

            14 pxcwan@pxcwan-desktop:~/Workspace/mutex$ time ./mutex  

            15 Creating 2 threads...  

            16 Thread 31801 started.  

            17 Thread 31802 started.  

            18 Thread 31802 wins!  

            19 Thread 31802 finished!  

            20 Thread 31801 finished!  

            21 Done.  

            22   

            23 real    0m4.823s  

            24 user    0m4.772s  

            25 sys    0m0.032s

            另外一個值得注意的細節(jié)是spin lock耗費了更多的user time。這就是因為兩個線程分別運行在兩個核上,大部分時間只有一個線程能拿到鎖,所以另一個線程就一直在它運行的core上進行忙等待,CPU占用率一直是100%;而mutex則不同,當對鎖的請求失敗后上下文切換就會發(fā)生,這樣就能空出一個核來進行別的運算任務了。(其實這種上下文切換對已經(jīng)拿著鎖的那個線程性能也是有影響的,因為當該線程釋放該鎖時它需要通知操作系統(tǒng)去喚醒那些被阻塞的線程,這也是額外的開銷)

            總結(jié)
            (1)Mutex適合對鎖操作非常頻繁的場景,并且具有更好的適應性。盡管相比spin lock它會花費更多的開銷(主要是上下文切換),但是它能適合實際開發(fā)中復雜的應用場景,在保證一定性能的前提下提供更大的靈活度。

            (2)spin lock的lock/unlock性能更好(花費更少的cpu指令),但是它只適應用于臨界區(qū)運行時間很短的場景。而在實際軟件開發(fā)中,除非程序員對自己的程序的鎖操作行為非常的了解,否則使用spin lock不是一個好主意(通常一個多線程程序中對鎖的操作有數(shù)以萬次,如果失敗的鎖操作(contended lock requests)過多的話就會浪費很多的時間進行空等待)。

            (3)更保險的方法或許是先(保守的)使用 Mutex,然后如果對性能還有進一步的需求,可以嘗試使用spin lock進行調(diào)優(yōu)。畢竟我們的程序不像Linux kernel那樣對性能需求那么高(Linux Kernel最常用的鎖操作是spin lock和rw lock)。

            2010年3月3日補記:這個觀點在Oracle的文檔中得到了支持:

            During configuration, Berkeley DB selects a mutex implementation for the architecture. Berkeley DB normally prefers blocking-mutex implementations over non-blocking ones. For example, Berkeley DB will select POSIX pthread mutex interfaces rather than assembly-code test-and-set spin mutexes because pthread mutexes are usually more efficient and less likely to waste CPU cycles spinning without getting any work accomplished.

            p.s.調(diào)用syscall(SYS_gettid)和syscall( __NR_gettid )都可以得到當前線程的id:)

            轉(zhuǎn)載請注明來自: [url]www.parallellabs.com[/url]
            ------------------------------------------------------------------------------

            spinlock與linux內(nèi)核調(diào)度的關(guān)系


              作者:劉洪濤,華清遠見嵌入式培訓中心高級講師,ARM公司授權(quán)ATC講師。

            廣告插播信息
            維庫最新熱賣芯片:

              關(guān)于自旋鎖用法介紹的文章,已經(jīng)有很多,但有些細節(jié)的地方點的還不夠透。我這里就把我個人認為大家容易有疑問的地方拿出來討論一下。

              一、自旋鎖(spinlock)簡介

              自旋鎖在同一時刻只能被最多一個內(nèi)核任務持有,所以一個時刻只有一個線程允許存在于臨界區(qū)中。這點可以應用在多處理機器、或運行在單處理器上的搶占式內(nèi)核中需要的鎖定服務。

              二、信號量簡介

              這里也介紹下信號量的概念,因為它的用法和自旋鎖有相似的地方。

              Linux中的信號量是一種睡眠鎖。如果有一個任務試圖獲得一個已被持有的信號量時,信號量會將其推入等待隊列,然后讓其睡眠。這時處理器獲得自由去執(zhí)行其它代碼。當持有信號量的進程將信號量釋放后,在等待隊列中的一個任務將被喚醒,從而便可以獲得這個信號量。

              三、自旋鎖和信號量對比

              在很多地方自旋鎖和信號量可以選擇任何一個使用,但也有一些地方只能選擇某一種。下面對比一些兩者的用法。

              表1-1自旋鎖和信號量對比










              四、自旋鎖與linux內(nèi)核進程調(diào)度關(guān)系

              我們討論下表1-1中的第3種情況(其它幾種情況比較好理解),如果臨界區(qū)可能包含引起睡眠的代碼則不能使用自旋鎖,否則可能引起死鎖。

              那么為什么信號量保護的代碼可以睡眠而自旋鎖就不能呢?

              先看下自旋鎖的實現(xiàn)方法吧,自旋鎖的基本形式如下:

              spin_lock(&mr_lock);

              //臨界區(qū)

              spin_unlock(&mr_lock);

              跟蹤一下spin_lock(&mr_lock)的實現(xiàn)

              #define spin_lock(lock) _spin_lock(lock)

              #define _spin_lock(lock) __LOCK(lock)

              #define __LOCK(lock) \

              do { preempt_disable(); __acquire(lock); (void)(lock); } while (0)

              注意到“preempt_disable()”,這個調(diào)用的功能是“關(guān)搶占”(在spin_unlock中會重新開啟搶占功能)。從中可以看出,使用自旋鎖保護的區(qū)域是工作在非搶占的狀態(tài);即使獲取不到鎖,在“自旋”狀態(tài)也是禁止搶占的。了解到這,我想咱們應該能夠理解為何自旋鎖保護的代碼不能睡眠了。試想一下,如果在自旋鎖保護的代碼中間睡眠,此時發(fā)生進程調(diào)度,則可能另外一個進程會再次調(diào)用spinlock保護的這段代碼。而我們現(xiàn)在知道了即使在獲取不到鎖的“自旋”狀態(tài),也是禁止搶占的,而“自旋”又是動態(tài)的,不會再睡眠了,也就是說在這個處理器上不會再有進程調(diào)度發(fā)生了,那么死鎖自然就發(fā)生了。

              咱們可以總結(jié)下自旋鎖的特點:

              ● 單處理器非搶占內(nèi)核下:自旋鎖會在編譯時被忽略;

              ● 單處理器搶占內(nèi)核下:自旋鎖僅僅當作一個設置內(nèi)核搶占的開關(guān);

              ● 多處理器下:此時才能完全發(fā)揮出自旋鎖的作用,自旋鎖在內(nèi)核中主要用來防止多處理器中并發(fā)訪問臨界區(qū),防止內(nèi)核搶占造成的競爭。

              五、linux搶占發(fā)生的時間

              最后在了解下linux搶占發(fā)生的時間,搶占分為用戶搶占和內(nèi)核搶占。

              用戶搶占在以下情況下產(chǎn)生:

              ● 從系統(tǒng)調(diào)用返回用戶空間

              ● 從中斷處理程序返回用戶空間

              內(nèi)核搶占會發(fā)生在:

              ● 當從中斷處理程序返回內(nèi)核空間的時候,且當時內(nèi)核具有可搶占性;

              ● 當內(nèi)核代碼再一次具有可搶占性的時候。(如:spin_unlock時)

              ● 如果內(nèi)核中的任務顯式的調(diào)用schedule()

              ● 如果內(nèi)核中的任務阻塞。

              基本的進程調(diào)度就是發(fā)生在時鐘中斷后,并且發(fā)現(xiàn)進程的時間片已經(jīng)使用完了,則發(fā)生進程搶占。通常我們會利用中斷處理程序返回內(nèi)核空間的時候可以進行內(nèi)核搶占這個特性來提高一些I/O操作的實時性,如:當I/O事件發(fā)生的是時候,對應的中斷處理程序被激活,當它發(fā)現(xiàn)有進程在等待這個I/O事件的時候,它會激活等待進程,并且設置當前正在執(zhí)行進程的need_resched標志,這樣在中斷處理程序返回的時候,調(diào)度程序被激活,原來在等待I/O事件的進程(很可能)獲得執(zhí)行權(quán),從而保證了對I/O事件的相對快速響應(毫秒級)。可以看出,在I/O事件發(fā)生的時候,I/O事件的處理進程會搶占當前進程,系統(tǒng)的響應速度與調(diào)度時間片的長度無關(guān)。

            posted on 2010-09-21 15:15 Vincent 閱讀(3028) 評論(0)  編輯 收藏 引用 所屬分類: 多線程

            欧美午夜精品久久久久免费视| 亚洲精品国产自在久久| 久久久久亚洲AV成人网人人网站 | 亚洲精品乱码久久久久久蜜桃 | 国产精品一区二区久久| 伊人久久五月天| 国产精品xxxx国产喷水亚洲国产精品无码久久一区 | 久久九九久精品国产| 97久久精品人妻人人搡人人玩| 青青热久久国产久精品 | 99久久久精品| 香蕉久久夜色精品升级完成| 午夜精品久久久久成人| 久久成人国产精品一区二区| 久久99热精品| 97精品久久天干天天天按摩| 久久强奷乱码老熟女网站| 久久久久国产成人精品亚洲午夜| 精品熟女少妇av免费久久| 丁香色欲久久久久久综合网| 亚洲欧美国产日韩综合久久| 久久精品国产99久久久香蕉| 日本免费一区二区久久人人澡 | 激情综合色综合久久综合| 久久久久久a亚洲欧洲aⅴ| 精品久久久噜噜噜久久久| 无码AV中文字幕久久专区| 丁香色欲久久久久久综合网| 国内精品久久久久影院亚洲| 亚洲精品高清一二区久久| 一本色综合久久| 久久中文字幕人妻熟av女| 久久九九久精品国产免费直播| 色老头网站久久网| 久久无码AV一区二区三区| 国产69精品久久久久观看软件| 亚洲欧美一区二区三区久久| 波多野结衣久久一区二区| 国产精品久久久久久久人人看| 久久久久久久综合狠狠综合| 最新久久免费视频|