• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            loop_in_codes

            低調做技術__歡迎移步我的獨立博客 codemaro.com 微博 kevinlynx

            淺析glibc中thread tls的一處bug

            最早的時候是在程序初始化過程中開啟了一個timer(timer_create),這個timer第一次觸發的時間較短時就會引起程序core掉,core的位置也是不定的。使用valgrind可以發現有錯誤的內存寫入:

            ==31676== Invalid write of size 8
            ==31676==    at 0x37A540F852: _dl_allocate_tls_init (in /lib64/ld-2.5.so)
            ==31676==    by 0x4E26BD3: pthread_create@@GLIBC_2.2.5 (in /lib64/libpthread-2.5.so)
            ==31676==    by 0x76E0B00: timer_helper_thread (in /lib64/librt-2.5.so)
            ==31676==    by 0x4E2673C: start_thread (in /lib64/libpthread-2.5.so)
            ==31676==    by 0x58974BC: clone (in /lib64/libc-2.5.so)
            ==31676==  Address 0xf84dbd0 is 0 bytes after a block of size 336 alloc'd
            ==31676==    at 0x4A05430: calloc (vg_replace_malloc.c:418)
            ==31676==    by 0x37A5410082: _dl_allocate_tls (in /lib64/ld-2.5.so)
            ==31676==    by 0x4E26EB8: pthread_create@@GLIBC_2.2.5 (in /lib64/libpthread-2.5.so)
            ==31676==    by 0x76E0B00: timer_helper_thread (in /lib64/librt-2.5.so)
            ==31676==    by 0x4E2673C: start_thread (in /lib64/libpthread-2.5.so)
            ==31676==    by 0x58974BC: clone (in /lib64/libc-2.5.so)
            

            google _dl_allocate_tls_init 相關發現一個glibc的bug Bug 13862 和我的情況有點類似。本文就此bug及tls相關實現做一定闡述。

            需要查看glibc的源碼,如何確認使用的glibc的版本,可以這樣:

            $ /lib/libc.so.6
            GNU C Library stable release version 2.5, by Roland McGrath et al.
            ...
            

            為了方便,還可以直接在(glibc Cross Reference)[http://osxr.org/glibc/source/?v=glibc-2.17]網頁上進行查看,版本不同,但影響不大。

            BUG描述

            要重現13862 BUG作者提到要滿足以下條件:

            The use of a relatively large number of dynamic libraries, loaded at runtime using dlopen.

            The use of thread-local-storage within those libraries.

            A thread exiting prior to the number of loaded libraries increasing a significant amount, followed by a new thread being created after the number of libraries has increased.

            簡單來說,就是在加載一大堆包含TLS變量的動態庫的過程中,開啟了一個線程,這個線程退出后又開啟了另一個線程。

            這和我們的問題場景很相似。不同的是我們使用的是timer,但timer在觸發時也是開啟新的線程,并且這個線程會立刻退出:

            /nptl/sysdeps/unix/sysv/linux/timer_routines.c

            timer_helper_thread(...)  // 用于檢測定時器觸發的輔助線程
            {
                ...
                  pthread_t th;
                  (void) pthread_create (&th, &tk->attr, timer_sigev_thread, // 開啟一個新線程調用用戶注冊的定時器函數
                             td);
                ...
            }

            要重現此BUG可以使用我的實驗代碼 thread-tls,或者使用Bug 13862 中的附件

            TLS相關實現

            可以順著_dl_allocate_tls_init函數的實現查看相關聯的部分代碼。該函數遍歷所有加載的包含TLS變量的模塊,初始化一個線程的TLS數據結構。

            每一個線程都有自己的堆棧空間,其中單獨存儲了各個模塊的TLS變量,從而實現TLS變量在每一個線程中都有單獨的拷貝。TLS與線程的關聯關系可以查看下圖:

            應用層使用的pthread_t實際是個pthread對象的地址。創建線程時線程的堆棧空間和pthread結構是一塊連續的內存。但這個地址并不指向這塊內存的首地址。相關代碼:/nptl/allocatestack.c allocate_stack,該函數分配線程的堆棧內存。

            pthread第一個成員是tcbhead_ttcbhead_tdtv指向了一個dtv_t數組,該數組的大小隨著當前程序載入的模塊多少而動態變化。每一個模塊被載入時,都有一個l_tls_modid,其直接作為dtv_t數組的下標索引。tcbhead_t中的dtv實際指向的是dtv_t第二個元素,第一個元素用于記錄整個dtv_t數組有多少元素,第二個元素也做特殊使用,從第三個元素開始,才是用于存儲TLS變量。

            一個dtv_t存儲的是一個模塊中所有TLS變量的地址,當然這些TLS變量都會被放在連續的內存空間里。dtv_t::pointer::val正是用于指向這塊內存的指針。對于非動態加載的模塊它指向的是線程堆棧的位置;否則指向動態分配的內存位置。

            以上結構用代碼描述為,

            union dtv_t {
                size_t counter;
                struct {
                    void *val; /* point to tls variable memory */
                    bool is_static;
                } pointer;
            };
             
            struct tcbhead_t {
                void *tcb;
                dtv_t *dtv; /* point to a dtv_t array */
                void *padding[22]; /* other members i don't care */
            };
            
            struct pthread {
                tcbhead_t tcb;
                /* more members i don't care */
            };

            dtv是一個用于以模塊為單位存儲TLS變量的數組

            實際代碼參看 /nptl/descr.h 及 nptl/sysdeps/x86_64/tls.h。

            實驗

            使用g++ -o thread -g -Wall -lpthread -ldl thread.cpp編譯代碼,即在創建線程前加載了一個.so:

            Breakpoint 1, dump_pthread (id=1084229952) at thread.cpp:40
            40          printf("pthread %p, dtv %p\n", pd, dtv);
            (gdb) set $dtv=pd->tcb.dtv
            (gdb) p $dtv[-1]
            $1 = {counter = 17, pointer = {val = 0x11, is_static = false}}
            (gdb) p $dtv[3]
            $2 = {counter = 18446744073709551615, pointer = {val = 0xffffffffffffffff, is_static = false}}
            

            dtv[3]對應著動態加載的模塊,is_static=falseval被初始化為-1:

            /elf/dl-tls.c _dl_allocate_tls_init

            if (map->l_tls_offset == NO_TLS_OFFSET
               || map->l_tls_offset == FORCED_DYNAMIC_TLS_OFFSET)
             {
               /* For dynamically loaded modules we simply store
                  the value indicating deferred allocation.  */
               dtv[map->l_tls_modid].pointer.val = TLS_DTV_UNALLOCATED;
               dtv[map->l_tls_modid].pointer.is_static = false;
               continue;
             }

            dtv數組大小之所以為17,可以參看代碼 /elf/dl-tls.c allocate_dtv

            // dl_tls_max_dtv_idx 隨著載入模塊的增加而增加,載入1個.so則是1 
            
            dtv_length = GL(dl_tls_max_dtv_idx) + DTV_SURPLUS; // DTV_SURPLUS 14
            dtv = calloc (dtv_length + 2, sizeof (dtv_t));
            if (dtv != NULL)
             {
               /* This is the initial length of the dtv.  */
               dtv[0].counter = dtv_length;

            繼續上面的實驗,當調用到.so中的function時,其TLS被初始化,此時dtv[3]val指向初始化后的TLS變量地址:

            68          fn();
            (gdb)
            0x601808, 0x601804, 0x601800
            72          return 0;
            (gdb) p $dtv[3]
            $3 = {counter = 6297600, pointer = {val = 0x601800, is_static = false}}
            (gdb) x/3xw 0x601800
            0x601800:       0x55667788      0xaabbccdd      0x11223344
            

            這個時候還可以看看dtv[1]中的內容,正是指向了pthread前面的內存位置:

            (gdb) p $dtv[1]
            $5 = {counter = 1084229936, pointer = {val = 0x40a00930, is_static = true}}
            (gdb) p/x tid
            $7 = 0x40a00940
            

            結論:

            • 線程中TLS變量的存儲是以模塊為單位的

            so模塊加載

            這里也并不太需要查看dlopen等具體實現,由于使用__thread來定義TLS變量,整個實現涉及到ELF加載器的一些細節,深入下去內容較多。這里直接通過實驗的手段來了解一些實現即可。

            上文已經看到,在創建線程前如果動態加載了.so,dtv數組的大小是會隨之增加的。如果是在線程創建后再載入.so呢?

            使用g++ -o thread -g -Wall -lpthread -ldl thread.cpp -DTEST_DTV_EXPAND -DSO_CNT=1編譯程序,調試得到:

            73          load_sos();
            (gdb)
            0x601e78, 0x601e74, 0x601e70
            
            Breakpoint 1, dump_pthread (id=1084229952) at thread.cpp:44
            44          printf("pthread %p, dtv %p\n", pd, dtv);
            (gdb) p $dtv[-1]
            $3 = {counter = 17, pointer = {val = 0x11, is_static = false}}
            (gdb) p $dtv[4]
            $4 = {counter = 6299248, pointer = {val = 0x601e70, is_static = false}}
            

            在新載入了.so時,dtv數組大小并沒有新增,dtv[4]直接被拿來使用。

            因為dtv初始大小為16,那么當載入的.so超過這個數字的時候會怎樣?

            使用g++ -o thread -g -Wall -lpthread -ldl thread.cpp -DTEST_DTV_EXPAND編譯程序:

            ...
            pthread 0x40a00940, dtv 0x6016a0
            ...
            Breakpoint 1, dump_pthread (id=1084229952) at thread.cpp:44
            44          printf("pthread %p, dtv %p\n", pd, dtv);
            (gdb) p dtv
            $2 = (dtv_t *) 0x6078a0
            (gdb) p dtv[-1]
            $3 = {counter = 32, pointer = {val = 0x20, is_static = false}}
            (gdb) p dtv[5]
            $4 = {counter = 6300896, pointer = {val = 0x6024e0, is_static = false}}
            

            可以看出,dtv被重新分配了內存(0x6016a0 -> 0x6078a0)并做了擴大。

            以上得出結論:

            • 創建線程前dtv的大小會根據載入模塊數量決定
            • 創建線程后新載入的模塊會動態擴展dtv的大小(必要的時候)

            pthread堆棧重用

            allocate_stack中分配線程堆棧時,有一個從緩存中取的操作:

            allocate_stack(..) {
                ...
                pd = get_cached_stack (&size, &mem);
                ...
            }
            /* Get a stack frame from the cache.  We have to match by size since
               some blocks might be too small or far too large.  */
            get_cached_stack(...) {
                ...
                list_for_each (entry, &stack_cache) // 根據size從stack_cache中取
                { ... }
                ...
                /* Clear the DTV.  */
                dtv_t *dtv = GET_DTV (TLS_TPADJ (result));
                for (size_t cnt = 0; cnt < dtv[-1].counter; ++cnt)
                    if (! dtv[1 + cnt].pointer.is_static
                            && dtv[1 + cnt].pointer.val != TLS_DTV_UNALLOCATED)
                        free (dtv[1 + cnt].pointer.val);
                memset (dtv, '\0', (dtv[-1].counter + 1) * sizeof (dtv_t));
            
                /* Re-initialize the TLS.  */
                _dl_allocate_tls_init (TLS_TPADJ (result));
            }

            get_cached_stack會把取出的pthread中的dtv重新初始化。注意 _dl_allocate_tls_init 中是根據模塊列表來初始化dtv數組的。

            實驗

            當一個線程退出后,它就可能被當做cache被get_cached_stack取出復用。

            使用g++ -o thread -g -Wall -lpthread -ldl thread.cpp -DTEST_CACHE_STACK編譯程序,運行:

            $ ./thread
            ..
            pthread 0x413c9940, dtv 0x1be46a0
            ... 
            pthread 0x413c9940, dtv 0x1be46a0
            

            回顧BUG

            當新創建的線程復用了之前退出的線程堆棧時,由于在_dl_allocate_tls_init中初始化dtv數組時是根據當前載入的模塊數量而定。如果在這個時候模塊數已經超過了這個復用的dtv數組大小,那么就會出現寫入非法的內存。使用valgrind檢測就會得到本文開頭提到的結果。

            由于dtv數組大小通常會稍微大點,所以在新加載的模塊數量不夠多時程序還不會有問題。可以通過控制測試程序中SO_CNT的大小看看dtv中內容的變化。

            另外,我查看了下glibc的更新歷史,到目前為止(2.20)這個BUG還沒有修復。

            參考文檔

            posted on 2014-10-07 21:38 Kevin Lynx 閱讀(3613) 評論(1)  編輯 收藏 引用 所屬分類: c/c++

            評論

            # re: 淺析glibc中thread tls的一處bug 2014-10-08 09:37 Enic

            linux各種坑  回復  更多評論   

            久久无码av三级| 99久久中文字幕| 一本久久免费视频| 久久精品国产亚洲AV久| 久久精品99久久香蕉国产色戒| 久久91精品国产91久久户| 99久久国产综合精品五月天喷水 | 国产精品狼人久久久久影院 | 亚洲精品无码成人片久久| 久久婷婷五月综合97色| 久久精品国产亚洲AV不卡| 色综合久久综合中文综合网| 品成人欧美大片久久国产欧美 | 中文精品99久久国产| 久久精品国产只有精品2020| 久久婷婷色香五月综合激情 | 久久线看观看精品香蕉国产| 亚洲伊人久久成综合人影院 | 久久亚洲国产精品成人AV秋霞| WWW婷婷AV久久久影片| 欧美国产精品久久高清| 精品乱码久久久久久久| 国产精品久久新婚兰兰| 青青热久久国产久精品 | 伊人久久无码精品中文字幕| 亚洲国产成人久久综合碰碰动漫3d| 国产精品成人久久久| 三级片免费观看久久| 精品综合久久久久久88小说| 久久精品国产亚洲AV无码麻豆 | 久久精品黄AA片一区二区三区| 亚洲综合久久久| 久久久精品国产亚洲成人满18免费网站 | 国内精品久久久久久久久电影网| 精品久久久久久亚洲精品| 漂亮人妻被中出中文字幕久久| 久久综合伊人77777| 久久久久亚洲av毛片大| 少妇久久久久久被弄到高潮| 亚洲精品tv久久久久| 香蕉aa三级久久毛片|