關于多進程和多線程,教科書上最經典的一句話是“進程是資源分配的最小單位,線程是CPU調度的最小單位”。這句話應付考試基本上夠了,但如果在工作中遇到類似的選擇問題,那就沒有那么簡單了,選的不好,會讓你深受其害。
經常在網絡上看到有XDJM問“多進程好還是多線程好?”、"Linux下用多進程還是多線程?"等等期望一勞永逸的問題,只能說:沒有最好,只有更好,根據實際情況來判斷,哪個更加合適就是哪個好。
我們按照多個不同的維度,來看看多進程和多線程的對比(注:因為是感性的比較,因此都是相對的,不是說一個好得不得了,另一個差的無法忍受)
維度 | 多進程 | 多線程 | 總結 |
數據共享、同步 | 數據是分開的:共享復雜,需要用IPC;同步簡單 | 多線程共享進程數據:共享簡單;同步復雜 | 各有優勢 |
內存、CPU | 占用內存多,切換復雜,CPU利用率低 | 占用內存少,切換簡單,CPU利用率高 | 線程占優 |
創建銷毀、切換 | 創建銷毀、切換復雜,速度慢 | 創建銷毀、切換簡單,速度快 | 線程占優 |
編程調試 | 編程簡單,調試簡單 | 編程復雜,調試復雜 | 進程占優 |
可靠性 | 進程間不會相互影響 | 一個線程掛掉將導致整個進程掛掉 | 進程占優 |
分布式 | 適應于多核、多機分布 ;如果一臺機器不夠,擴展到多臺機器比較簡單 | 適應于多核分布 | 進程占優 |
1)需要頻繁創建銷毀的優先用線程。
實例:web服務器。來一個建立一個線程,斷了就銷毀線程。要是用進程,創建和銷毀的代價是很難承受的。
2)需要進行大量計算的優先使用線程。
所謂大量計算,當然就是要消耗很多cpu,切換頻繁了,這種情況先線程是最合適的。
實例:圖像處理、算法處理
3)強相關的處理用線程,若相關的處理用進程。
什么叫強相關、弱相關?理論上很難定義,給個簡單的例子就明白了。
一般的server需要完成如下任務:消息收發和消息處理。消息收發和消息處理就是弱相關的任務,而消息處理里面可能又分為消息解碼、業務處理,這兩個任務相對來說相關性就要強多了。因此消息收發和消息處理可以分進程設計,消息解碼和業務處理可以分線程設計。
4)可能擴展到多機分布的用進程,多核分布的用線程。
5)都滿足需求的情況下,用你最熟悉、最拿手的方式。
至于”數據共享、同步“、“編程、調試”、“可靠性”這幾個維度的所謂的“復雜、簡單”應該怎么取舍,只能說:沒有明確的選擇方法。一般有一個選擇原則:如果多進程和多線程都能夠滿足要求,那么選擇你最熟悉、最拿手的那個。
需要提醒的是:雖然有這么多的選擇原則,但實際應用中都是“進程+線程”的結合方式,千萬不要真的陷入一種非此即彼的誤區。
轉自:http://software.intel.com/zh-cn/blogs/2010/07/20/400004478/
轉自:http://blog.chinaunix.net/uid-20556054-id-3061450.html