青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

幾種壓縮算法原理介紹

2006年1月12日RLE

RLE又叫Run Length Encoding,是一個針對無損壓縮的非常簡單的算法。它用重復字節和重復的次數來簡單描述來代替重復的字節。盡管簡單并且對于通常的壓縮非常低效,但它有的時候卻非常有用(例如,JPEG就使用它)。

1.1. 原理

2.1顯示了一個如何使用RLE算法來對一個數據流編碼的例子,其中出現六次的符號‘93’已經用3個字節來代替:一個標記字節(‘0’在本例中)重復的次數(‘6’)和符號本身(‘93’)。

RLE解碼器遇到符號‘0的時候,它表明后面的兩個字節決定了需要輸出哪個符號以及輸出多少次。

1.2. 實現

RLE可以使用很多不同的方法。基本壓縮庫中詳細實現的方式是非常有效的一個。一個特殊的標記字節用來指示重復節的開始,而不是對于重復非重復節都coding run

因此非重復節可以有任意長度而不被控制字節打斷,除非指定的標記字節出現在非重復節(頂多以兩個字節來編碼)的稀有情況下。為了最優化效率,標記字節應該是輸入流中最少出現的符號(或許就不存在)。

重復runs能夠在32768字節的時候運轉。少于129字節的要求3個字節編碼(標記+次數+符號),而大雨128字節要求四個字節(標記+次數的高4|0x80+次數的低4位)。這是通常所有采用的壓縮的做法,并且也是相比較三個字節固定編碼(允許使用3個字節來編碼256個字節)而言非常少見的有損壓縮率的方法。

在這種模式下,最壞的壓縮結果是:

輸出大小=257/256*輸入大小+1

2.   哈夫曼

哈夫曼編碼是無損壓縮當中最好的方法。它使用預先二進制描述來替換每個符號,長度由特殊符號出現的頻率決定。常見的符號需要很少的位來表示,而不常見的符號需要很多為來表示。

哈夫曼算法在改變任何符號二進制編碼引起少量密集表現方面是最佳的。然而,它并不處理符號的順序和重復或序號的序列。

2.1. 原理

我不打算探究哈夫曼編碼的所有實際的細節,但基本的原理是為每個符號找到新的二進制表示,從而通常符號使用很少的位,不常見的符號使用較多的位。

簡短的說,這個問題的解決方案是為了查找每個符號的通用程度,我們建立一個未壓縮數據的柱狀圖;通過遞歸拆分這個柱狀圖為兩部分來創建一個二叉樹,每個遞歸的一半應該和另一半具有同樣的權(權是NK =1符號數k, N是分之中符號的數量,符號數k是符號k出現的次數

這棵樹有兩個目的:

1.  編碼器使用這棵樹來找到每個符號最優的表示方法

2.  解碼器使用這棵樹唯一的標識在壓縮流中每個編碼的開始和結束,其通過在讀壓縮數據位的時候自頂向底的遍歷樹,選擇基于數據流中的每個獨立位的分支,一旦一個到達葉子節點,解碼器知道一個完整的編碼已經讀出來了。

我們來看一個例子會讓我們更清楚。圖2.2顯示了一個10個字節的未壓縮的數據。

根據符號頻率,哈夫曼編碼器生成哈夫曼樹(圖2.4)和相應的編碼表示(圖2.3)。

 

你可以看到,常見的符號接近根,因此只要少數位來表示。于是最終的壓縮數據流如圖2.5所示。

壓縮后的數據流是24位(三個字節),原來是80位(10個字節)。當然,我應該存儲哈夫曼樹,這樣解碼器就能夠解碼出對應的壓縮流了,這就使得該例子中的真正數據流比輸入的流數據量大。這是相對較短的數據上的副作用。對于大數據量來說,上面的哈夫曼樹就不占太多比例了。

解碼的時候,從上到下遍歷樹,為壓縮的流選擇從左/右分支,每次碰到一個葉子節點的時候,就可以將對應的字節寫到解壓輸出流中,然后再從根開始遍歷。

2.2. 實現

哈夫曼編碼器可以在基本壓縮庫中找到,其是非常直接的實現。

這個實現的基本缺陷是:

1.  慢位流實現

2.  相當慢的解碼(比編碼慢)

3.  最大的樹深度是32(編碼器在任何超過32位大小的時候退出)。如果我不是搞錯的話,這是不可能的,除非輸出的數據大于232字節。

另一方面,這個實現有幾個優點:

1.  哈夫曼樹以一個緊密的形式每個符號要求12位(對于8位的符號)的方式存儲,這意味著最大的頭為384。

2.  編碼相當容易理解

哈夫曼編碼在數據有噪音的情況(不是有規律的,例如RLE)下非常好,這中情況下大多數基于字典方式的編碼器都有問題。

3.   Rice

對于由大word(例如:1632位)組成的數據和教低的數據值,Rice編碼能夠獲得較好的壓縮比。音頻和高動態變化的圖像都是這種類型的數據,它們被某種預言預處理過(例如delta相鄰的采樣)。

盡管哈夫曼編碼處理這種數據是最優的,卻由于幾個原因而不適合處理這種數據(例如:32位大小要求16GB的柱狀圖緩沖區來進行哈夫曼樹編碼)。因此一個比較動態的方式更適合由大word組成的數據。

3.1. 原理

Rice編碼背后的基本思想是盡可能的用較少的位來存儲多個字(正像使用哈夫曼編碼一樣)。實際上,有人可能想到Rice是靜態的哈夫曼編碼(例如,編碼不是由實際數據內容的統計信息決定,而是由小的值比高的值常見的假定決定)。

編碼非常簡單:將值XX個‘1’位之后跟一個0位來表示。

3.2. 實現

在基本壓縮庫針對Rice做了許多優化:

1.  每個字最沒有意義的位被存儲為k和最有意義的N-k位用Rice編碼。K作為先前流中少許采樣的位平均數。這是通常最好使用Rice編碼的方法,隱藏噪音且對于動態變化的范圍并不導致非常長的Rice編碼。

2.  如果rice編碼比固定的開端長,T,一個可選的編碼:輸出T個‘1’位,緊跟(log2(X-T))個‘1’和一個‘0’位,接著是X-T(最沒有意義的(log2(X-T))-1位)。這對于大值來說都是比較高效的代碼并且阻止可笑的長Rice編碼(最壞的情況,對于一個32word單個Rice編碼可能變成232位或512MB)。

如果開端是4,下面是結果編碼表:

X

bin

Rice

Thresholded

Rice

0

00000

0

0

 

1

00001

10

10

 

2

00010

110

110

 

3

00011

1110

1110

 

4

00100

11110

11110

 

5

00101

111110

111110

 

6

00110

1111110

11111100

+1

7

00111

11111110

11111101

 

8

01000

111111110

1111111000

+1

9

01001

1111111110

1111111001

 

10

01010

11111111110

1111111010

-1

11

01011

111111111110

1111111011

-2

12

01100

1111111111110

111111110000

 

13

01101

11111111111110

111111110001

-1

14

01110

111111111111110

111111110010

-2

15

01111

1111111111111110

111111110011

-3

16

10000

11111111111111110

111111110100

-4

17

10001

111111111111111110

111111110101

-5

18

10010

1111111111111111110

111111110110

-6

19

10011

11111111111111111110

111111110111

-7

20

10100

111111111111111111110

11111111100000

-5

就像你看到的一樣,在這個實現中使用threshold方法僅僅兩個編碼導致一個最壞的情況;剩下的編碼產生比標準Rice編碼還要短的編碼。

3.  最壞的情況,輸出。

4.   Lempel-Ziv (LZ77)

Lempel-Ziv壓縮模式有許多不同的變量。基本壓縮庫有清晰的LZ77算法的實現(Lempel-Ziv1977),執行的很好,源代碼也非常容易理解。

LZ編碼器能用來通用目標的壓縮,特別對于文本執行的很好。它也在RLE和哈夫曼編碼器(RLE,LZ,哈夫曼)中使用來大多數情況下獲得更多的壓縮。

4.1. 原理

LZ壓縮算法的背后是使用RLE算法用先前出現的相同字節序列的引用來替代。

簡單的講,LZ算法被認為是字符串匹配的算法。例如:在一段文本中某字符串經常出現,并且可以通過前面文本中出現的字符串指針來表示。當然這個想法的前提是指針應該比字符串本身要短。

例如,在上一段短語“字符串”經常出現,可以將除第一個字符串之外的所有用第一個字符串引用來表示從而節省一些空間。

一個字符串引用通過下面的方式來表示:

1.  唯一的標記

2.  偏移數量

3.  字符串長度

由編碼的模式決定引用是一個固定的或變動的長度。后面的情況經常是首選,因為它允許編碼器用引用的大小來交換字符串的大小(例如,如果字符串相當長,增加引用的長度可能是值得的)。

4.2. 實現

使用LZ77的一個問題是由于算法需要字符串匹配,對于每個輸入流的單個字節,每個流中此字節前面的哪個字節都必須被作為字符串的開始從而盡可能的進行字符串匹配,這意味著算法非常慢。

另一個問題是為了最優化壓縮而調整字符串引用的表示形式并不容易。例如,必須決定是否所有的引用和非壓縮字節應該在壓縮流中的字節邊界發生。

基本壓縮庫使用一個清晰的實現來保證所有的符號和引用是字節對齊的,因此犧牲了壓縮比率,并且字符串匹配程序并不是最優化的(沒有緩存、歷史緩沖區或提高速度的小技巧),這意味著程序非常慢。

另一方面,解壓縮程序非常簡單。

一個提高LZ77速度的試驗已經進行了,這個試驗中使用數組索引來加速字符串匹配的過程。然而,它還是比通常的壓縮程序慢。

posted on 2006-01-12 23:27 zmj 閱讀(4076) 評論(5)  編輯 收藏 引用

評論

# re: 幾種壓縮算法原理介紹 2007-07-29 15:10 hitjjg

very good!
  回復  更多評論   

# re: 幾種壓縮算法原理介紹 2007-08-04 08:38 lwef

垃圾!  回復  更多評論   

# re: 幾種壓縮算法原理介紹 2007-11-30 13:27 等待

純垃圾!  回復  更多評論   

# re: 幾種壓縮算法原理介紹 2008-06-03 13:03 sudo

什么內容都沒有,看這文章純粹是浪費時間。  回復  更多評論   

# re: 幾種壓縮算法原理介紹 2009-09-22 10:49 袁嘵濤

"如果rice編碼比固定的開端長,T,一個可選的編碼:輸出T個‘1’位,緊跟(log2(X-T))個‘1’和一個‘0’位,接著是X-T(最沒有意義的(log2(X-T))-1位)。這對于大值來說都是比較高效的代碼并且阻止可笑的長Rice編碼(最壞的情況,對于一個32位word單個Rice編碼可能變成232位或512MB)。"


這句話我不是很理解,能否再講得清楚些。
謝謝!
  回復  更多評論   


只有注冊用戶登錄后才能發表評論。
網站導航: 博客園   IT新聞   BlogJava   博問   Chat2DB   管理


青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            亚洲美女尤物影院| 免费不卡在线视频| 久久在线91| 中日韩午夜理伦电影免费| 国产精品国产| 久久高清福利视频| 欧美激情精品久久久久久久变态 | 亚洲伊人伊色伊影伊综合网| 一区二区三区免费网站| 午夜精品久久久久久久| 午夜精品久久久久久久男人的天堂 | 欧美一区二区三区在线观看视频 | 亚洲欧美一区二区激情| 宅男精品导航| 欧美一二三视频| 久久亚洲影院| 欧美美女操人视频| 国产精品久久午夜| 国产主播一区| 国产精品久久久久9999高清| 久久久久久久久久久一区 | 国产一区激情| 久久久精品国产一区二区三区 | 日韩视频免费观看| 久久久免费精品视频| 亚洲久久一区| 亚洲日本电影在线| 久久久www| 国产在线日韩| 国产午夜亚洲精品羞羞网站| 亚洲啪啪91| 欧美日韩小视频| 欧美精品三级日韩久久| 欧美老女人xx| 亚洲欧美一区二区精品久久久| 亚洲一二区在线| 国产麻豆综合| 欧美高清在线观看| 亚洲乱码国产乱码精品精98午夜| 久久天天综合| 午夜久久久久| 一本色道久久88亚洲综合88| 亚洲国产日韩在线一区模特| 久久精品99久久香蕉国产色戒| 宅男精品视频| 国产亚洲免费的视频看| 国产日韩一级二级三级| 亚洲愉拍自拍另类高清精品| 一区二区三区视频在线观看| 欧美裸体一区二区三区| 亚洲人在线视频| 欧美一区二区三区在线| 欧美激情亚洲自拍| 国产精品久久久久一区| 欧美国产免费| 亚洲美女啪啪| 欧美精品在线免费播放| 国产精品免费区二区三区观看| 国产午夜精品福利| 亚洲福利小视频| 亚洲精品一区二区三区樱花| 亚洲欧美国产精品va在线观看| 国产私拍一区| 亚洲国产导航| 亚洲三级电影在线观看 | 中文一区二区在线观看| 一本色道久久88综合日韩精品| 欧美一级艳片视频免费观看| 免费亚洲网站| 蜜臀av性久久久久蜜臀aⅴ| 亚洲精选一区二区| 蜜臀av在线播放一区二区三区| 性欧美8khd高清极品| 一区二区欧美视频| 国产精品日韩专区| 欧美一二区视频| 久久这里只有| 伊人久久亚洲美女图片| 欧美专区在线观看| 久久精品一区四区| 欧美.日韩.国产.一区.二区| 国产日韩欧美一区二区| 久久gogo国模啪啪人体图| 欧美在线短视频| 久久国产综合精品| 欧美成人嫩草网站| 欧美精品国产一区二区| 亚洲调教视频在线观看| 亚洲女优在线| 在线观看成人小视频| 亚洲激情不卡| 国产精品户外野外| 美国三级日本三级久久99| 老司机免费视频一区二区三区| 日韩亚洲精品电影| 午夜激情综合网| 亚洲精品美女在线观看| 欧美三级电影一区| 欧美一级在线视频| 午夜欧美大尺度福利影院在线看| 狠狠久久亚洲欧美专区| 亚洲国产精品一区在线观看不卡| 欧美午夜在线| 国产精品你懂的在线欣赏| 麻豆精品视频在线观看| 欧美在线日韩在线| 日韩视频在线免费| 99视频+国产日韩欧美| 亚洲一区二区三区中文字幕| 在线电影欧美日韩一区二区私密| 国产精品久久综合| 欧美三日本三级少妇三2023| 欧美亚洲第一页| 国产精品久久久免费| 欧美三级日本三级少妇99| 欧美破处大片在线视频| 欧美黄色日本| 国产精品入口尤物| 国产乱理伦片在线观看夜一区| 亚洲国产精品久久久久秋霞蜜臀| 亚洲成色精品| 小处雏高清一区二区三区| 久色婷婷小香蕉久久| 亚洲欧美在线看| 欧美a级片一区| 国产在线观看精品一区二区三区 | 亚洲一区影院| 久久久精品国产免大香伊| 亚洲一区二区在线观看视频| 1024成人| 亚洲日韩第九十九页| 欧美日韩国产精品自在自线| 一区二区三区国产盗摄| 亚洲欧美综合国产精品一区| 中文一区字幕| 巨胸喷奶水www久久久免费动漫| 午夜精品一区二区三区电影天堂 | 亚欧美中日韩视频| 久久五月天婷婷| 免费高清在线一区| 韩国av一区二区三区四区| 亚洲一区在线免费观看| 亚洲欧美激情视频| 国产精品啊v在线| 99视频超级精品| 久久综合中文| 国外视频精品毛片| 在线一区二区三区做爰视频网站| 国产亚洲精品aa| 欧美影院成人| 一区二区三区欧美| 欧美一区深夜视频| 国产午夜精品一区二区三区欧美| 99国产精品久久| 亚洲日本中文字幕| 欧美精品免费播放| 亚洲日本中文字幕区| 久久人人爽国产| 久久久水蜜桃| 一区二区三区四区五区视频| 欧美国产视频在线| 欧美一区二区免费| 亚洲片国产一区一级在线观看| 欧美日韩中文| 免费欧美视频| 国产乱码精品一区二区三区五月婷| 日韩午夜视频在线观看| 亚洲成色www久久网站| 亚洲伊人伊色伊影伊综合网| 国产欧美一区二区白浆黑人| 亚洲国产一区二区三区在线播| 亚洲视频欧美视频| 伊甸园精品99久久久久久| 亚洲欧美激情视频| 一二美女精品欧洲| 欧美小视频在线| 黄色日韩精品| 亚洲午夜久久久久久尤物| 国产精品免费观看视频| 久久久久久亚洲精品不卡4k岛国| 亚洲福利视频一区二区| 亚洲欧美激情一区| 亚洲国产精品久久久久婷婷老年| 欧美日韩一区二区三区在线视频| 西西裸体人体做爰大胆久久久| 欧美成人国产| 亚洲欧美视频| 国产亚洲a∨片在线观看| 久久综合伊人77777蜜臀| 久久久久久久网站| 91久久精品日日躁夜夜躁国产| 日韩一级视频免费观看在线| 裸体丰满少妇做受久久99精品| 久久精品动漫| 欧美大片免费观看在线观看网站推荐| 日韩亚洲精品电影| 亚洲精品欧美在线| 久久精品成人| 亚洲欧洲日韩女同| 午夜精品福利一区二区蜜股av|