http://blog.csdn.net/liang5630/article/details/79177021. 概述
RMQ(Range Minimum/Maximum Query),即區(qū)間最值查詢,是指這樣一個(gè)問題:對(duì)于長(zhǎng)度為n的數(shù)列A,回答若干詢問RMQ(A,i,j)(i,j<=n),返回?cái)?shù)列A中下標(biāo)在i,j之間的最小/大值。這兩個(gè)問題是在實(shí)際應(yīng)用中經(jīng)常遇到的問題,下面介紹一下解決這兩種問題的比較高效的算法。當(dāng)然,該問題也可以用線段樹(也叫區(qū)間樹)解決,算法復(fù)雜度為:O(N)~O(logN),這里我們暫不介紹。
2.RMQ算法
對(duì)于該問題,最容易想到的解決方案是遍歷,復(fù)雜度是O(n)。但當(dāng)數(shù)據(jù)量非常大且查詢很頻繁時(shí),該算法無法在有效的時(shí)間內(nèi)查詢出正解。
本節(jié)介紹了一種比較高效的在線算法(ST算法)解決這個(gè)問題。所謂在線算法,是指用戶每輸入一個(gè)查詢便馬上處理一個(gè)查詢。該算法一般用較長(zhǎng)的時(shí)間做預(yù)處理,待信息充足以后便可以用較少的時(shí)間回答每個(gè)查詢。ST(Sparse Table)算法是一個(gè)非常有名的在線處理RMQ問題的算法,它可以在O(nlogn)時(shí)間內(nèi)進(jìn)行預(yù)處理,然后在O(1)時(shí)間內(nèi)回答每個(gè)查詢。
(一)首先是預(yù)處理,用動(dòng)態(tài)規(guī)劃(DP)解決。
設(shè)A[i]是要求區(qū)間最值的數(shù)列,F[i, j]表示從第i個(gè)數(shù)起連續(xù)2^j個(gè)數(shù)中的最大值。(DP的狀態(tài))
例如:
A數(shù)列為:3 2 4 5 6 8 1 2 9 7
F[1,0]表示第1個(gè)數(shù)起,長(zhǎng)度為2^0=1的最大值,其實(shí)就是3這個(gè)數(shù)。同理 F[1,1] = max(3,2) = 3, F[1,2]=max(3,2,4,5) = 5,F(xiàn)[1,3] = max(3,2,4,5,6,8,1,2) = 8;
并且我們可以容易的看出F[i,0]就等于A[i]。(DP的初始值)
這樣,DP的狀態(tài)、初值都已經(jīng)有了,剩下的就是狀態(tài)轉(zhuǎn)移方程。
我們把F[i,j]平均分成兩段(因?yàn)閒[i,j]一定是偶數(shù)個(gè)數(shù)字),從 i 到i + 2 ^ (j - 1) - 1為一段,i + 2 ^ (j - 1)到i + 2 ^ j - 1為一段(長(zhǎng)度都為2 ^ (j - 1))。用上例說明,當(dāng)i=1,j=3時(shí)就是3,2,4,5 和 6,8,1,2這兩段。F[i,j]就是這兩段各自最大值中的最大值。于是我們得到了狀態(tài)轉(zhuǎn)移方程F[i, j]=max(F[i,j-1], F[i + 2^(j-1),j-1])。
代碼如下:
- void RMQ(int num)
- {
- for(int j = 1; j < 20; ++j)
- for(int i = 1; i <= num; ++i)
- if(i + (1 << j) - 1 <= num)
- {
- maxsum[i][j] = max(maxsum[i][j - 1], maxsum[i + (1 << (j - 1))][j - 1]);
- minsum[i][j] = min(minsum[i][j - 1], minsum[i + (1 << (j - 1))][j - 1]);
- }
- }
void RMQ(int num) //預(yù)處理->O(nlogn)
{
for(int j = 1; j < 20; ++j)
for(int i = 1; i <= num; ++i)
if(i + (1 << j) - 1 <= num)
{
maxsum[i][j] = max(maxsum[i][j - 1], maxsum[i + (1 << (j - 1))][j - 1]);
minsum[i][j] = min(minsum[i][j - 1], minsum[i + (1 << (j - 1))][j - 1]);
}
}
這里我們需要注意的是循環(huán)的順序,我們發(fā)現(xiàn)外層是j,內(nèi)層所i,這是為什么呢?可以是i在外,j在內(nèi)嗎?
答案是不可以。因?yàn)槲覀冃枰斫膺@個(gè)狀態(tài)轉(zhuǎn)移方程的意義。
狀態(tài)轉(zhuǎn)移方程的含義是:先更新所有長(zhǎng)度為F[i,0]即1個(gè)元素,然后通過2個(gè)1個(gè)元素的最值,獲得所有長(zhǎng)度為F[i,1]即2個(gè)元素的最值,然后再通過2個(gè)2個(gè)元素的最值,獲得所有長(zhǎng)度為F[i,2]即4個(gè)元素的最值,以此類推更新所有長(zhǎng)度的最值。
而如果是i在外,j在內(nèi)的話,我們更新的順序就是F[1,0],F[1,1],F[1,2],F[1,3],表示更新從1開始1個(gè)元素,2個(gè)元素,4個(gè)元素,8個(gè)元素(A[0],A[1],....A[7])的最值,這里F[1,3] = max(max(A[0],A[1],A[2],A[3]),max(A[4],A[5],A[6],A[7]))的值,但是我們根本沒有計(jì)算max(A[0],A[1],A[2],A[3])和max(A[4],A[5],A[6],A[7]),所以這樣的方法肯定是錯(cuò)誤的。
為了避免這樣的錯(cuò)誤,一定要好好理解這個(gè)狀態(tài)轉(zhuǎn)移方程所代表的含義。
(二)然后是查詢。
假如我們需要查詢的區(qū)間為(i,j),那么我們需要找到覆蓋這個(gè)閉區(qū)間(左邊界取i,右邊界取j)的最小冪(可以重復(fù),比如查詢5,6,7,8,9,我們可以查詢5678和6789)。
因?yàn)檫@個(gè)區(qū)間的長(zhǎng)度為j - i + 1,所以我們可以取k=log2( j - i + 1),則有:RMQ(A, i, j)=max{F[i , k], F[ j - 2 ^ k + 1, k]}。
舉例說明,要求區(qū)間[2,8]的最大值,k = log2(8 - 2 + 1)= 2,即求max(F[2, 2],F(xiàn)[8 - 2 ^ 2 + 1, 2]) = max(F[2, 2],F(xiàn)[5, 2]);
在這里我們也需要注意一個(gè)地方,就是<<運(yùn)算符和+-運(yùn)算符的優(yōu)先級(jí)。
比如這個(gè)表達(dá)式:5 - 1 << 2是多少?
答案是:4 * 2 * 2 = 16。所以我們要寫成5 - (1 << 2)才是5-1 * 2 * 2 = 1。