程序員編程藝術:第五章、尋找和為定值的兩個或多個數
作者:July,yansha,zhouzhenren。
致謝:微軟100題實現組,編程藝術室。
微博:http://weibo.com/julyweibo 。
出處:http://blog.csdn.net/v_JULY_v 。
wiki:http://tctop.wikispaces.com/。
------------------------------
前奏
希望此編程藝術系列能給各位帶來的是一種方法,一種創造力,一種舉一反三的能力。本章依然同第四章一樣,選取比較簡單的面試題,恭祝各位旅途愉快。同樣,有任何問題,歡迎不吝指正。謝謝。
第一節、尋找和為定值的兩個數
第14題(數組):
題目:輸入一個數組和一個數字,在數組中查找兩個數,使得它們的和正好是輸入的那個數字。
要求時間復雜度是O(n)。如果有多對數字的和等于輸入的數字,輸出任意一對即可。
例如輸入數組1、2、4、7、11、15和數字15。由于4+11=15,因此輸出4和11。
分析:
咱們試著一步一步解決這個問題(注意闡述中數列有序無序的區別):
- 直接窮舉,從數組中任意選取兩個數,判定它們的和是否為輸入的那個數字。此舉復雜度為O(N^2)。很顯然,我們要尋找效率更高的解法。
- 題目相當于,對每個a[i],然后查找判斷sum-a[i]是否也在原始序列中,每一次要查找的時間都要花費為O(N),這樣下來,最終找到兩個數還是需要O(N^2)的復雜度。那如何提高查找判斷的速度列?對了,二分查找,將原來O(N)的查找時間提高到O(logN),這樣對于N個a[i],都要花logN的時間去查找相對應的sum-a[i]是否在原始序列中,總的時間復雜度已降為O(N*logN),且空間復雜度為O(1)。(如果有序,直接二分O(N*logN),如果無序,先排序后二分,復雜度同樣為O(N*logN+N*logN)=O(N*logN),空間總為O(1))。
- 有沒有更好的辦法列?咱們可以依據上述思路2的思想,a[i]在序列中,如果a[i]+a[k]=sum的話,那么sum-a[i](a[k])也必然在序列中,,舉個例子,如下:
原始序列:1、 2、 4、 7、11、15 用輸入數字15減一下各個數,得到對應的序列為:
對應序列:14、13、11、8、4、 0
第一個數組以一指針i 從數組最左端開始向右掃描,第二個數組以一指針j 從數組最右端開始向左掃描,如果下面出現了和上面一樣的數,即a[*i]=a[*j],就找出這倆個數來了。如上,i,j最終在第一個,和第二個序列中找到了相同的數4和11,,所以符合條件的兩個數,即為4+11=15。怎么樣,兩端同時查找,時間復雜度瞬間縮短到了O(N),但卻同時需要O(N)的空間存儲第二個數組(@飛羽:要達到O(N)的復雜度,第一個數組以一指針i 從數組最左端開始向右掃描,第二個數組以一指針j 從數組最右端開始向左掃描,首先初始i指向元素1,j指向元素0,誰指的元素小,誰先移動,由于1(i)>0(j),所以i不動,j向左移動。然后j移動到元素4發現大于元素1,故而停止移動j,開始移動i,直到i指向4,這時,i指向的元素與j指向的元素相等,故而判斷4是滿足條件的第一個數;然后同時移動i,j再進行判斷,直到它們到達邊界)。 - 當然,你還可以構造hash表,正如編程之美上的所述,給定一個數字,根據hash映射查找另一個數字是否也在數組中,只需用O(1)的時間,這樣的話,總體的算法通上述思路3 一樣,也能降到O(N),但有個缺陷,就是構造hash額外增加了O(N)的空間,此點同上述思路 3。不過,空間換時間,仍不失為在時間要求較嚴格的情況下的一種好辦法。
- 如果數組是無序的,先排序(n*logn),然后用兩個指針i,j,各自指向數組的首尾兩端,令i=0,j=n-1,然后i++,j--,逐次判斷a[i]+a[j]?=sum,如果某一刻a[i]+a[j]>sum,則要想辦法讓sum的值減小,所以此刻i不動,j--,如果某一刻a[i]+a[j]<sum,則要想辦法讓sum的值增大,所以此刻i++,j不動。所以,數組無序的時候,時間復雜度最終為O(n*logn+n)=O(n*logn),若原數組是有序的,則不需要事先的排序,直接O(n)搞定,且空間復雜度還是O(1),此思路是相對于上述所有思路的一種改進。(如果有序,直接兩個指針兩端掃描,時間O(N),如果無序,先排序后兩端掃描,時間O(N*logN+N)=O(N*logN),空間始終都為O(1))。(與上述思路2相比,排序后的時間開銷由之前的二分的n*logn降到了掃描的O(N))。
總結:
- 不論原序列是有序還是無序,解決這類題有以下三種辦法:1、二分(若無序,先排序后二分),時間復雜度總為O(n*logn),空間復雜度為O(1);2、掃描一遍X-S[i] 映射到一個數組或構造hash表,時間復雜度為O(n),空間復雜度為O(n);3、兩個指針兩端掃描(若無序,先排序后掃描),時間復雜度最后為:有序O(n),無序O(n*logn+n)=O(n*logn),空間復雜度都為O(1)。
- 所以,要想達到時間O(N),空間O(1)的目標,除非原數組是有序的(指針掃描法),不然,當數組無序的話,就只能先排序,后指針掃描法或二分(時間n*logn,空間O(1)),或映射或hash(時間O(n),空間O(n))。時間或空間,必須犧牲一個,自個權衡吧。
- 綜上,若是數組有序的情況下,優先考慮兩個指針兩端掃描法,以達到最佳的時(O(N)),空(O(1))效應。否則,如果要排序的話,時間復雜度最快當然是只能達到N*logN,空間O(1)則是不在話下。
代碼:
ok,在進入第二節之前,咱們先來實現思路5(這里假定數組已經是有序的),代碼可以如下編寫(兩段代碼實現):
- //代碼一
- //O(N)
- Pair findSum(int *s,int n,int x)
- {
- //sort(s,s+n); 如果數組非有序的,那就事先排好序O(N*logN)
-
- int *begin=s;
- int *end=s+n-1;
-
- while(begin<end) //倆頭夾逼,或稱兩個指針兩端掃描法,很經典的方法,O(N)
- {
- if(*begin+*end>x)
- {
- --end;
- }
- else if(*begin+*end<x)
- {
- ++begin;
- }
- else
- {
- return Pair(*begin,*end);
- }
- }
-
- return Pair(-1,-1);
- }
-
- //或者如下編寫,
- //代碼二
- //copyright@ zhedahht && yansha
- //July、updated,2011.05.14。
- bool find_num(int data[], unsigned int length, int sum, int& first_num, int& second_num)
- {
- if(length < 1)
- return true;
-
- int begin = 0;
- int end = length - 1;
-
- while(end > begin)
- {
- long current_sum = data[begin] + data[end];
-
- if(current_sum == sum)
- {
- first_num = data[begin];
- second_num = data[end];
- return true;
- }
- else if(current_sum > sum)
- end--;
- else
- begin++;
- }
- return false;
- }
擴展:
1、如果在返回找到的兩個數的同時,還要求你返回這兩個數的位置列?
2、如果把題目中的要你尋找的兩個數改為“多個數”,或任意個數列?(請看下面第二節)
3、二分查找時: left <= right,right = middle - 1;left < right,right = middle;
//算法所操作的區間,是左閉右開區間,還是左閉右閉區間,這個區間,需要在循環初始化,
//循環體是否終止的判斷中,以及每次修改left,right區間值這三個地方保持一致,否則就可能出錯.
//二分查找實現一
int search(int array[], int n, int v)
{
int left, right, middle;
left = 0, right = n - 1;
while (left <= right)
{
middle = left + (right-left)/2;
if (array[middle] > v)
{
right = middle - 1;
}
else if (array[middle] < v)
{
left = middle + 1;
}
else
{
return middle;
}
}
return -1;
}
//二分查找實現二
int search(int array[], int n, int v)
{
int left, right, middle;
left = 0, right = n;
while (left < right)
{
middle = left + (right-left)/2;
if (array[middle] > v)
{
right = middle;
}
else if (array[middle] < v)
{
left = middle + 1;
}
else
{
return middle;
}
}
return -1;
}
第二節、尋找和為定值的多個數
第21題(數組)
2010年中興面試題
編程求解:
輸入兩個整數 n 和 m,從數列1,2,3.......n 中 隨意取幾個數,
使其和等于 m ,要求將其中所有的可能組合列出來。
解法一
我想,稍后給出的程序已經足夠清楚了,就是要注意到放n,和不放n個區別,即可,代碼如下:
- // 21題遞歸方法
- //copyright@ July && yansha
- //July、yansha,updated。
- #include<list>
- #include<iostream>
- using namespace std;
-
- list<int>list1;
- void find_factor(int sum, int n)
- {
- // 遞歸出口
- if(n <= 0 || sum <= 0)
- return;
-
- // 輸出找到的結果
- if(sum == n)
- {
- // 反轉list
- list1.reverse();
- for(list<int>::iterator iter = list1.begin(); iter != list1.end(); iter++)
- cout << *iter << " + ";
- cout << n << endl;
- list1.reverse();
- }
-
- list1.push_front(n); //典型的01背包問題
- find_factor(sum-n, n-1); //放n,n-1個數填滿sum-n
- list1.pop_front();
- find_factor(sum, n-1); //不放n,n-1個數填滿sum
- }
-
- int main()
- {
- int sum, n;
- cout << "請輸入你要等于多少的數值sum:" << endl;
- cin >> sum;
- cout << "請輸入你要從1.....n數列中取值的n:" << endl;
- cin >> n;
- cout << "所有可能的序列,如下:" << endl;
- find_factor(sum,n);
- return 0;
- }
解法二
@zhouzhenren:
這個問題屬于子集和問題(也是背包問題)。本程序采用 回溯法+剪枝
X數組是解向量,t=∑(1,..,k-1)Wi*Xi, r=∑(k,..,n)Wi
若t+Wk+W(k+1)<=M,則Xk=true,遞歸左兒子(X1,X2,..,X(k-1),1);否則剪枝;
若t+r-Wk>=M && t+W(k+1)<=M,則置Xk=0,遞歸右兒子(X1,X2,..,X(k-1),0);否則剪枝;
本題中W數組就是(1,2,..,n),所以直接用k代替WK值。
代碼編寫如下:
- //copyright@ 2011 zhouzhenren
-
- //輸入兩個整數 n 和 m,從數列1,2,3.......n 中 隨意取幾個數,
- //使其和等于 m ,要求將其中所有的可能組合列出來。
-
- #include <stdio.h>
- #include <stdlib.h>
- #include <memory.h>
-
- /**
- * 輸入t, r, 嘗試Wk
- */
- void sumofsub(int t, int k ,int r, int& M, bool& flag, bool* X)
- {
- X[k] = true; // 選第k個數
- if (t + k == M) // 若找到一個和為M,則設置解向量的標志位,輸出解
- {
- flag = true;
- for (int i = 1; i <= k; ++i)
- {
- if (X[i] == 1)
- {
- printf("%d ", i);
- }
- }
- printf("/n");
- }
- else
- { // 若第k+1個數滿足條件,則遞歸左子樹
- if (t + k + (k+1) <= M)
- {
- sumofsub(t + k, k + 1, r - k, M, flag, X);
- }
- // 若不選第k個數,選第k+1個數滿足條件,則遞歸右子樹
- if ((t + r - k >= M) && (t + (k+1) <= M))
- {
- X[k] = false;
- sumofsub(t, k + 1, r - k, M, flag, X);
- }
- }
- }
-
- void search(int& N, int& M)
- {
- // 初始化解空間
- bool* X = (bool*)malloc(sizeof(bool) * (N+1));
- memset(X, false, sizeof(bool) * (N+1));
- int sum = (N + 1) * N * 0.5f;
- if (1 > M || sum < M) // 預先排除無解情況
- {
- printf("not found/n");
- return;
- }
- bool f = false;
- sumofsub(0, 1, sum, M, f, X);
- if (!f)
- {
- printf("not found/n");
- }
- free(X);
- }
-
- int main()
- {
- int N, M;
- printf("請輸入整數N和M/n");
- scanf("%d%d", &N, &M);
- search(N, M);
- return 0;
- }
擴展:
1、從一列數中篩除盡可能少的數使得從左往右看,這些數是從小到大再從大到小的(網易)。
2、有兩個序列a,b,大小都為n,序列元素的值任意整數,無序;
要求:通過交換a,b中的元素,使[序列a元素的和]與[序列b元素的和]之間的差最小。
例如:
var a=[100,99,98,1,2, 3];
var b=[1, 2, 3, 4,5,40];(微軟100題第32題)。
@well:[fairywell]:
給出擴展問題 1 的一個解法:
1、從一列數中篩除盡可能少的數使得從左往右看,這些數是從小到大再從大到小的(網易)。
雙端 LIS 問題,用 DP 的思想可解,目標規劃函數 max{ b[i] + c[i] - 1 }, 其中 b[i] 為從左到右, 0 ~ i 個數之間滿足遞增的數字個數; c[i] 為從右到左, n-1 ~ i 個數之間滿足遞增的數字個數。最后結果為 n - max + 1。其中 DP 的時候,可以維護一個 inc[] 數組表示遞增數字序列,inc[i] 為從小到大第 i 大的數字,然后在計算 b[i] c[i] 的時候使用二分查找在 inc[] 中找出區間 inc[0] ~ inc[i-1] 中小于 a[i] 的元素個數(low)。
源代碼如下:
- /**
- * The problem:
- * 從一列數中篩除盡可能少的數使得從左往右看,這些數是從小到大再從大到小的(網易)。
- * use binary search, perhaps you should compile it with -std=c99
- * fairywell 2011
- */
- #include <stdio.h>
-
- #define MAX_NUM (1U<<31)
-
- int
- main()
- {
- int i, n, low, high, mid, max;
-
- printf("Input how many numbers there are: ");
- scanf("%d/n", &n);
- /* a[] holds the numbers, b[i] holds the number of increasing numbers
- * from a[0] to a[i], c[i] holds the number of increasing numbers
- * from a[n-1] to a[i]
- * inc[] holds the increasing numbers
- * VLA needs c99 features, compile with -stc=c99
- */
- double a[n], b[n], c[n], inc[n];
-
- printf("Please input the numbers:/n");
- for (i = 0; i < n; ++i) scanf("%lf", &a[i]);
-
- // update array b from left to right
- for (i = 0; i < n; ++i) inc[i] = (unsigned) MAX_NUM;
- //b[0] = 0;
- for (i = 0; i < n; ++i) {
- low = 0; high = i;
- while (low < high) {
- mid = low + (high-low)*0.5;
- if (inc[mid] < a[i]) low = mid + 1;
- else high = mid;
- }
- b[i] = low + 1;
- inc[low] = a[i];
- }
-
- // update array c from right to left
- for (i = 0; i < n; ++i) inc[i] = (unsigned) MAX_NUM;
- //c[0] = 0;
- for (i = n-1; i >= 0; --i) {
- low = 0; high = i;
- while (low < high) {
- mid = low + (high-low)*0.5;
- if (inc[mid] < a[i]) low = mid + 1;
- else high = mid;
- }
- c[i] = low + 1;
- inc[low] = a[i];
- }
-
- max = 0;
- for (i = 0; i < n; ++i )
- if (b[i]+c[i] > max) max = b[i] + c[i];
- printf("%d number(s) should be erased at least./n", n+1-max);
- return 0;
- }
@yansha:fairywell的程序很贊,時間復雜度O(nlogn),這也是我能想到的時間復雜度最優值了。不知能不能達到O(n)。
擴展題第2題
當前數組a和數組b的和之差為
A = sum(a) - sum(b)
a的第i個元素和b的第j個元素交換后,a和b的和之差為
A' = sum(a) - a[i] + b[j] - (sum(b) - b[j] + a[i])
= sum(a) - sum(b) - 2 (a[i] - b[j])
= A - 2 (a[i] - b[j])
設x = a[i] - b[j],得
|A| - |A'| = |A| - |A-2x|
假設A > 0,
當x 在 (0,A)之間時,做這樣的交換才能使得交換后的a和b的和之差變小,x越接近A/2效果越好,
如果找不到在(0,A)之間的x,則當前的a和b就是答案。
所以算法大概如下:
在a和b中尋找使得x在(0,A)之間并且最接近A/2的i和j,交換相應的i和j元素,重新計算A后,重復前面的步驟直至找不到(0,A)之間的x為止。
接上,@yuan:
a[i]-b[j]要接近A/2,則可以這樣想,
我們可以對于a數組的任意一個a[k],在數組b中找出與a[k]-C最接近的數(C就是常數,也就是0.5*A)
這個數要么就是a[k]-C,要么就是比他稍大,要么比他稍小,所以可以要二分查找。
查找最后一個小于等于a[k]-C的數和第一個大于等于a[k]-C的數,
然后看哪一個與a[k]-C更加接近,所以T(n) = nlogn。
除此之外,受本文讀者xiafei1987128啟示,有朋友在stacoverflow上也問過一個類似的題,:-),見此:http://stackoverflow.com/questions/9047908/swap-the-elements-of-two-sequences-such-that-the-difference-of-the-element-sums。感興趣的可以看看。
本章完。
程序員面試題狂想曲-tctop(the crazy thinking of programers)的修訂wiki(http://tctop.wikispaces.com/)已建立,我們急切的想得到讀者的反饋,意見,建議,以及更好的思路,算法,和代碼優化的建議。所以,
•如果你發現了狂想曲系列中的任何一題,任何一章(http://t.cn/hgVPmH)中的錯誤,問題,與漏洞,歡迎告知給我們,我們將感激不盡,同時,免費贈送本blog內的全部博文集錦的CHM文件1期;
•如果你能對狂想曲系列的創作提供任何建設性意見,或指導,歡迎反饋給我們,并真誠邀請您加入到狂想曲的wiki修訂工作中;
•如果你是編程高手,對狂想曲的任何一章有自己更好的思路,或算法,歡迎加入狂想曲的創作組,以為千千萬萬的讀者創造更多的價值,更好的服務。
Ps:狂想曲tctop的wiki修訂地址為:http://tctop.wikispaces.com/。歡迎圍觀,更歡迎您加入到狂想曲的創作或wiki修訂中。
版權所有,本人對本blog內所有任何內容享有版權及著作權。實要轉載,請以鏈接形式注明出處。