本算法只采用移位、加減法、判斷和循環(huán)實(shí)現(xiàn),因?yàn)樗恍枰↑c(diǎn)運(yùn)算,也不需要乘除運(yùn)算,因此可以很方便地運(yùn)用到各種芯片上去。
我們先來看看10進(jìn)制下是如何手工計(jì)算開方的。
先看下面兩個(gè)算式,
x = 10*p + q (1)
公式(1)左右平方之后得:
x^2 = 100*p^2 + 20pq + q^2 (2)
現(xiàn)在假設(shè)我們知道x^2和p,希望求出q來,求出了q也就求出了x^2的開方x了。
我們把公式(2)改寫為如下格式:
q = (x^2 - 100*p^2)/(20*p+q) (3)
這個(gè)算式左右都有q,因此無法直接計(jì)算出q來,因此手工的開方算法和手工除法算法一樣有一步需要猜值。
我們來一個(gè)手工計(jì)算的例子:計(jì)算1234567890的開方
首先我們把這個(gè)數(shù)兩位兩位一組分開,計(jì)算出最高位為3。也就是(3)中的p,最下面一行的334為余數(shù),也就是公式(3)中的(x^2 - 100*p^2)近似值
3
---------------
/ 12 34 56 78 90
9
---------------
/ 3 34
下面我們要找到一個(gè)0-9的數(shù)q使它最接近滿足公式(3)。我們先把p乘以20寫在334左邊:
3 q
---------------
/ 12 34 56 78 90
9
---------------
(20*3+q)*q / 3 34
我們看到q為5時(shí)(60+q)*q的值最接近334,而且不超過334。于是我們得到:
3 5
---------------
/ 12 34 56 78 90
9
---------------
65 / 3 34
3 25
---------------
9 56
接下來就是重復(fù)上面的步驟了,這里就不再啰嗦了。
這個(gè)手工算法其實(shí)和10進(jìn)制關(guān)系不大,因此我們可以很容易的把它改為二進(jìn)制,改為二進(jìn)制之后,公式(3)就變成了:
q = (x^2 - 4*p^2)/(4*p+q) (4)
我們來看一個(gè)例子,計(jì)算100(二進(jìn)制1100100)的開方:
1 0 1 0
-----------
/ 1 10 01 00
1
-----------
100 / 0 10
0 00
-----------
1001 / 10 01
10 01
-----------
0 00
這里每一步不再是把p乘以20了,而是把p乘以4,也就是把p右移兩位,而由于q的值只能為0或者1,所以我們只需要判斷余數(shù)(x^2 - 4*p^2)和(4*p+1)的大小關(guān)系,如果余數(shù)大于等于(4*p+q)那么該上一個(gè)1,否則該上一個(gè)0。
下面給出完成的C語言程序,其中root表示p,rem表示每步計(jì)算之后的余數(shù),divisor表示(4*p+1),通過a>>30取a的最高 2位,通過a<<=2將計(jì)算后的最高2位剔除。其中root的兩次<<1相當(dāng)于4*p。程序完全是按照手工計(jì)算改寫的,應(yīng)該不難理解。
unsigned short sqrt(unsigned long a){
unsigned long rem = 0;
unsigned long root = 0;
unsigned long divisor = 0;
for(int i=0; i<16; ++i){
root <<= 1;
rem = ((rem << 2) + (a >> 30));
a <<= 2;
divisor = (root<<1) + 1;
if(divisor <= rem){
rem -= divisor;
root++;
}
}
return (unsigned short)(root);
}