• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            公告

            聯(lián)系我:我的126郵箱: billhsu。 Locations of visitors to this page
            <2025年6月>
            25262728293031
            1234567
            891011121314
            15161718192021
            22232425262728
            293012345

            統(tǒng)計

            • 隨筆 - 41
            • 文章 - 0
            • 評論 - 82
            • 引用 - 0

            常用鏈接

            留言簿(16)

            隨筆分類

            隨筆檔案

            相冊

            Game Dev

            搜索

            •  

            最新評論

            閱讀排行榜

            評論排行榜

            神經(jīng)元網(wǎng)絡(luò)的超級入門

            一直不太懂神經(jīng)元網(wǎng)絡(luò),看了這篇文章(來自IBM developerWorks 中國)后終于感覺有點明白了,特意拿出來大家一起看。

            2001 年 6 月 01 日

                神經(jīng)網(wǎng)絡(luò)也許是計算機(jī)計算的將來,一個了解它的好方法是用一個它可以解決的難題來說明。假設(shè)給出 
            500 個字符的代碼段,您知道它們是 C、C++、Java 或者 Python。現(xiàn)在構(gòu)造一個程序,來識別編寫這段代碼的語言。一種解決方案是構(gòu)造一個能夠?qū)W習(xí)識別這些語言的神經(jīng)網(wǎng)絡(luò)。這篇文章討論了神經(jīng)網(wǎng)絡(luò)的基本功能以及構(gòu)造神經(jīng)網(wǎng)絡(luò)的方法,這樣就可以在編碼時應(yīng)用它們了。

            Bill注:解釋一下,這文章是用) ( _ . = ; " , ' * / { } : - 0 + 1 [ ] 這20個特殊符號出現(xiàn)頻率+人工神經(jīng)元的判斷來識別代碼段是 C、C++、Java 或者 Python


            根據(jù)一個簡化的統(tǒng)計,人腦由百億條神經(jīng)組成 ― 每條神經(jīng)平均連結(jié)到其它幾千條神經(jīng)。通過這種連結(jié)方式,神經(jīng)可以收發(fā)不同數(shù)量的能量。神經(jīng)的一個非常重要的功能是它們對能量的接受并不是立即作出響應(yīng),而 是將它們累加起來,當(dāng)這個累加的總和達(dá)到某個臨界閾值時,它們將它們自己的那部分能量發(fā)送給其它的神經(jīng)。大腦通過調(diào)節(jié)這些連結(jié)的數(shù)目和強(qiáng)度進(jìn)行學(xué)習(xí)。盡管 這是個生物行為的簡化描述。但同樣可以充分有力地被看作是神經(jīng)網(wǎng)絡(luò)的模型。

            閾值邏輯單元(Threshold Logic Unit,TLU)

            理解神經(jīng)網(wǎng)絡(luò)的第一步是從對抽象生物神經(jīng)開始,并把重點放在 閾值邏輯單元(TLU)這一特征上。一個 TLU 是一個對象,它可以輸入一組加權(quán)系數(shù)的量,對它們進(jìn)行求和,如果這個和達(dá)到或者超過了某個閾值,輸出一個量。 讓我們用符號標(biāo)注這些功能,首先,有輸入值以及它們的權(quán)系數(shù):X 1, X 2, ..., X n和 W 1, W 2, ..., W n。接著是求和計算出的 X i*W i ,產(chǎn)生了激發(fā)層 a,換一種方法表示:

            a = (X1 * W1)+(X2 * W2)+...+(Xi * Wi)+...+ (Xn * Wn)

            閾值稱為 theta。最后,輸出結(jié)果 y。當(dāng) a >=theta 時 y=1,反之 y=0。請注意輸出可以是連續(xù)的,因為它也可以由一個 squash 函數(shù) s(或 sigma)判定,該函數(shù)的自變量是 a,函數(shù)值在 0 和 1 之間,y=s(a)。


            圖 1. 閾值邏輯單元,帶有 sigma 函數(shù)(頂部)和 cutoff 函數(shù)(底部)
            閾值邏輯單元

            TLU 會分類,假設(shè)一個 TLU 有兩個輸入值,它們的權(quán)系數(shù)等于 1,theta 值等于 1.5。當(dāng)這個 TLU 輸入 <0,0>、<0,1>、<1,0> 和 <1,1> 時,它的輸出分別為 0、0、0、1。TLU 將這些輸入分為兩組:0 組和 1 組。就像懂得邏輯連接(布爾運算 AND)的人腦可以類似地將邏輯連接的句子分類那樣,TLU 也懂得一點邏輯連接之類的東西。

            TLU 能夠用幾何學(xué)上的解釋來闡明這種現(xiàn)象。它的四種可能輸入對應(yīng)于笛卡爾圖的四個點。從等式 X 1*W 1+ X 2*W 2 = theta,換句話說,也即 TLU 轉(zhuǎn)換其分類行為的點開始,它的點都分布在曲線 X 2 = -X 1 + 1.5 上。這個方程的曲線將 4 個可能的輸入分成了兩個對應(yīng)于 TLU 分類的區(qū)域。這是 TLU 原理中更為普通的實例。在 TLU 有任意數(shù)目的 N 個輸入的情況下,一組可能的輸入對應(yīng)于 N 維空間中的一個點集。如果這些點可以被超平面 ― 換句話說,對應(yīng)于上面示例中的線的 N 維的幾何外形切割,那么就有一組權(quán)系數(shù)和一個閾值來定義其分類剛好與這個切割相匹配的 TLU。

            Bill注:所謂的N維空間就是N個輸入節(jié)點

            TLU 的學(xué)習(xí)原理

            既然 TLU 懂得分類,它們就知道素材。神經(jīng)網(wǎng)絡(luò)也可假定為可以學(xué)習(xí)。它們的學(xué)習(xí)機(jī)制是模仿大腦調(diào)節(jié)神經(jīng)連結(jié)的原理。TLU 通過改變它的權(quán)系數(shù)和閾值來學(xué)習(xí)。實際上,從數(shù)學(xué)的觀點看,權(quán)系數(shù)閾值的特征有點武斷。讓我們回想一下當(dāng) SUM(Xi * Wi) >= theta 時 TLU 在臨界點時輸出的是 1 而不是 0,這相當(dāng)于說臨界點是出現(xiàn)在 SUM(X i* W i)+ (-1 * theta) >= 0 的時候。所以,我們可以把 -1 看成一個常量輸入,它的權(quán)系數(shù) theta 在學(xué)習(xí)(或者用技術(shù)術(shù)語,稱為 培訓(xùn))的過程中進(jìn)行調(diào)整。這樣,當(dāng) SUM(X i* W i)+ (-1 * theta) >= 0 時,y=1,反之 y=0。

            在培訓(xùn)過程中,神經(jīng)網(wǎng)絡(luò)輸入:

            1. 一系列需要分類的術(shù)語示例
            2. 它們的正確分類或者目標(biāo)

            這樣的輸入可以看成一個向量:<X 1, X 2, ..., X n, theta, t>,這里 t 是一個目標(biāo)或者正確分類。神經(jīng)網(wǎng)絡(luò)用這些來調(diào)整權(quán)系數(shù),其目的使培訓(xùn)中的目標(biāo)與其分類相匹配。更確切地說,這是有指導(dǎo)的培訓(xùn),與之相反的是無指導(dǎo)的培訓(xùn)。前者是基于帶目標(biāo)的示例,而后者卻只是建立在統(tǒng)計分析的基礎(chǔ)上。權(quán)系數(shù)的調(diào)整有一個學(xué)習(xí)規(guī)則,一個理想化的學(xué)習(xí)算法如下所示:


            清單 1. 理想化的學(xué)習(xí)算法
            fully_trained = FALSE
            DO UNTIL (fully_trained):
            fully_trained = TRUE
            FOR EACH training_vector = <X1, X2, ..., Xn, theta, target>::
            # Weights compared to theta
            a = (X1 * W1)+(X2 * W2)+...+(Xn * Wn) - theta
            y = sigma(a)
            IF y != target:
            fully_trained = FALSE
            FOR EACH Wi:
            MODIFY_WEIGHT(Wi) # According to the training rule
            IF (fully_trained):
            BREAK

            您或許想知道,“哪些培訓(xùn)規(guī)則?”有很多,不過有一條似乎合理的規(guī)則是基于這樣一種思想,即權(quán)系數(shù)和閾值的調(diào)整應(yīng)該由分式 (t - y) 確定。這個規(guī)則通過引入 alpha (0 < alpha < 1) 完成。我們把 alpha 稱為 學(xué)習(xí)率。W i 中的更改值等于 (alpha * (t - y)* Xi)。當(dāng) alpha 趨向于 0 時,神經(jīng)網(wǎng)絡(luò)的權(quán)系數(shù)的調(diào)整變得保守一點;當(dāng) alpha 趨向于 1 時,權(quán)系數(shù)的調(diào)整變得激進(jìn)。一個使用這個規(guī)則的神經(jīng)網(wǎng)絡(luò)稱為 感知器,并且這個規(guī)則被稱為 感知器學(xué)習(xí)規(guī)則。Rosenblatt 于 1962 年下的結(jié)論是,如果 N 維空間的點集被超平面切割,那么感知器的培訓(xùn)算法的應(yīng)用將會最終導(dǎo)致權(quán)系數(shù)的分配,從而定義了一個 TLU,它的超平面會進(jìn)行需要的分割。當(dāng)然,為了記起 Keynes,最終我們都切斷了與外界的聯(lián)系,專心思考。但是在計算時間之外,我們?nèi)詾l臨危險,因為我們需要自己的神經(jīng)網(wǎng)絡(luò)對可能輸入的空間進(jìn)行不止一次的切割。

            文章開始的難題舉例說明了這個,假設(shè)給您 N 個字符的代碼段,您知道是 C、C++、Java 或者 Python。難的是構(gòu)造一個程序來標(biāo)識編寫這段代碼的語言。用 TLU 來實現(xiàn)需要對可能的輸入空間進(jìn)行不止一次的分割。它需要把空間分成四個區(qū)域。每種語言一個區(qū)域。把神經(jīng)網(wǎng)絡(luò)培訓(xùn)成能實現(xiàn)兩個切割就可完成這種工作。第一個切割將 C/C++ 和 Java/Python 分開來,另一個將 C/Java 和 C++/Python 分開。一個能夠完成這些切割的網(wǎng)絡(luò)同樣可以識別源代碼樣本中的語言。但是這需要網(wǎng)絡(luò)有不同結(jié)構(gòu),在描述這個不同之處之前,先來簡單地看一下實踐方面的考慮。

            圖 2. 初步的(不完整的)感知器學(xué)習(xí)模型
            感知器學(xué)習(xí)模型

            考慮到排除取得 N 個字符代碼所需的計算時間,統(tǒng)計從 ASCII 碼的 32 到 127 的范圍內(nèi)可視 ASCII 碼字符出現(xiàn)的頻率,并在這個統(tǒng)計以及關(guān)于代碼語言的目標(biāo)信息的基礎(chǔ)上培訓(xùn)神經(jīng)網(wǎng)絡(luò)。我們的方法是將字符統(tǒng)計限制到 C、C++、Java 和 Python 代碼字符庫中最常用的 20 個非字母數(shù)字字符。由于關(guān)注浮點運算的執(zhí)行,我們打算用一種規(guī)格化因素將這 20 字符統(tǒng)計分開來,并以此培訓(xùn)我們的網(wǎng)絡(luò)。顯然,一個結(jié)構(gòu)上的不同是我們的網(wǎng)絡(luò)有 20 個輸入節(jié)點,但這是很正常的,因為我們的描述已經(jīng)暗示了這種可能性。一個更有意思的區(qū)別是出現(xiàn)了一對中間節(jié)點,N1 和 N2,以及輸出節(jié)點數(shù)量從兩個變成了四個(O1 到 O4)。

            我們將培訓(xùn) N1,這樣當(dāng)它一看到 C 或 C++,設(shè)置 y1=1,看到 Java 或 Python,它將設(shè)置 y1=0。同理培訓(xùn) N2,當(dāng)它一看到 C 或 Java,設(shè)置 y2=1,看到 C++ 或 Python,設(shè)置 y2=0。此外,N1 和 N2 將輸出 1 或 0 給 Oi。現(xiàn)在如果 N1 看到 C 或 C++,而且 N2 看到 C 或者 Java,那么難題中的代碼是 C。而如果 N1 看到 C 或 C++,N2 看到 C++ 或 Python,那么代碼就是 C++。這個模式很顯而易見。所以假設(shè) Oi 已被培訓(xùn)并根據(jù)下面表格的情況輸出 1 或 0。

            映射到輸出(作為布爾函數(shù))的中間節(jié)點

            N1 N2 O1 (C) O2 (C++) O3 (Java) O4 (Python)
            0 0 0 0 0 1
            0 1 0 0 1 0
            1 0 0 1 0 0
            1 1 1 0 0 0

            如果這樣可行的話,我們的網(wǎng)絡(luò)就可以從代碼示例中識別出語言了。這個想法很好。但是在實踐上卻有些難以置信。不過這種解決方案預(yù)示了 C/C++ 和 Java/Python 輸入被一個超平面切割了,同樣 C/Java 和 C++/Python 輸入被另一個切割。這是一個網(wǎng)絡(luò)培訓(xùn)的解決方案,迂回地解決了這個輸入空間的設(shè)想。

            Bill注:看起來很強(qiáng)大

            關(guān)于 delta 規(guī)則

            另一種培訓(xùn)的規(guī)則叫做 delta 規(guī)則。感知器培訓(xùn)規(guī)則是基于這樣一種思路 ― 權(quán)系數(shù)的調(diào)整是由目標(biāo)和輸出的差分方程表達(dá)式?jīng)Q定。而 delta 規(guī)則是基于梯度降落這樣一種思路。這個復(fù)雜的數(shù)學(xué)概念可以舉個簡單的例子來表示。從給定的幾點來看,向南的那條路徑比向東那條更陡些。向東就像從懸崖上掉 下來,但是向南就是沿著一個略微傾斜的斜坡下來,向西像登一座陡峭的山,而北邊則到了平地,只要慢慢的閑逛就可以了。所以您要尋找的是到達(dá)平地的所有路徑 中將陡峭的總和減少到最小的路徑。在權(quán)系數(shù)的調(diào)整中,神經(jīng)網(wǎng)絡(luò)將會找到一種將誤差減少到最小的權(quán)系數(shù)的分配方式。

            將我們的網(wǎng)絡(luò)限制為沒有隱藏節(jié)點,但是可能會有不止一個的輸出節(jié)點,設(shè) p 是一組培訓(xùn)中的一個元素,t(p,n) 是相應(yīng)的輸出節(jié)點 n 的目標(biāo)。但是,設(shè) y(p,n) 由以上提到的 squash 函數(shù) s 決定,這里 a(p,n) 是與 p 相關(guān)的 n 的激活函數(shù),或者用 (p,n) = s( a(p,n) ) 表示為與 p 相關(guān)的節(jié)點 n 的 squash 過的激活函數(shù)。為網(wǎng)絡(luò)設(shè)定權(quán)系數(shù)(每個 Wi),也為每個 p 和 n 建立 t(p,n) 與 y(p,n) 的差分,這就意味著為每個 p 設(shè)定了網(wǎng)絡(luò)全部的誤差。因此對于每組權(quán)系數(shù)來說有一個平均誤差。但是 delta 規(guī)則取決于求平均值方法的精確度以及誤差。我們先不討論細(xì)節(jié)問題,只是說一些與某些 p 和 n 相關(guān)的誤差:?* square( t(p,n) - y(p,n) )。現(xiàn)在,對于每個 Wi,平均誤差定義如下:


            清單 2. 查找平均誤差
            sum = 0
            FOR p = 1 TO M: # M is number of training vectors
            FOR n = 1 TO N: # N is number of output nodes
            sum = sum + (1/2 * (t(p,n)-y(p,n))^2)
            average = 1/M * sum

            delta 規(guī)則就是依據(jù)這個誤差的定義來定義的。因為誤差是依據(jù)那些培訓(xùn)向量來說明的,delta 規(guī)則是一種獲取一個特殊的權(quán)系數(shù)集以及一個特殊的向量的算法。而改變權(quán)系數(shù)將會使神經(jīng)網(wǎng)絡(luò)的誤差最小化。我們不需要討論支持這個算法的微積分學(xué),只要認(rèn)為任何 Wi 發(fā)生的變化都是如下所示就夠了:

            alpha * s'(a(p,n)) * (t(p,n) - y(p,n)) * X(p,i,n).

            X(p,i,n) 是輸入到節(jié)點 n 的 p 中的第 i 個元素,alpha 是已知的學(xué)習(xí)率。最后 s'( a(p,n) ) 是與 p 相關(guān)的第 n 個節(jié)點激活的 squashing 函數(shù)的變化(派生)率,這就是 delta 規(guī)則,并且 Widrow 和 Stearns 向我們展示了當(dāng) alpha 非常小的時候,權(quán)系數(shù)向量接近某個將誤差最小化的向量。用于權(quán)系數(shù)調(diào)節(jié)的基于 delta 規(guī)則的算法就是如此。


            梯度降落(直到誤差小到適當(dāng)?shù)某潭葹橹梗?/strong>
            step 1: for each training vector, p, find a(p)
            step 2: for each i, change Wi by:
            alpha * s'(a(p,n)) * (t(p,n)-y(p,n)) * X(p,i,n)

            這里有一些與感知器算法相區(qū)別的重要不同點。顯然,在權(quán)系數(shù)調(diào)整的公式下有著完全不同的分析。delta 規(guī)則算法總是在權(quán)系數(shù)上調(diào)整,而且這是建立在相對輸出的激活方式上。最后,這不一定適用于存在隱藏節(jié)點的網(wǎng)絡(luò)。

            反向傳播這一算法把支持 delta 規(guī)則的分析擴(kuò)展到了帶有隱藏節(jié)點的神經(jīng)網(wǎng)絡(luò)。為了理解這個問題,設(shè)想 Bob 給 Alice 講了一個故事,然后 Alice 又講給了 Ted,Ted 檢查了這個事實真相,發(fā)現(xiàn)這個故事是錯誤的。現(xiàn)在 Ted 需要找出哪些錯誤是 Bob 造成的而哪些又歸咎于 Alice。當(dāng)輸出節(jié)點從隱藏節(jié)點獲得輸入,網(wǎng)絡(luò)發(fā)現(xiàn)出現(xiàn)了誤差,權(quán)系數(shù)的調(diào)整需要一個算法來找出整個誤差是由多少不同的節(jié)點造成的,網(wǎng)絡(luò)需要問,“是誰讓我誤入歧途?到怎樣的程度?如何彌補(bǔ)?”這時,網(wǎng)絡(luò)該怎么做呢?


            圖 3:“代碼識別”反向傳播的神經(jīng)網(wǎng)絡(luò)

            反向傳播算法同樣來源于梯度降落原理,在權(quán)系數(shù)調(diào)整分析中的唯一不同是涉及到 t(p,n) 與 y(p,n) 的差分。通常來說 W i的改變在于:

            alpha * s'(a(p,n)) * d(n) * X(p,i,n)

            其中 d(n) 是隱藏節(jié)點 n 的函數(shù),讓我們來看(1)n 對任何給出的輸出節(jié)點有多大影響;(2)輸出節(jié)點本身對網(wǎng)絡(luò)整體的誤差有多少影響。一方面,n 影響一個輸出節(jié)點越多,n 造成網(wǎng)絡(luò)整體的誤差也越多。另一方面,如果輸出節(jié)點影響網(wǎng)絡(luò)整體的誤差越少,n 對輸出節(jié)點的影響也相應(yīng)減少。這里 d(j) 是對網(wǎng)絡(luò)的整體誤差的基值,W(n,j) 是 n 對 j 造成的影響,d(j) * W(n,j) 是這兩種影響的總和。但是 n 幾乎總是影響多個輸出節(jié)點,也許會影響每一個輸出結(jié)點,這樣,d(n) 可以表示為:

            SUM(d(j)*W(n,j))

            這里 j 是一個從 n 獲得輸入的輸出節(jié)點,聯(lián)系起來,我們就得到了一個培訓(xùn)規(guī)則,第 1 部分:在隱藏節(jié)點 n 和輸出節(jié)點 j 之間權(quán)系數(shù)改變,如下所示:

            alpha * s'(a(p,n))*(t(p,n) - y(p,n)) * X(p,n,j)

            第 2 部分:在輸入節(jié)點 i 和輸出節(jié)點 n 之間權(quán)系數(shù)改變,如下所示:

            alpha * s'(a(p,n)) * sum(d(j) * W(n,j)) * X(p,i,n)

            這里每個從 n 接收輸入的輸出節(jié)點 j 都不同。關(guān)于反向傳播算法的基本情況大致如此。

            將 Wi 初始化為小的隨機(jī)值。

            使誤差小到適當(dāng)?shù)某潭纫裱牟襟E

            第 1 步:輸入培訓(xùn)向量。
            第 2 步:隱藏節(jié)點計算它們的輸出
            第 3 步:輸出節(jié)點在第 2 步的基礎(chǔ)上計算它們的輸出。
            第 4 步:計算第 3 步所得的結(jié)果和期望值之間的差。
            第 5 步:把第 4 步的結(jié)果填入培訓(xùn)規(guī)則的第 1 部分。
            第 6 步:對于每個隱藏節(jié)點 n,計算 d(n)。
            第 7 步:把第 6 步的結(jié)果填入培訓(xùn)規(guī)則的第 2 部分。

            通常把第 1 步到第 3 步稱為 正向傳播,把第 4 步到第 7 步稱為 反向傳播。反向傳播的名字由此而來。

            在掌握了反向傳播算法后,可以來看我們的識別源代碼樣本語言的難題。為了解決這個問題,我們提供了 Neil Schemenauer 的 Python 模型 bpnn。用它的模型解決問題真是難以置信的簡單,在我們的類 NN2 里定制了一個類 NN ,不過我們的改變只是調(diào)整了表達(dá)方式和整個過程的輸出,并沒有涉及到算法。基本的代碼如下所示:


            清單 3:用 bpnn.py 建立一個神經(jīng)網(wǎng)絡(luò)
                            # Create the network (number of input, hidden, and training nodes)
            net = NN2(INPUTS, HIDDEN, OUTPUTS)
            # create the training and testing data
            trainpat = []
            testpat = []
            for n in xrange(TRAINSIZE+TESTSIZE):

            #... add vectors to each set
            # train it with some patterns
            net.train(trainpat, iterations=ITERATIONS, N=LEARNRATE, M=MOMENTUM)
            # test it
            net.test(testpat)
            # report trained weights
            net.weights()


            當(dāng)然我們需要輸入數(shù)據(jù),實用程序 code2data.py 提供了這個功能。它的界面很直觀:只要將一堆擴(kuò)展名各不相同的文件放到一個子目錄 ./code 中,然后運行這個實用程序,并列舉那些擴(kuò)展名作為命令選項。例如:

            python code2data.py py c java

            您得到的是一堆 STDOUT 上的向量,可以把這些向量輸入到另一個進(jìn)程或者重定向到一個文件,它的輸出如下所示:


            清單 4:Code2Data 的輸出向量
            0.15 0.01 0.01 0.04 0.07 0.00 0.00 0.03 0.01 0.00 0.00 0.00 0.05 0.00 > 1 0 0
            0.14 0.00 0.00 0.05 0.13 0.00 0.00 0.00 0.02 0.00 0.00 0.00 0.13 0.00 > 1 0 0
            [...]

            讓我們回憶一下輸入值都是不同特殊字符出現(xiàn)的規(guī)格化數(shù)目,目標(biāo)值(在大于號以后)是 YES/NO,它代表包含這些字符的源代碼文件的類型,不過對于什么是什么來說,并沒有非常明顯的東西。數(shù)字可以是輸入或期望的 任意值,這才是最重要的。

            下一步是運行實際的 code_recognizer.py 程序。這需要(在 STDIN 中)像上面一樣的向量集。這個程序有一個包,它能夠根據(jù)實際文件推斷出需要多少輸入節(jié)點(計算在內(nèi)的和期望的),選擇隱藏節(jié)點的數(shù)目是一個訣竅。對于源代碼的識別,6 到 8 個隱藏節(jié)點似乎工作得很好。如果打算試驗網(wǎng)絡(luò)從而發(fā)現(xiàn)對于這些不同的選項它是如何做的,您可以覆蓋命令行中的所有參數(shù),但每一次運行還是會耗費一些時間。值得注意的是, code_recognizer.py 將它的(大的)測試結(jié)果文件發(fā)送到 STDOUT,而將一些友好的消息放在 STDERR 里。這樣在大部分時間里,為了安全保管,您將會把 STDOUT 定向到一個文件,并監(jiān)視針對進(jìn)程和結(jié)果概要的 STDERR。


            清單 5:運行 code_recognizer.py
            > code2data.py py c java | code_recognizer.py > test_results.txt 
            Total bytes of py-source: 457729
            Total bytes of c-source: 245197
            Total bytes of java-source: 709858
            Input set: ) ( _ . = ; " , ' * / { } : - 0 + 1 [ ]
            HIDDEN = 8
            LEARNRATE = 0.5
            ITERATIONS = 1000
            TRAINSIZE = 500
            OUTPUTS = 3
            MOMENTUM = 0.1
            ERROR_CUTOFF = 0.01
            TESTSIZE = 500
            INPUTS = 20
            error -> 95.519... 23.696... 19.727... 14.012... 11.058... 9.652...
            8.858... 8.236... 7.637... 7.065... 6.398... 5.413... 4.508...
            3.860... 3.523... 3.258... 3.026... 2.818... 2.631... 2.463...
            2.313... 2.180... 2.065... 1.965... 1.877... 1.798... 1.725...
            [...]
            0.113... 0.110... 0.108... 0.106... 0.104... 0.102... 0.100...
            0.098... 0.096... 0.094... 0.093... 0.091... 0.089... 0.088...
            0.086... 0.085... 0.084...
            Success rate against test data: 92.60%

            不斷減少誤差是個很好的兆頭,這至少在一段長時間里所獲得的一種進(jìn)步,且最后的結(jié)果必然是深入人心的。就我們的觀點而言,網(wǎng)絡(luò)完成了一項值得尊敬的工作,來識別代碼 ― 我們將會樂意傾聽,對于您的數(shù)字向量它是如何做的。



            參考資料

            • 您可以參閱本文在 developerWorks 全球站點上的 英文原文.

            • 我們的 代碼識別程序是基于 Neil Schemenauer 的反向傳播模塊。

            • 關(guān)于有指導(dǎo)培訓(xùn)和無指導(dǎo)培訓(xùn)的差異,以及神經(jīng)網(wǎng)絡(luò)的一般介紹,請參閱由 D. Michie、D.J. Spiegelhalter 以及 C.C. Taylor 編輯的 Machine Learning, Neural and Statistical Classification,具體內(nèi)容請參閱 第 6 章

            • 關(guān)于 Rosenblatt 的感知器結(jié)果,請參閱他的 Principles of Neurodynamics, 1962, New York: Spartan Books。

            • 關(guān)于一些 delta 規(guī)則的詳細(xì)信息,請參閱 Kevin Gurney 的著作 An Introduction to Neural Networks 1997, London: Routledge。也可以參閱 Neural Nets早期的在線版本。

            • 關(guān)于 delta 規(guī)則的證明,請參閱 B. Widrow 和 S.D. Stearns 的 Adaptive Signal Processing, 1985, New Jersey: Prentice-Hall。

            • 關(guān)于包含圖形界面的感知器的執(zhí)行,請參閱 Omri Weisman 和 Ziv Pollack 撰寫的 The Perceptron

            • 什么是沒有 FAQ 的科目?請參閱在任何時候都適用的 Neural Net FAQ

            • 關(guān)于廣泛的鏈接集合,請參閱 The Backpropagator's Review

            • 請參閱 Neural Networks at your Fingertips,它討論了一組 C 程序包,這些包說明了 Adaline 網(wǎng)絡(luò)、反向傳播、Hopfield 模型以及其它,有一個 The Back-propagation Network 特別有趣,它是一個 C 程序包,說明了一個分析日斑數(shù)據(jù)的網(wǎng)絡(luò)。

            • Neural Networking Software,您將會找到有友好的圖形界面的同時支持 DOS 和 Linux 的神經(jīng)網(wǎng)絡(luò)代碼。

            • NEURObjects 提供了開發(fā)神經(jīng)網(wǎng)絡(luò)的 C++ 的庫文件,它的優(yōu)點在于面向?qū)ο蟆?

            • Stuttgart Neural Network Simulator(SNNS),正如名字所示,是用有 GUI 的 C 程序編寫的,它的手冊內(nèi)容極為豐富,同時支持友好的 Linux 平臺。


            posted @ 2008-08-30 20:08 Bill Hsu 閱讀(7067) | 評論 (2)編輯 收藏
            irrlicht--這個引擎很強(qiáng)大。。。



            上次在sourceforge.net(大名鼎鼎的開源代碼網(wǎng)站)上看到的,這個irrlicht真很了不起, 雖然是開源的,不過感覺已經(jīng)達(dá)到那些幾萬美元的商業(yè)級的3D引擎上具有的特性。而且跨平臺,寫一次代碼可以在多種操作系統(tǒng)上編譯。

            支持.3ds, .md2, .obj, .pk3, .ms3d, .bsp, .x, .bmp, .tga, .jpg, .psd, .pcx等等文件,速度快的沒得說,比我寫的那些3D渲染庫類快好幾個級別。那個UI庫,也是無敵的。。。
            開源的力量太強(qiáng)大了。

            百度百科:Irrlicht是一個德國神話故事中的一種動物的名字,它能夠發(fā)光和飛翔,可以在大部分的沼澤地附近發(fā)現(xiàn)它。單詞"Irrlicht"是兩個德國單詞("irr"意思是瘋狂的;而"Licht"意思是光)的組合。在英語中,它被譯為"鬼火"。

            主頁:
            http://irrlicht.sourceforge.net/

            posted @ 2008-08-23 17:53 Bill Hsu 閱讀(1443) | 評論 (0)編輯 收藏
            腳本引擎RapScript V0.0.0.1發(fā)布

            這是最近完成的RapScript的0.0.0.1版的源代碼。
            這份代碼目前比較糟糕,有點亂,而且沒有錯誤處理,但開源是一種習(xí)慣。。。

            先介紹一下怎么用:
            把RapScript.h RapScript.cpp RapStack.h加入工程,然后在自己的main.cpp里加入

            #include "RapScript.h"

            RapScript XXX;

            XXX是對象名,可以自己取。

            關(guān)于函數(shù)互交:
            比如說,你在C++中寫了一個函數(shù):
            void test(int a,int b)
            {
            cout 
            <<"In void test(int a,int b) a:"<<a<<" b: "<<b<<endl;
            }
            要調(diào)用它,要在寫一個:
            void rap_test()
            {
            int a=rapscript.para[0].v_int;//參數(shù)一
            int b=rapscript.para[1].v_int;//參數(shù)二
            test(a,b);

            }
            然后在合適的位置(比如int main()中)加入
            rapscript.tmp_cmd.cmd_name="test";
            rapscript.tmp_cmd.v_type
            =rapscript.CMD_VOID;
            rapscript.tmp_cmd.fp_void
            =rap_test;
            rapscript.cmd_list.push_back(rapscript.tmp_cmd);
            調(diào)用rapscript.run_rap();
            腳本就會執(zhí)行了。
            說明一下:
            1.在腳本中寫命令時要這樣:test(a;b;);//我偷懶了
            2.所有變量用前必須聲明(如int a;string b;)
            目前只支持int 和 string
            3.Bug超多。
            4.if()和 for()等暫時不支持
            5.如果你愿意修改源代碼,只要合理,就會被采用,名字也會加入Author里。。。

            下載RapScript V0.0.0.1源代碼
            ┏━┓   ┏━━┓   ┏┓     
            ┃┃┣━┳━┫━━╋━┳┳╋╋━┳━━┓
            ┃ ┫━┃┃┣━━┃┣┫┏┫┃┃┣┓┏┛
            ┗┻┻┻┫┏┻━━┻━┻┛┗┫┏┛┗┛ 
                         ┗┛        ┗┛    


            posted @ 2008-08-10 11:05 Bill Hsu 閱讀(1681) | 評論 (4)編輯 收藏
            函數(shù)互交模塊基本完成

            函數(shù)互交模塊基本完成,
            圖:


            posted @ 2008-08-09 16:34 Bill Hsu 閱讀(218) | 評論 (0)編輯 收藏
            RapScript開發(fā)日志 2008.8.6

            今天把正則表達(dá)式引擎寫好了,也就是說,可以運行這樣的程序了。

            int a;
            int b;
            a
            =(1+2)*3*3;
            b
            =a/3;
            效果圖:


            估計在8月8日京奧開幕前會以源代碼的形式放出第一個可用的版本,
            支持與C++的命令互交(用RapScript調(diào)用你在C++程序中寫的函數(shù))。

            很好使用的,只要把RapScript.h RapScript.cpp RapStack.h加入工程里就可以了。
            兼容性很好,至少支持g++和VC(MFC和非MFC都支持)。
            每行都有注釋(用英文寫的,為了將來國際化^_^)



            posted @ 2008-08-06 20:19 Bill Hsu 閱讀(381) | 評論 (1)編輯 收藏
            僅列出標(biāo)題
            共9頁: 1 2 3 4 5 6 7 8 9 
            国产亚洲美女精品久久久| 中文字幕久久亚洲一区| 无码人妻少妇久久中文字幕蜜桃| 亚洲日本久久久午夜精品| 亚洲午夜精品久久久久久app| 久久这里都是精品| 99久久99久久久精品齐齐| 日韩欧美亚洲综合久久影院Ds | AV色综合久久天堂AV色综合在| 国产精品女同久久久久电影院 | 大香伊人久久精品一区二区| 久久久久久人妻无码| 国产亚洲美女精品久久久| 色综合久久久久无码专区| 久久精品国产清自在天天线| 午夜精品久久久久久中宇| 国产午夜精品久久久久九九| 少妇无套内谢久久久久| 久久精品不卡| 亚洲成色999久久网站| 久久婷婷成人综合色综合| 亚洲精品国产第一综合99久久| 亚洲国产成人久久综合碰碰动漫3d | 少妇无套内谢久久久久| 久久中文娱乐网| 久久精品aⅴ无码中文字字幕不卡 久久精品aⅴ无码中文字字幕重口 | 精品国产99久久久久久麻豆| 18岁日韩内射颜射午夜久久成人| 久久这里只精品99re66| 欧美久久久久久| 久久这里只精品99re66| 无码人妻久久一区二区三区蜜桃| 精品一区二区久久| 久久久久人妻一区精品性色av| 色播久久人人爽人人爽人人片AV| 久久久亚洲精品蜜桃臀| 久久精品国产一区二区电影| 久久青青草原精品影院| 99久久99久久精品国产| 久久夜色撩人精品国产| 国产精品久久久香蕉|