期刊大全 雜志訂閱 SCI期刊 投稿指導(dǎo) 期刊服務(wù) 文秘服務(wù) 出版社 登錄/注冊 購物車(0)

首頁 > 精品范文 > 神經(jīng)網(wǎng)絡(luò)論文

神經(jīng)網(wǎng)絡(luò)論文精品(七篇)

時間:2022-01-28 14:31:12

序論:寫作是一種深度的自我表達。它要求我們深入探索自己的思想和情感,挖掘那些隱藏在內(nèi)心深處的真相,好投稿為您帶來了七篇神經(jīng)網(wǎng)絡(luò)論文范文,愿它們成為您寫作過程中的靈感催化劑,助力您的創(chuàng)作。

神經(jīng)網(wǎng)絡(luò)論文

篇(1)

關(guān)鍵詞:模糊神經(jīng)網(wǎng)絡(luò);擴展卡爾曼濾波;自組織學(xué)習(xí)

模糊神經(jīng)網(wǎng)絡(luò)起源于20世紀80年代后期的日本,由于其簡單、實用,已經(jīng)被廣泛應(yīng)用在工業(yè)控制、系統(tǒng)辨識、模式識別、數(shù)據(jù)挖掘等許多領(lǐng)域[1~4]。然而,如何從可用的數(shù)據(jù)集和專家知識中獲取合適的規(guī)則數(shù)仍然是一個尚未解決的問題。為了獲取模糊規(guī)則,研究人員提出了不同的算法,如文獻[5]利用正交最小二乘算法確定徑向基函數(shù)的中心,但是該算法訓(xùn)練速度比較慢;文獻[6]提出了基于徑向基函數(shù)的自適應(yīng)模糊系統(tǒng),其算法使用了分層自組織學(xué)習(xí)策略,但是逼近精度低。擴展卡爾曼濾波(EKF)算法作為一種非線性更新算法,在神經(jīng)網(wǎng)絡(luò)中得到了廣泛應(yīng)用。文獻[7]利用擴展卡爾曼濾波算法調(diào)整多層感知器的權(quán)值,文獻[8]利用擴展卡爾曼濾波算法調(diào)整徑向基函數(shù)網(wǎng)絡(luò)的權(quán)值。

本文提出了一種模糊神經(jīng)網(wǎng)絡(luò)的快速自組織學(xué)習(xí)算法(SFNN)。該算法基于無須修剪過程的生長準則增加模糊規(guī)則,加速了網(wǎng)絡(luò)學(xué)習(xí)過程,同時使用EKF調(diào)整網(wǎng)絡(luò)的參數(shù)。在該算法中,模糊神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)不是預(yù)先設(shè)定的,而是在學(xué)習(xí)過程中動態(tài)變化的,即在學(xué)習(xí)開始前沒有一條模糊規(guī)則,在學(xué)習(xí)過程中逐漸增加模糊規(guī)則。與傳統(tǒng)的模糊神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法相比,本算法所得到的模糊規(guī)則數(shù)并不會隨著輸入變量的增加而呈指數(shù)增長,特別是本算法無須領(lǐng)域的專家知識就可以實現(xiàn)對系統(tǒng)的自動建模及抽取模糊規(guī)則。當(dāng)然,如果設(shè)計者是領(lǐng)域?qū)<?其知識也可以直接用于系統(tǒng)設(shè)計。本算法所得到的模糊神經(jīng)網(wǎng)絡(luò)具有結(jié)構(gòu)小、避免出現(xiàn)過擬合現(xiàn)象等特點。

1SFNN的結(jié)構(gòu)

本文采用與文獻[9]相似的網(wǎng)絡(luò)結(jié)構(gòu),如圖1所示。其中,r是輸入變量個數(shù);xi(i=1,2,…,r)是輸入語言變量;y是系統(tǒng)的輸出;MFij是第i個輸入變量的第j個隸屬函數(shù);Rj表示第j條模糊規(guī)則;wj是第j條規(guī)則的結(jié)果參數(shù);u是系統(tǒng)總的規(guī)則數(shù)。

下面是對該網(wǎng)絡(luò)各層含義的詳細描述。

第一層:輸入層。每個節(jié)點代表一個輸入語言變量。

第二層:隸屬函數(shù)層。每個節(jié)點代表一個隸屬函數(shù),隸屬函數(shù)采用如下的高斯函數(shù):

μij=exp(-(xi-cij)2σ2ij);i=1,2,…,r;j=1,2,…,u(1)

其中:r是輸入變量數(shù);u是隸屬函數(shù)個數(shù),也代表系統(tǒng)的總規(guī)則數(shù);μij是xi的第j個高斯隸屬函數(shù);cij是xi的第j個高斯隸屬函數(shù)的中心;σij是xi的第j個高斯隸屬函數(shù)的寬度。

第三層:T-范數(shù)層。每個節(jié)點代表一個可能的模糊規(guī)則的IF-部分,也代表一個RBF單元,該層節(jié)點個數(shù)反映了模糊規(guī)則數(shù)。如果計算每個規(guī)則觸發(fā)權(quán)的T-范數(shù)算子是乘法,則在第三層中第j條規(guī)則Rj的輸出為

φj=exp(-ri=1(xi-cij)2σ2ij);j=1,2,…,u(2)

第四層:輸出層。該層每個節(jié)點代表一個輸出變量,該輸出是所有輸入變量的疊加。

y(X)=uj=1wjφj(3)

其中:y是網(wǎng)絡(luò)的輸出;wj是Then-部分。

2SFNN的學(xué)習(xí)算法

如前文所述,第三層的每個節(jié)點代表一個可能的模糊規(guī)則的IF-部分或者一個RBF單元。如果需要辨識系統(tǒng)的模糊規(guī)則數(shù),則不能預(yù)先選擇模糊神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)。于是,本文提出一種新的學(xué)習(xí)算法,該算法可以自動確定系統(tǒng)的模糊規(guī)則并能達到系統(tǒng)的特定性能。

2.1模糊規(guī)則的產(chǎn)生準則

在模糊神經(jīng)網(wǎng)絡(luò)中,如果模糊規(guī)則數(shù)太多,不僅增加系統(tǒng)的復(fù)雜性,而且增加計算負擔(dān)和降低網(wǎng)絡(luò)的泛化能力;如果規(guī)則數(shù)太少,系統(tǒng)將不能完全包含輸入/輸出狀態(tài)空間,將降低網(wǎng)絡(luò)的性能。是否加入新的模糊規(guī)則取決于系統(tǒng)誤差、可容納邊界和誤差下降率三個重要因素。

2.1.1系統(tǒng)誤差

誤差判據(jù):對于第i個觀測數(shù)據(jù)(xi,ti),其中xi是輸入向量,ti是期望輸出,由式(3)計算網(wǎng)絡(luò)現(xiàn)有結(jié)構(gòu)的全部輸出yi。

定義:ei=ti-yi;i=1,2,…,n(4)

如果ei>keke=max(5)

則說明網(wǎng)絡(luò)現(xiàn)有結(jié)構(gòu)的性能比較差,要考慮增加一條新的規(guī)則;否則,不生成新規(guī)則。其中:ke是根據(jù)網(wǎng)絡(luò)期望的精度預(yù)先選擇的值;emax是預(yù)定義的最大誤差;emin是期望的輸出精度;β(0<β<1)是收斂因子。

2.1.2可容納邊界

從某種意義上來講,模糊神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的學(xué)習(xí)是對輸入空間的高效劃分。模糊神經(jīng)網(wǎng)絡(luò)的性能和結(jié)構(gòu)與輸入隸屬函數(shù)緊密相關(guān)。本文使用的是高斯隸屬函數(shù),高斯函數(shù)輸出隨著與中心距離的增加而單調(diào)遞減。當(dāng)輸入變量采用高斯隸屬函數(shù)時,則認為整個輸入空間由一系列高斯隸屬函數(shù)所劃分。如果某個新樣本位于某個已存在的高斯隸屬函數(shù)覆蓋范圍內(nèi),則該新樣本可以用已存在的高斯隸屬函數(shù)表示,不需要網(wǎng)絡(luò)生成新的高斯單元。

可容納邊界:對于第i個觀測數(shù)據(jù)(xi,ti),計算第i個輸入值xi與已有RBF單元的中心cj之間的距離di(j),即

di(j)=xi-cj;i=1,2,…,n;j=1,2,…,u(6)

其中:u是現(xiàn)有的模糊規(guī)則或RBF單元的數(shù)量。令

di,min=argmin(di(j))(7)

如果di,min>kd,kd=max[dmax×γi,dmin](8)

則說明已存在的輸入隸屬函數(shù)不能有效地劃分輸入空間。因此,需要增加一條新的模糊規(guī)則,否則,觀測數(shù)據(jù)可以由已存在的距離它最近的RBF單元表示。其中:kd是可容納邊界的有效半徑;dmax是輸入空間的最大長度;dmin是所關(guān)心的最小長度;γ(0<γ<1)是衰減因子論文

2.1.3誤差下降率

傳統(tǒng)的學(xué)習(xí)算法把誤差減少率(ERR)[5]用于網(wǎng)絡(luò)生長后的修剪過程,算法會因為修剪過程而增加計算負擔(dān),降低學(xué)習(xí)速度。本文把誤差減少率用于生長過程形成一種新的生長準則,算法無須經(jīng)過修剪過程,從而加速網(wǎng)絡(luò)的學(xué)習(xí)過程。

給定n個輸入/輸出數(shù)據(jù)對(xi,ti),t=1,2,…,n,把式(3)看做線性回歸模型的一種特殊情況,該線性回歸模型為

t(i)=uj=1hj(i)θj+ε(i)(9)

式(9)可簡寫為

D=H+E(10)

D=TT∈Rn是期望輸出,H=φT∈Rn×u是回歸量,=WT∈Ru是權(quán)值向量,并且假設(shè)E∈Rn是與回歸量不相關(guān)的誤差向量。

對于矩陣φ,如果它的行數(shù)大于列數(shù),通過QR分解:

H=PQ(11)

可把H變換成一組正交基向量集P=[p1,p2,…,pu]∈Rn×u,其維數(shù)與H的維數(shù)相同,各列向量構(gòu)成正交基,Q∈Ru×u是一個上三角矩陣。通過這一變換,有可能從每一基向量計算每一個分量對期望輸出能量的貢獻。把式(11)代入式(10)可得

D=PQ+E=PG+E(12)

G的線性最小二乘解為G=(PTP)-1PTD,或

gk=pTkDpTkpk;k=1,2,…,u(13)

Q和滿足下面的方程:

Q=G(14)

當(dāng)k≠l時,pk和pl正交,D的平方和由式(15)給出:

DTD=uk=1g2kpTkpk+ETE(15)

去掉均值后,D的方差由式(16)給出:

n-1DTD=n-1uk=1g2kpTkpk+n-1ETE(16)

由式(16)可以看到,n-1uk=1g2kpTkpk是由回歸量pk所造成的期望輸出方差的一部分。因此,pk的誤差下降率可以定義如下:

errk=g2kpTkpkDTD,1≤k≤u(17)

把式(13)代入式(17)可得

errk=(pTkD)2pTkpkDTD,1≤k≤u(18)

式(18)為尋找重要回歸量子集提供了一種簡單而有效的方法,其意義在于errk揭示了pk和D的相似性。errk值越大,表示pk和D的相似度越大,且pk對于輸出影響越顯著。利用ERR定義泛化因子(GF),GF可以檢驗算法的泛化能力,并進一步簡化和加速學(xué)習(xí)過程。定義:

GF=uk=1errk(19)

如果GF

2.2參數(shù)調(diào)整

需要注意的是,不管是新生成的隱節(jié)點還是已存在的隱節(jié)點,都需要對網(wǎng)絡(luò)參數(shù)進行調(diào)整。傳統(tǒng)的方法是使用LLS[10]方法對網(wǎng)絡(luò)參數(shù)進行調(diào)整,本文提出使用EKF方法調(diào)節(jié)網(wǎng)絡(luò)的參數(shù)。由于LLS方法在確定最優(yōu)參數(shù)時計算簡單、速度快,但該方法對噪聲敏感,其學(xué)習(xí)速度隨著信噪比的增加而下降。另外,與LLS方法相關(guān)的問題是其求解可能是病態(tài)的,這使得參數(shù)估計變得很困難。EKF方法由于其自適應(yīng)過程比較復(fù)雜,計算速度沒有LLS方法快,但是EKF方法在噪聲環(huán)境下具有魯棒性,使用EKF方法可以實現(xiàn)一種健壯的在線學(xué)習(xí)算法。網(wǎng)絡(luò)參數(shù)可以用下面的EKF[11]方法進行調(diào)整。事實上,網(wǎng)絡(luò)的參數(shù)向量θ可以看做一個非線性系統(tǒng)的狀態(tài),并用下面的方程描述:

θi=θi-1

ti=h(θi-1,Xi)+ei(20)

在當(dāng)前的估計值i-1處將非線性函數(shù)h(θi-1,Xi)展開,則狀態(tài)模型可以重寫為

θi=θi-1

ti=Hiθi-1+εi+ei(21)

其中:εi=h(i-1,Xi)-Hii-1+ρi。Hi是如下的梯度向量:

Hi=h(θ,Xi)θ|θ=i-1(22)

參數(shù)向量θ使用下面的擴展卡爾曼濾波算法更新:

Ki=Pi-1HTi[HiPi-1HTi+Ri]-1

θi=θi-1+Ki(ti-h(θi-1,Xi))

Pi=Pi-1-KiHiPi-1+Qi(23)

其中:Ki是卡爾曼增益矩陣;Pi是逼近誤差方差陣;Ri是量測噪聲方差陣;Qi是過程噪聲方差陣。

全局擴展卡爾曼濾波算法會涉及大型矩陣運算,增加計算負擔(dān),因此可以將全局問題劃分為一系列子問題從而簡化全局方法。網(wǎng)絡(luò)的前件部分具有非線性特性,利用擴展卡爾曼濾波算法對其進行調(diào)整;網(wǎng)絡(luò)的后件部分具有線性特性,利用卡爾曼濾波算法對其進行調(diào)整,該方法等同于將全局方法簡化為一系列解耦方法,可以降低計算負擔(dān)。由于高斯函數(shù)的中心對系統(tǒng)的性能影響不明顯,為了簡化計算,只對高斯隸屬函數(shù)的寬度進行調(diào)整。

前件參數(shù)使用如下的擴展卡爾曼濾波算法更新:

Kδi=Pδi-1GTi[Ri+GiPδi-1GTi]-1

δi=δi-1+Kδi(Ti-wi-1φi)

Pδi=Pδi-1-KδiGiPδi-1+Qi(24)

后件參數(shù)使用如下的卡爾曼濾波算法更新:

Kwi=Pwi-1φTi[Ri+φiPwi-1φTi]-1

wi=wi-1+Kwi(Ti-wi-1φi)

Pwi=Pwi-1-KwiφiPwi-1+Qi(25)

2.3模糊規(guī)則的增加過程

在SFNN學(xué)習(xí)算法中,模糊規(guī)則增加過程如下:

a)初始參數(shù)分配。當(dāng)?shù)玫降谝粋€觀測數(shù)據(jù)(X1,t1)時,此時的網(wǎng)絡(luò)還沒有建立起來,因此這個數(shù)據(jù)將被選為第一條模糊規(guī)則:c0=X0,δ1=δ0,w1=t1。其中δ0是預(yù)先設(shè)定的常數(shù)。

b)生長過程。當(dāng)?shù)玫降趇個觀測數(shù)據(jù)(Xi,ti)時,假設(shè)在第三層中已存在u個隱含神經(jīng)元,根據(jù)式(4)(7)和(19),分別計算ei、di,min、GF。如果

ei>ke,di,min>kd,且GF

則增加一個新的隱含神經(jīng)元。其中ke、kd分別在式(5)和(8)中給出。新增加的隱含神經(jīng)元的中心、寬度和權(quán)值賦值為:Cu+1=Xi,δu+1=k0di,min,wu+1=ei,其中k0(k0>1)是重疊因子。

c)參數(shù)調(diào)整。當(dāng)增加新神經(jīng)元后,所有已有神經(jīng)元的參數(shù)通過式(24)(25)描述的算法調(diào)整。

3仿真研究

時間序列預(yù)測在解決許多實際問題中是非常重要的。它在經(jīng)濟預(yù)測、信號處理等很多領(lǐng)域都得到了廣泛應(yīng)用。

本文采用的時間序列由Mackey-Glass差分延遲方程產(chǎn)生,其方程定義為[5]

x(t+1)=(1-a)x(t)+bx(t-τ)1+x10(t-τ)(27)

為了能夠與文獻[5,6]在相同的基礎(chǔ)上進行比較,取值Δt=P=6,式(27)中的參數(shù)選擇為:a=0.1,b=0.2,τ=17。預(yù)測模型表示為x(t+6)=f[x(t),x(t-6),x(t-12),x(t-18)](28)

為了獲得時間序列,利用式(27)生成2000個數(shù)據(jù),式(27)的初始條件為:x(0)=1.2。為了訓(xùn)練和測試,在t=124和t=1123之間選擇1000個樣本作為式(28)的輸入/輸出樣本數(shù)據(jù)。使用前500個數(shù)據(jù)對作為訓(xùn)練數(shù)據(jù)集,后面的500個數(shù)據(jù)對驗證該模型的預(yù)測性能。圖2顯示了SFNN生成的模糊規(guī)則數(shù);圖3顯示了從t=124到t=623的訓(xùn)練結(jié)果;圖4顯示了SFNN良好的預(yù)測性能。表1列出了SFNN與其他算法的比較結(jié)果。表1顯示,與OLS、RBF-AFS算法相比,SFNN具有最少的規(guī)則數(shù)、最小的誤差和良好的泛化能力,同時具有快速的學(xué)習(xí)速度。SFNN的快速性就在于:采用無須修剪過程的生長準則,加速了網(wǎng)絡(luò)學(xué)習(xí)過程;利用擴展卡爾曼濾波調(diào)整網(wǎng)絡(luò)的參數(shù),可以縮短網(wǎng)絡(luò)的學(xué)習(xí)周期。從上面的分析可以看出,SFNN具有緊湊的結(jié)構(gòu)、快速的學(xué)習(xí)速度、良好的逼近精度和泛化能力。

4結(jié)束語

SFNN采用在線學(xué)習(xí)方法、參數(shù)估計和結(jié)構(gòu)辨識同時進行,提高了網(wǎng)絡(luò)的學(xué)習(xí)速度。基于該方法生成的模糊神經(jīng)網(wǎng)絡(luò)具有緊湊的結(jié)構(gòu),網(wǎng)絡(luò)結(jié)構(gòu)不會持續(xù)增長,避免了過擬合及過訓(xùn)練現(xiàn)象,確保了系統(tǒng)的泛化能力。

參考文獻:

[1]

HUANGHuan,WUCong-xin.Approximationcapabilitiesofmultilayerfuzzyneuralnetworksonthesetoffuzzy-valuedfunctions[J].InformationSciences,2009,179(16):2762-2773.

[2]DENGXing-sheng,WANGXin-zhou.Incrementallearningofdynamicfuzzyneuralnetworksforaccuratesystemmodeling[J].FuzzySetsandSystems,2009,160(7):972-987.

[3]韋玉科,汪仁煌,李江平,等.一種新的數(shù)據(jù)智能化處理算法[J].計算機應(yīng)用研究,2008,25(5):1328-1329.

[4]CHENSheng,HONGXia,LUKBL,etal.Orthogonal-least-squaresregression:aunifiedapproachfordatamodeling[J].Neurocompu-ting,2009,72(10-12):2670-2681.

[5]CHENS,COWANCFN,GRANTPM.Orthogonalleastsquareslearningalgorithmforradialbasisfunctionnetworks[J].IEEETransonNeuralNetworks,1991,2(2):302-309.

[6]CHOKB,WANGBH.Radialbasisfunctionbasedadaptivefuzzysystemsandtheirapplicationstosystemidentificationandprediction[J].FuzzySetsandSystems,1996,83(3):325-339.

[7]RIVALSI,PERSONNAZL.ArecursivealgorithmbasedontheextendedKalmanfilterforthetrainingoffeedforwardneuralmodels[J].Neurocomputing,1998,20(1):279-294.

[8]SIMOND.TrainingradialbasisneuralnetworkswiththeextendedKalmanfilter[J].Neurocomputing,2002,48(1):455-475.

[9]WUShi-qian,ERMJ,GAOYang.Afastapproachforautomaticgenerationoffuzzyrulesbygeneralizeddynamicfuzzyneuralnetworks[J].IEEETransonFuzzySystems,2001,9(4):578-594.

篇(2)

[關(guān)鍵詞]反射認知創(chuàng)造神經(jīng)網(wǎng)絡(luò)人工智能

一、生物神經(jīng)網(wǎng)絡(luò)系統(tǒng)

生物神經(jīng)系統(tǒng)是以神經(jīng)元為基本單位,神經(jīng)元的外部形態(tài)各異,但基本功能相同,在處于靜息狀態(tài)時(無刺激傳導(dǎo)),神經(jīng)細胞膜處于極化狀態(tài),膜內(nèi)的電壓低于膜外電壓,當(dāng)膜的某處受到的刺激足夠強時,刺激處會在極短的時間內(nèi)出現(xiàn)去極化、反極化(膜內(nèi)的電壓高于膜外電壓)、復(fù)極化的過程,當(dāng)刺激部位處于反極化狀態(tài)時,鄰近未受刺激的部位仍處于極化狀態(tài),兩著之間就會形成局部電流,這個局部電流又會刺激沒有去極化的細胞膜使之去極化等等,這樣不斷的重復(fù)這一過程,將動作電位傳播開去,一直到神經(jīng)末梢。

神經(jīng)元與神經(jīng)元之間的信息傳遞是通過突觸相聯(lián)系的,前一個神經(jīng)元的軸突末梢作用于下一個神經(jīng)元的胞體、樹突或軸突等處組成突觸。不同神經(jīng)元的軸突末梢可以釋放不同的化學(xué)遞質(zhì),這些遞質(zhì)在與后膜受體結(jié)合時,有的能引起后膜去極化,當(dāng)去極化足夠大時就形成了動作電位;也有的能引起后膜極化增強,即超極化,阻礙動作電位的形成,能釋放這種遞質(zhì)的神經(jīng)元被稱為抑制神經(jīng)元。此外,有的神經(jīng)元之間可以直接通過突觸間隙直接進行電位傳遞,稱為電突觸。還有的因樹突膜上電壓門控式鈉通道很少,樹突上的興奮或抑制活動是以電緊張性形式擴布的,這種擴布是具有衰減性的。

圖1

一個神經(jīng)元可以通過軸突作用于成千上萬的神經(jīng)元,也可以通過樹突從成千上萬的神經(jīng)元接受信息,當(dāng)多個突觸作用在神經(jīng)元上面時,有的能引起去極化,有的能引起超極化,神經(jīng)元的沖動,即能否產(chǎn)生動作電位,取決于全部突觸的去極化與超級化作用之后,膜的電位的總和以及自身的閾值。

神經(jīng)纖維的電傳導(dǎo)速度因神經(jīng)元的種類、形態(tài)、髓鞘有無等因素的不同而存在很大差異,大致從0.3m/s到100m/s不等。在神經(jīng)元與神經(jīng)元之間的信息交換速度也因突觸種類或神經(jīng)遞質(zhì)的不同而存在著不同的突觸延擱,突觸傳遞信息的功能有快有慢,快突觸傳遞以毫秒為單位計算,主要控制一些即時的反應(yīng);慢突觸傳遞可長達以秒為單位來進行,甚至以小時,日為單位計算,它主要和人的學(xué)習(xí),記憶以及精神病的產(chǎn)生有關(guān)系。2000年諾貝爾生理學(xué)或醫(yī)學(xué)獎授予了瑞典哥德堡大學(xué)77歲的阿維·卡爾松、美國洛克菲勒大學(xué)74歲的保羅·格林加德以及出生于奧地利的美國哥倫比亞大學(xué)70歲的埃里克·坎德爾,以表彰他們發(fā)現(xiàn)了慢突觸傳遞這樣一種“神經(jīng)細胞間的信號轉(zhuǎn)導(dǎo)形式”。本次獲獎?wù)叩闹饕暙I在于揭示“慢突觸傳遞”,在此之前,“快突觸傳遞”已經(jīng)得過諾貝爾獎。此外,使用頻繁的突觸聯(lián)系會變得更緊密,即突觸的特點之一是用進廢退,高頻刺激突觸前神經(jīng)元后,在突觸后神經(jīng)元上紀錄到的電位會增大,而且會維持相當(dāng)長的時間。所以可以得出一條由若干不定種類的神經(jīng)元排列構(gòu)成的信息傳導(dǎo)鏈對信息的傳導(dǎo)速度會存在很大的彈性空間,這一點對神經(jīng)系統(tǒng)認知事件有著非常重要的意義。

神經(jīng)系統(tǒng)按功能可大致分為傳入神經(jīng)(感覺神經(jīng))、中間神經(jīng)(腦:延腦、腦橋、小腦、中腦、間腦、大腦脊髓)與傳出神經(jīng)(運動神經(jīng))三類。

生物要適應(yīng)外界環(huán)境的變化,就必須能夠感受到這種變化,才能做出反應(yīng)。生物的感受器多種多樣,有的是單單感覺神經(jīng)元的神經(jīng)末梢;有的是感受器細胞;還有的感受器除了感受細胞外還增加了附屬裝置,且附屬裝置還很復(fù)雜,形成特殊的感覺器官。無論感受器的復(fù)雜程度如何,它在整個神經(jīng)系統(tǒng)中都起著信息采集的作用,它將外界物理的或化學(xué)的動態(tài)信號反應(yīng)在感覺神經(jīng)細胞膜的電位變化上,膜上的電位變化可形成動作電位向遠端傳導(dǎo)。

中間神經(jīng)在系統(tǒng)中起著計算及信息傳導(dǎo)的作用,通常感覺神經(jīng)傳來的動作電位經(jīng)過若干個中間神經(jīng)元的計算響應(yīng)后在傳遞到傳出神經(jīng)形成反射弧,但也有的反射弧僅由傳入神經(jīng)元與傳出神經(jīng)元直接組成,如敲擊股四頭肌引起的膝反射。傳出神經(jīng)可分為軀體神經(jīng)與內(nèi)臟神經(jīng)兩類,它們都最終連接著效應(yīng)器,只是內(nèi)臟神經(jīng)需要通過一個神經(jīng)節(jié)來連接效應(yīng)器,最后由效應(yīng)器調(diào)空肌體器官做出相應(yīng)的反應(yīng)。

二、生物神經(jīng)網(wǎng)絡(luò)的建立

1994年,一種被稱為Netrin-1、將軸突吸引到分泌它的神經(jīng)細胞的可擴散蛋白被發(fā)現(xiàn),此后人們發(fā)現(xiàn),同一軸突引導(dǎo)分子既可吸引、也可排斥前來的軸突。其中,環(huán)狀A(yù)MP(也稱cAMP)、環(huán)狀GMP(也稱cGMP)和鈣離子,都可能是從參與將發(fā)育中的神經(jīng)元引導(dǎo)到其目標上的受體中轉(zhuǎn)導(dǎo)信號的第二種信使。新的實驗表明,正是cAMP/cGMP的比例決定著Netrin-1是起一種吸引信號的作用還是起一種排斥信號的作用,這些環(huán)狀核苷通過控制軸突生長錐中的L-型鈣通道來起作用。

目前已經(jīng)發(fā)現(xiàn)大量對神經(jīng)軸突生長具有導(dǎo)向作用的分子,這些分子可以分為兩大類:一類分子固著在細胞膜表面或細胞外基質(zhì)中,影響局部的神經(jīng)纖維生長,這類因子包括ephrin,MAG(myelin-associatedglycoprotein),Nogo等;另一類是分泌性分子,能擴散一定的距離并形成濃度梯度起作用,如netrin,slit,semaphorin家族的大多數(shù)成員,及各種神經(jīng)營養(yǎng)因子等。神經(jīng)軸突的前端有生長錐(growthcone)的結(jié)構(gòu)起到對環(huán)境信號的探測作用。神經(jīng)生長錐表面存在各種導(dǎo)向因子的受體,它們特異地識別環(huán)境中各種因子,并向細胞內(nèi)傳遞吸引(attractive)或是排斥(repulsive)的信號,從而通過調(diào)節(jié)生長錐內(nèi)的細胞骨架的重組來引導(dǎo)神經(jīng)纖維沿特定路線生長(我國科學(xué)家袁小兵等研究人員發(fā)現(xiàn),在脊髓神經(jīng)元上,神經(jīng)細胞內(nèi)RHOA酶和CDC酶直接傳遞外界方向信號,引導(dǎo)神經(jīng)生長方向,同時這兩種酶相互作用,對生長方向進行細致的調(diào)節(jié))。未成熟神經(jīng)細胞柔弱的軸突在這些信號的引導(dǎo)下,試探地穿行于正處于發(fā)育階段、仍是一片紛亂的大腦之中,最終抵達適當(dāng)?shù)哪康牡亍R坏┹S突的末端找到了其正確的棲息地,它就開始與周圍神經(jīng)元建立盡可能廣泛的突觸聯(lián)系,以便傳導(dǎo)信息。

脊椎動物出生后早期發(fā)育中的一個特征是,神經(jīng)鍵(或神經(jīng)連接)的消除。最初,一個神經(jīng)肌肉連接被多個軸突支配,然后所有軸突都退出,只剩下一個,對相互競爭的神經(jīng)元來說,決定勝負的是它們的相對活性。為了能準確的連接到目的地,單個或多個神經(jīng)元會沿導(dǎo)向分子所確定的大致方向上生長出若干條神經(jīng)纖維,其中總會有能正確連接到目的地的神經(jīng)纖維,所建立的若干神經(jīng)鏈路在刺激信號的作用下,正確的信息傳遞會使鏈接會變的更加穩(wěn)固,反之則慢慢萎縮分離。打個比方講:兩個城市間原本沒有路,如果要修的話會先派人去探索出若干條路,最后去修筑被優(yōu)選出來的路,而其他的則會被遺棄。

三、神經(jīng)網(wǎng)絡(luò)的基本工作原理

1、反射

自然界中,事物的發(fā)展、能量的轉(zhuǎn)化、信息的傳遞等等各種的自然現(xiàn)象都包含著因果關(guān)系,只要時間沒有停滯,這種關(guān)系將廣泛存在,從“因”到“果”,貫穿著事物的發(fā)展過程,當(dāng)過程長且復(fù)雜時我們稱之為“事件”,反之則稱之為“觸發(fā)”。

生物個體在與外界環(huán)境或是個體自身進行物質(zhì)或信息交換時,也存在著這種現(xiàn)象,在這里我們稱之為“反射”。

反射是最基本的神經(jīng)活動,現(xiàn)行的說法是將反射分為兩種,無條件反射和條件反射,其中,無條件反射是動物和人生下來就具有的,即遺傳下來的對外部生活條件特有的穩(wěn)定的反應(yīng)方式,在心理發(fā)展的早期階段,這種反應(yīng)方式提供最基本的生存技能,也就是本能,如:食物反射、防御反射、定向反射,還有一些可能是在人類進化過程中,曾經(jīng)有一定生物適應(yīng)意義的無條件反射,如:巴賓斯基反射、抓握反射、驚跳反射(又叫摩羅反射)、游泳反射、行走反射等,此外,還有其他一些無條件反射,如眨眼反射、瞳孔反射、吞咽反射、打嗝、噴嚏等等。

條件反射是后天訓(xùn)練出來的,著名科學(xué)家巴甫洛夫就曾對條件反射的形成、消退、自然恢復(fù)、泛化、分化以及各種抑制現(xiàn)象進行過相當(dāng)細致、系統(tǒng)的實驗研究,。

無論是條件反射還是無條件反射,從主觀上都可以看作是一種因果作用關(guān)系,即都存在著觸發(fā)條件,都會導(dǎo)致某一結(jié)果的產(chǎn)生,所以無條件反射其實也屬于條件反射范疇。只有在成因上,無條件反射是根據(jù)遺傳信息形成的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),而條件反射是后天在先前的網(wǎng)絡(luò)基礎(chǔ)上,依據(jù)外界環(huán)境繼續(xù)發(fā)展完善的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。兩者之間是繼承和發(fā)展的關(guān)系,但從這兩個階段所形成的神經(jīng)網(wǎng)絡(luò)功能來看,對外界的刺激都具備輸入、傳遞、輸出這一處理過程即反射過程,所以從某種意義上講,也可以把無條件反射歸類到條件反射范疇中去,或者說條件反射等同于反射。

神經(jīng)系統(tǒng)中的條件反射具有三個要素:輸入、傳遞、輸出。其中的每一個要素既可以用單個神經(jīng)元表示,也可以用一個神經(jīng)群落來表示。當(dāng)用少數(shù)幾個神經(jīng)元表示時,對應(yīng)的是生物個體對局部刺激的反應(yīng),當(dāng)擴展到神經(jīng)群落時,對應(yīng)的就可能就是對某一激發(fā)事件的處理方法了。

反射中的輸入,最能使我們聯(lián)想到傳入神經(jīng)元(感覺神經(jīng)元),但在這里,它可以指單個的感覺神經(jīng)元,也可以指一種感官(眼睛中的視神經(jīng)群落、耳中的聽覺神經(jīng)中樞、皮膚中與各類感受器連接的神經(jīng)群落等等),甚至可以是大腦中某一區(qū)域內(nèi)形成某一表象或是概念的神經(jīng)群落。反射中的輸出同樣可以指傳出神經(jīng)元(即脊髓前角或腦干的運動神經(jīng)元),也可以指大腦中某一區(qū)域內(nèi)形成某一概念或是表象的神經(jīng)群落。反射中的中間傳遞過程是信息的加工處理的過程,可以由單個神經(jīng)元、神經(jīng)鏈路或是神經(jīng)網(wǎng)絡(luò)來承擔(dān),甚至可以直接由輸入與輸出的對應(yīng)載體來分擔(dān)。這樣生物神經(jīng)系統(tǒng)中的反射弧只是它的一個子項罷了,條件反射在主觀上也對應(yīng)著我們常說的“產(chǎn)生、經(jīng)過與結(jié)果”即因果關(guān)系。

2、認知

有一個低等生物海兔的記憶試驗:海兔本身具有被觸摸(水管部分)后的鰓縮反射,但連續(xù)十幾次的刺激后,鰓縮反應(yīng)就逐漸減慢.經(jīng)過研究發(fā)現(xiàn),海兔的習(xí)慣化是由于神經(jīng)遞質(zhì)發(fā)生變化所致.進一步的研究發(fā)現(xiàn)這種變化是突觸中的感覺神經(jīng)元的Ca離子門關(guān)閉,導(dǎo)致遞質(zhì)的釋放量減少所致.上述試驗說明簡單的記憶與神經(jīng)遞質(zhì)和突觸有關(guān).又如大鼠的大腦皮質(zhì)切除試驗:用迷宮訓(xùn)練大鼠,如果大鼠學(xué)會并記住順利走出迷宮的道路后,切除它的大腦皮質(zhì),記憶就會消退.不論切除的是大腦皮質(zhì)的哪一部分,總是切除的多,記憶消退的多;切除的少,記憶消退的就少。

首先,認知通常強調(diào)的是結(jié)果,是神經(jīng)網(wǎng)絡(luò)定型后的結(jié)果。神經(jīng)網(wǎng)絡(luò)的定型過程就是認知的建立過程,也就是生物個體的學(xué)習(xí)過程,它同時表現(xiàn)了出生物的記憶過程。定型好的神經(jīng)網(wǎng)絡(luò)對觸發(fā)信息的處理過程即反射過程,就是記憶的提取過程,也正是通過這一過程反映出了認知的存在。

生物個體對客觀事物的認知可以解釋為:客觀事物在主觀意識中形成了表象,并且該表象與一系列的活動(生理的或心理的)相聯(lián)系。換句話說,某一客觀事物的信息如果經(jīng)過大腦處理能夠引發(fā)出一系列的動作(這是一種反射現(xiàn)象,符合前面對反射的定義),我們就可以說對這一事物已經(jīng)認知了。

行為主義與符號主義中對認知建立過程中所顯現(xiàn)出的記憶現(xiàn)象都有很詳細的類別劃分,其中每一種記憶類別都僅與一種認知的建立模式相對應(yīng)。所以,與其用記憶類別來劃分還不如用認知類別來劃分更為合理,在這里由于篇幅所限,我僅將認知簡單概括為以下三種類別:物體認知、事件認知以及兩種認知的衍生產(chǎn)物抽象事物認知。

a、物體認知

感受外界客觀環(huán)境最簡單的辦法是通過感官直接去“接觸”物質(zhì)對象,并通過大腦處理,并最終導(dǎo)致一個或一系列的結(jié)果,這種因果過程就是對客觀物體的認知。如:看到一個蘋果,我們產(chǎn)生了拿的動作,同時也可以產(chǎn)生許多其他的動作如激活色彩感覺中樞、激活味覺中樞等等,當(dāng)可以有這些動作產(chǎn)生時,就完成了對蘋果的認知。

下面我們將詳細講解神經(jīng)網(wǎng)絡(luò)對物體認知的描述。

一個輸入集合I(觸覺、視覺等的感應(yīng)細胞構(gòu)成的集合或是處于某一層次上的神經(jīng)元集合)對之內(nèi)兩個不同區(qū)域(A、B)的刺激做出相應(yīng)Y與X兩種不同反應(yīng)的神經(jīng)處理過程,如圖2。

圖2的a、b、c為三種AB可能存在的輸入情況。圖2a中A、B分別對應(yīng)Y、X,神經(jīng)鏈路沒有重疊,刺激A時得到Y(jié)的輸出,刺激B時得到X的輸出,結(jié)果不會出現(xiàn)問題,請注意:帶有方向的黑線只是代表邏輯上的鏈路,在實際中,鏈路與鏈路之間有質(zhì)的區(qū)別,這里只做簡單的等價說明,用數(shù)量表示質(zhì)量。圖2b中A、B間有了交叉,在處理過程中,當(dāng)A受到刺激會產(chǎn)生Y的輸出,同時會有三條邏輯鏈路去刺激X,但做為X的全部決定因素,這三條相比從B到X余下的空閑聯(lián)絡(luò),只占很小的一部分,它們還不足以激活X,所以分別刺激A、B仍然會得到正確的輸出。對于X這種在某一層次上的輸出神經(jīng)元來說,是否能被激活,主要取決于所有處于不同狀態(tài)的輸入鏈路的能量對比,在這里能量被量化為邏輯鏈路的數(shù)量,這樣每個神經(jīng)元對值的判斷則等價為判斷處于激活狀態(tài)的邏輯鏈路數(shù)是否過半。此類神經(jīng)鏈路就是興奮類傳導(dǎo)神經(jīng)網(wǎng)絡(luò),單純采用此類神經(jīng)鏈路的系統(tǒng)只需要根據(jù)相應(yīng)刺激感受區(qū)域是否有刺激發(fā)生,就可以得出正確的輸出結(jié)果,但是在圖2c中,刺激區(qū)域A包含著B的情況下,如果刺激B區(qū)會有正確輸出X,然而如果刺激A區(qū)則會出錯,Y與X會同時有效,這時我們就需要一種鏈路來阻止這種錯誤的發(fā)生,這就是抑制類神經(jīng)鏈路,如圖2c中的虛線箭頭所示,抑制類邏輯鏈路只起到?jīng)_減、抵消興奮類邏輯鏈路數(shù)量的作用,使得X在沖減后的興奮鏈路合計數(shù)小于閥值,從而達到唯一正確輸出Y得目的。

在圖2中列舉的神經(jīng)網(wǎng)絡(luò)認知模式中,雖然只涉及到了輸入與輸出,但在兩者之間已經(jīng)包含了計算的成分,或是說承擔(dān)了傳遞計算的功能,此外不難發(fā)現(xiàn):能夠?qū)δ骋晃矬w認知,必須要首先區(qū)分開其他物體,尤其是符合圖2c中的情況,物體間的差異正好可以滿足這一需求。這樣,即使是從同一個感官傳來的信息,也能做到很好的區(qū)分。

當(dāng)認知的對象較為復(fù)雜時(如蘋果),對象包含有各種各樣的屬性,其中的每一種屬性的響應(yīng)過程,在局部都遵循著反射的定義。當(dāng)在某一時刻,與蘋果相關(guān)的各種屬性的神經(jīng)子網(wǎng)絡(luò)被大部分激活時,蘋果的表象就成了焦點。更確切的講是,感官捕捉的信息在傳遞的過程中,經(jīng)過了代表各種屬性的神經(jīng)子網(wǎng)絡(luò),一些屬性因條件不滿足而停止傳遞,最后由可以通過的(即被確認的屬性)神經(jīng)子網(wǎng)絡(luò)繼續(xù)向后傳遞,最后再引發(fā)一系列的動作,其中反射可以指局部的傳遞(單個屬性的確認),也可以指整個傳遞過程(看到蘋果后,可以去拿可以去想等等)。

蘋果在人腦中形成的表象,其實就是指感官根據(jù)蘋果實物產(chǎn)生的電信號所能經(jīng)過的神經(jīng)鏈路,神經(jīng)鏈路與神經(jīng)網(wǎng)絡(luò)的關(guān)系相當(dāng)于行走路徑與公路網(wǎng)的關(guān)系。此外其他的神經(jīng)區(qū)域輸出的電信號如果在傳遞過程中也能引發(fā)出與前面提到的“蘋果神經(jīng)鏈路”相同或相似動作或是功能的話,也可以說是形成了蘋果的表象,這種現(xiàn)象可以使我們認知客觀世界不存在的事物或個體自身從未接觸過的事物。

b、事件認知

任何事物在一段時間內(nèi)發(fā)生了變動,在這里都可以被稱之為事件。因果關(guān)系同樣也具備事件的屬性,如果能深入分析一下各種事件的過程,基本上都能找到因果關(guān)系的影子。在前面對物體的認知中,我們知道了神經(jīng)網(wǎng)絡(luò)認知物體是以因果關(guān)系的方式建立的網(wǎng)絡(luò)鏈路,為了不引起混淆,下面以因果關(guān)系為認知對象的,我們用事件來代替,對事件的認知過程,近似于對物體的認知過程,相當(dāng)于把事件等同于物體,由于事件具有時間性,所以神經(jīng)網(wǎng)絡(luò)就必須能夠處理時間問題。

神經(jīng)元的形狀各異,軸突有長有短,且對信息的加工時間與傳遞速度也各不相同,這樣對同一起點不同的傳遞路徑,信息的傳遞速度可能不同。還以圖2為例,現(xiàn)在假設(shè)每一個箭頭除了代表一個神經(jīng)元連接外,還代表一個單位傳遞時間,當(dāng)首先刺激A區(qū)后并在第二個單位時間內(nèi)刺激B區(qū),將兩次觸發(fā)過程當(dāng)作一個事件,導(dǎo)致一個輸出Y;同法當(dāng)先刺激B區(qū),然后在刺激A區(qū)時會有另一個輸出X,如圖3

根據(jù)這種通過神經(jīng)鏈路上神經(jīng)元個數(shù)進行延時的方法,任何處于時間片段上的信息都可以被處理。我們再舉個更加復(fù)雜的例子,單輸入神經(jīng)元網(wǎng)絡(luò)對摩爾斯電碼的識別與重現(xiàn)。

假設(shè)輸入神經(jīng)元為A,按嚴格的爾斯電碼規(guī)則來刺激該神經(jīng)元,最后由神經(jīng)網(wǎng)絡(luò)得出字符序列,如圖4

當(dāng)A收到刺激信號時,將信號廣播給不同的識別群體,圖4中只給出了其中的一個網(wǎng)絡(luò)群體,給出的這個群體只能認識字符“b”即電碼“—…”。為了簡化說明,圖4中舍棄了每個神經(jīng)元的其他輸入輸出鏈路以及相關(guān)的抑制鏈路,所以圖中的每一個指向神經(jīng)元的箭頭均存在著“與”的邏輯運算關(guān)系,在這里它們不表示邏輯數(shù)量。

由圖4可以看出,先收到的信號經(jīng)過較多的傳遞神經(jīng)元進行延時,再連同后面收到的信號一起同時傳遞到結(jié)果輸出上,這樣處于時間片段上的信息就可以被當(dāng)作是一個整體來進行處理。粗虛線上半部分為輸入識別部分,下半部分為信息重現(xiàn)部分,仔細觀察就會發(fā)現(xiàn),兩部分的神經(jīng)鏈路并不是互成鏡像,輸入為前端延時,依次為:1、3、5、7、8、9,輸出為后端延時,依次為:9、7、5、3、2、1,所以認識事物與應(yīng)用事物是由兩套不同的神經(jīng)網(wǎng)絡(luò)來控制完成的。圖4中的兩條傾斜細虛線是一個虛擬的標示線,從某種意義上講這里是事物的表象層,中間本應(yīng)該是更加復(fù)雜的表象處理網(wǎng)絡(luò),在這里只簡單的假設(shè)性的給出了表象輸出與輸入。

c、抽象概括與抽象描述

對事物(事件、物體)的認知,使我們得以在大腦中建立出與客觀世界相對應(yīng)的表象,作為記錄事物表象的神經(jīng)鏈路網(wǎng)上的每一個分支與合并都可能是事物在不同層次上的一種“特征的概括與描述”(參見圖3左圖)。

神經(jīng)網(wǎng)絡(luò)在認知新的事物時,輸入信息總是盡可能的使用已存在的網(wǎng)絡(luò)鏈路進行傳遞處理,當(dāng)處理不足以產(chǎn)生正確的結(jié)果時才在信息的中斷處搭建新的網(wǎng)絡(luò)連接。在局部,如果已存在的網(wǎng)絡(luò)鏈路可以被使用,那么這部分網(wǎng)絡(luò)結(jié)構(gòu)通常是一種共性的表達,當(dāng)這種表達隨著同類認知的增加而逐漸完善時,就可以作為一種屬性的表象,這在主觀上是一種抽象概括的過程。

例如,對蘋果的認知,“蘋果”本身是一個概括出來的詞匯,它不具體指哪一個蘋果,但在認知若干個具體蘋果的過程中,與各個蘋果相對應(yīng)的神經(jīng)鏈路的共用部分被逐漸加強,這部分神經(jīng)網(wǎng)絡(luò)就可以說是“蘋果”這一概念的表象區(qū)域。此外,神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)不光能實現(xiàn)對有形的抽象概括,也可以對無形的加以抽象概括,例如“水果”的表象,這一表象的形成可以說是用若干不同種類的水果培養(yǎng)出來的,也可以說是由“蘋果”、“梨”等等表象的神經(jīng)鏈路的共用部分完善而成的,后一種方式可以理解為抽象概括可以建立在另一種抽象概念之上,即對無形的事物也可以做抽象概括。換個角度講,這些抽象出來的表象本身就是一種有形的物質(zhì),它是由若干神經(jīng)元搭建起來的網(wǎng)絡(luò)系統(tǒng),是客觀存在的東西,這樣的話就與第一種方式相一致了。

語言是生物間交流的工具,是生物為了更好的適應(yīng)周圍的環(huán)境而進化產(chǎn)生的,在這里它包含有聲音、文字、動作、行為以及低等生物的化學(xué)接觸等等內(nèi)容。就拿我們?nèi)祟悂碚f,每一個發(fā)音、每一個文字符號都可以說是對應(yīng)著一種表象,這個表象可以是抽象出來的也可以是具體事物產(chǎn)生的。語言是通過觸發(fā)來進行工作,當(dāng)然也可以說是一種反射或是因果現(xiàn)象。無論是說還是聽,也不論是寫還是看,對于說或者是寫這種輸出性質(zhì)的處理,可以解釋為某個表象被激活時,它又被作為輸入信號沿著該表象至發(fā)音或是運動器官間的語言神經(jīng)鏈路傳遞電信號,直至發(fā)音或是運動器官做出相應(yīng)的動作。聽與看也是如此,感官接收到信息后傳遞直至激活某一個表象區(qū)域(請參見圖4)。語言與表象之間廣泛存在著對等映射關(guān)系,它可以使我們能夠直接去運用語言來進行思維,即便是表象與輸入輸出沒有語言神經(jīng)鏈路對應(yīng)關(guān)系的,如果需要我們也會臨時的建立起語言神經(jīng)鏈路,如本文中說的圖幾圖幾、這個那個等等,或者用相關(guān)的有語言鏈路的表象通過塑造、闡述、刻畫、定位等等方式來體現(xiàn)或是建立該表象,這種建立神經(jīng)鏈路的過程往往體現(xiàn)出不同種類的記憶模式。

生物的記憶過程與機械的存儲過程原理基本相同,都是通過改變載體的性狀來表達的,只是生物是通過神經(jīng)網(wǎng)絡(luò)的響應(yīng)過程來表達或再現(xiàn)記憶的內(nèi)容,就是說該神經(jīng)網(wǎng)絡(luò)的連接結(jié)構(gòu)就反映著記憶的內(nèi)容,所以生物的記憶過程就是建立特定連接方式的神經(jīng)網(wǎng)絡(luò)的過程,而提取過程就是激活這部分神經(jīng)網(wǎng)絡(luò)的過程。一旦載有相關(guān)記憶內(nèi)容的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)被確定時,能量只能體現(xiàn)在信息的提取與再現(xiàn)上,當(dāng)然維持這種結(jié)構(gòu)也需要一點能量,不然神經(jīng)元就餓死了:)注意:這里強調(diào)的是“過程”。

生物的認知過程對外表現(xiàn)為學(xué)習(xí)過程,對內(nèi)表現(xiàn)為神經(jīng)網(wǎng)絡(luò)的建立及使用過程,在學(xué)習(xí)過程中往往會同時伴隨著反饋過程(內(nèi)反饋或外反饋),生物從外界獲得信息,傳遞處理后再作用給外界,并同時獲取作用后新的信息,周而復(fù)始的運做,這就是外反饋過程。外反饋過程是依靠外界因素幫助或是引導(dǎo)或是促使生物個體建立起能與環(huán)境相協(xié)調(diào)運做的神經(jīng)網(wǎng)絡(luò)系統(tǒng),主觀上我們稱之為“教育”。內(nèi)反饋主要體現(xiàn)在我們的思維活動上,通常外界事物在大腦中存在著對應(yīng)的表象,被外反饋完善了的事物表象之間同樣可以建立起互動聯(lián)系,比如講一個事物的表象被激活(輸入),引發(fā)其他的表象也被激活(輸出),這些被激活的表象同樣也可以作為輸入去激活先前的或是其他的表象,然后周而復(fù)始的運做,使得信息得以在腦內(nèi)進行反復(fù)的處理。內(nèi)反饋過程實際上就是一種“自學(xué)”的過程,但它的激發(fā)源頭必定是與外界有關(guān),并且最終要作用于外界,所以說內(nèi)外反饋往往是兼而有之的。

在認知過程中隨著內(nèi)反饋的素材(表象)不斷增多,生物個體漸漸能夠認知自身與外界間的互動關(guān)系,自我意識也就隨之產(chǎn)生,同時我們用以進行思維的素材及其運作方式,如概念,詞匯以及由這些材料所帶來的情感因素及組織方式等等,絕大部分都來源于前人或者是借用他人的經(jīng)驗,生物個體對這些經(jīng)驗素材的獲取,或是由于接觸的幾率的不同,或是由于認同的程度的高低,個體間總會存在著差異,這樣就產(chǎn)生了我們不同的個性特征。

3、創(chuàng)造

生物在與周圍環(huán)境發(fā)生相互作用時,不可避免的會對周圍的環(huán)境造成一定的影響,無論是主動的還是被動的,這些對環(huán)境的影響最終都是為了促使生物以更好的適應(yīng)周圍的環(huán)境。遵循優(yōu)勝劣汰的法則,好的影響將會被保留繼承下去,如搭窩、建巢、獲取食物等等,而壞的影響會增加生物生存的風(fēng)險。

神經(jīng)網(wǎng)絡(luò)在認知事物后,事物的表象往往不是特定對應(yīng)著某一個具體事物,而是對應(yīng)著在一個模糊的范圍內(nèi)所含闊的一類事物。例如,我們認知的蘋果,泛指各種各樣的蘋果,甚至還包括那些嫁接出來的長的象其他水果的蘋果等等。在我們依據(jù)蘋果的表象勾勒出一個具體的蘋果時,這個蘋果將肯定不會與客觀世界中的任何一個蘋果相同,因為沒有兩樣?xùn)|西是絕對相同的。產(chǎn)生一個客觀世界不存在的事物,就是創(chuàng)造,其過程就是創(chuàng)造的過程。

生物神經(jīng)網(wǎng)絡(luò)中事物的表象往往穿插交錯在一起,它們以鏈路最省的方式構(gòu)成。任何神經(jīng)鏈路上的合并都可以說是事物的某一特征在某一層次上的概括,所以表象可以以不同的內(nèi)涵層次來拆分成各種各樣的屬性單元(元素),而任何神經(jīng)鏈路上的分支都可以說是事物的某一特征在某一層次上的副本,使得這些屬性單元也能夠隸屬于別的表象或是說用于構(gòu)建(表達)別的表象,當(dāng)若干種屬性單元在某一時刻都處于激活狀態(tài)時,就等同于一種表象被激活,無論這個表象是否對應(yīng)著客觀世界中的事物,如果沒有對應(yīng)關(guān)系那就是一個較高形式的創(chuàng)造過程。

創(chuàng)造的幾種主要的表達形式:聯(lián)想、推理、頓悟

a、聯(lián)想

當(dāng)一個事物的表象被激活時,也就是說該表象所包含的若干屬性單元(元素)同時有效時,我們的注意力焦點就集中在這個表象上,如果對該表象的處理(內(nèi)或外反饋)使的表象被否決時,也就是說由于一些屬性單元的失效(或被抑制,或處于高阻),導(dǎo)致該表象無法成立的時候,剩余的屬性單元或許可以構(gòu)成另一種事物的表象,或許還需要結(jié)合那些被激活了的新的屬性(或是由外界事物具有的新的屬性所激活,或是因降低了對一些屬性的抑制所導(dǎo)致的激活)。

b、推理

聯(lián)想是一種去激活與事物表象相關(guān)聯(lián)的其他表象的過程,主觀上是一種橫向擴展的過程,那么縱向過程就是由于一個或若干個事物表象被激活,從而導(dǎo)致另一個表象也被激活的過程,即推理過程,其中的任何一個表象的確立(激活)都會通過反饋過程加以驗證。推理與聯(lián)想在神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)上十分的相似,功能上也基本相同,只是在主觀認識上,聯(lián)想更強調(diào)相關(guān)性或是相似性,而推理則強調(diào)的是次序性或?qū)哟涡浴?/p>

c、頓悟

當(dāng)我們思考一件事情時,或設(shè)計一件東西的時候,常常會遇到百思不得其解的情況發(fā)生,但有時,在某個偶然的事件影響下,我們會突然明白或能夠解決這些問題,這就是頓悟現(xiàn)象。

事物的表象是由若干個神經(jīng)網(wǎng)絡(luò)屬性單元所構(gòu)成的,我們說的“問題”在大腦中也是一種表象,是一種經(jīng)反饋過程沒有驗證通過的特殊的表象,這個表象的屬性單元可能包括具體的事物表象、抽象的事物表象、邏輯關(guān)系、公理、定律等等內(nèi)容,但這些屬性同時有效時,問題的表象并不能通過內(nèi)外反饋的驗證。作為一個急切需要解決的“問題”,“問題”的表象被反復(fù)的激活(深思熟慮反復(fù)思考),在一個偶然機會,一個別的事件表象被激活,或是因為此事件的某個屬性單元彌補了“問題”表象的一個重要的空缺;或是因為此事件“問題”表象中的某個關(guān)鍵的屬性單元被抑制失效,“問題”表象得以完善并能夠通過反饋驗證,這就是頓悟。

四、神經(jīng)網(wǎng)絡(luò)的相關(guān)問題

人在成長過程中,他的學(xué)習(xí)過程就是構(gòu)建相應(yīng)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的過程,隨著認知程度的增加,網(wǎng)絡(luò)結(jié)構(gòu)也日趨復(fù)雜,對刺激的反應(yīng)過程也隨之復(fù)雜化,當(dāng)復(fù)雜到無法預(yù)測時,主觀上就會認為反應(yīng)過程是自發(fā)產(chǎn)生的,這是人的一種錯覺。

幼年,人腦神經(jīng)網(wǎng)絡(luò)的建立過程需要大量的空閑神經(jīng)元,基本雛形確定后,剩余的空閑神經(jīng)元會損失大半,這樣才能夠給網(wǎng)絡(luò)的發(fā)展騰出空間。余留下來的空閑神經(jīng)元或是成為新建神經(jīng)鏈路中的一部分而被確定下來;或是被用于臨時搭建的某些鏈路;或是作為備用存在于網(wǎng)絡(luò)的空隙當(dāng)中。

青少年,神經(jīng)網(wǎng)絡(luò)屬于高速建立階段,這個階段的神經(jīng)網(wǎng)絡(luò)可塑性極強,主要是因為針對事物的認知,即是以機械性記憶為主,對事物認知的量及內(nèi)容是抽象邏輯思維建立的基礎(chǔ)及傾向,隨著量的增加抽象概括的能力會逐漸增強。

中青年,事物的認知量及邏輯思維能力的配比達到了最佳程度,不光有一套較好的能與外界交互的神經(jīng)網(wǎng)絡(luò)系統(tǒng),而且神經(jīng)網(wǎng)絡(luò)還保留有發(fā)展的余地,即還保留有一定的可塑性。

中年,無論是抽象事物還是具體事物,認知量已基本確定,網(wǎng)絡(luò)的結(jié)構(gòu)已日趨復(fù)雜化,在一些局部,需要修改的或是新建的神經(jīng)鏈路對空閑神經(jīng)元的需求也已日趨緊張,使得我們的認知速度逐漸減慢。

老年,在許多的神經(jīng)網(wǎng)絡(luò)區(qū)域,空閑的神經(jīng)元已開始滿足不了認知的需求,另外因為無法認知新的事物,對外界的反應(yīng)能力也開始下降,連帶的相關(guān)神經(jīng)區(qū)域得不到激活,神經(jīng)鏈路的健壯性開始下降,以至于一些神經(jīng)鏈路解體,伴隨的就是認知量的下降,即健忘等等現(xiàn)象,并且成為一種惡性循環(huán)發(fā)展下去……。

五、后記

為了能清楚的闡述它的運行機制,同時也是為了驗證這套理論,根據(jù)前面所提到的神經(jīng)元的結(jié)構(gòu)功能及組網(wǎng)方式,我通過計算機軟件設(shè)計了虛擬的神經(jīng)網(wǎng)絡(luò)系統(tǒng),2000年軟件完成了調(diào)試,并得到了很好實驗結(jié)果。

參考文獻

1《現(xiàn)代科學(xué)育兒答疑》(0-3歲)人民教育出版社1999年第1版

2陳守良等,《人類生物學(xué)》,北京大學(xué)出版社,2001年12月

3陳閱增等(1997).《普通生物學(xué)》.北京:高等教育出版社

4蘇珊·格林菲爾德,《人腦之謎》楊雄里等譯

5陳宜張《分子神經(jīng)生物學(xué)》人民軍醫(yī)出版社1997年2月

6伊·普里戈金、伊·斯唐熱著、曾慶宏、沈小峰譯《從混沌到有序》,上海譯文出版社1987年版。

篇(3)

關(guān)鍵詞:風(fēng)險;軟件需求;BP神經(jīng)網(wǎng)絡(luò);研究;分析

軟件開發(fā)過程中,需求分析是一個關(guān)鍵性的階段。導(dǎo)致它失敗的原因有很多,例如開發(fā)者和用戶之間的溝通障礙、軟件本身的隱含性、需求信息的不對稱等等。這些問題導(dǎo)致的返工,增加了開發(fā)的成本,也損壞了企業(yè)形象,更可能流失掉部分用戶。因此,我們必須對軟件需求分析進行風(fēng)險評估管理,把負面影響降到最低?,F(xiàn)代商業(yè)發(fā)展中,各企業(yè)和企業(yè)之間的競爭日趨激烈,掌握最新的技術(shù),對技術(shù)進行創(chuàng)新,才是企業(yè)在行業(yè)內(nèi)立足腳跟,獲得更加長遠發(fā)展的方法,因此要想牢牢地把握企業(yè)的運命就需要我們保持對技術(shù)創(chuàng)新的熱情,并在這條道路上樂此不疲。21世紀,只有掌握了最新和最具有創(chuàng)造性的技術(shù),才能贏的最后的勝利,本文把BP網(wǎng)絡(luò)與軟件需求分析風(fēng)險評估模型相結(jié)合,具有十分重要的意義。

1BP神經(jīng)網(wǎng)絡(luò)

BP神經(jīng)網(wǎng)絡(luò)是開發(fā)者使用最多的神經(jīng)網(wǎng)絡(luò)之一,它具有算法簡單、極強的魯棒性、收斂速度極快等優(yōu)點。最重要的一點是能夠最大限度的接近其真實系統(tǒng),非常適合于線性的、不確定的、模糊的軟件風(fēng)險數(shù)據(jù)。BP算法是一種用于前向多層神經(jīng)網(wǎng)絡(luò)的的反傳學(xué)習(xí)算法。采用BP算法的數(shù)層感知器神經(jīng)網(wǎng)絡(luò)模型,它的基本思想是,學(xué)習(xí)過程由信號的正向傳播和誤差的反向傳播兩個過程組成。模糊理論采用模糊數(shù)學(xué)的方法,通過抽象思維,對處于多種因素作用下的事物做出總體評價。它的兩大主要特征是:第一,結(jié)果清晰;第二,系統(tǒng)性強,這非常適合于各種非確定性問題的解決。

2軟件需求分析風(fēng)險評估模型

開發(fā)過程中,了解軟件需求是很重要的。軟件開發(fā)主要是依據(jù)需求的不同而設(shè)計出的產(chǎn)品。它包括了業(yè)務(wù)需求(組織和客戶高層次的目標)、用戶需求(用戶要求必須具備的需求)、功能需求(用戶可以通過完成任務(wù)滿足業(yè)務(wù)需求的產(chǎn)品中必須體現(xiàn)的軟件功能)。各種不同的需求都以不同的角度來呈現(xiàn),需要進行多方位的分析方可得出準確的結(jié)論。軟件需求分析就是對用戶所需軟件應(yīng)具備的屬性進行分析,滿足用戶的真正需求。在完成軟件需求分析后,我們要能得出用戶所需的軟件系統(tǒng)要能夠做到哪些功能,對此還要有詳細準確的說明書,也就是用戶的使用說明書,讓他們更快的了解產(chǎn)品。優(yōu)秀的需求具有以下特點:完整性、準確性、可行性、必要性、無歧義性和可行性。軟件需求分析風(fēng)險是指由于多方面的影響,如用戶參與度、用戶需求的拓展變化、多角度的考慮、設(shè)計的精準度和用戶與開發(fā)者的充分溝通等等,而造成需求分析的不準確使得用戶的軟件需求得不到滿足。該風(fēng)險評估模型主要是為了降低軟件需求分析中存在的風(fēng)險,從而使得評估需求分析更具加有效和更易操作。

3一種基于BP神經(jīng)網(wǎng)絡(luò)的軟件需求分析風(fēng)險評估模型

本文把BP神經(jīng)網(wǎng)絡(luò)和模糊理論加入到軟件需求分析風(fēng)險評估模型中,利用BP神經(jīng)網(wǎng)絡(luò)的非線性映射屬性和模糊理論的超強表達能力與被理解力,幫助提高風(fēng)險評估的有效性和預(yù)測性。軟件需求分析風(fēng)險的評估模型包括風(fēng)險識別、風(fēng)險分析、風(fēng)險評估三個模塊。風(fēng)險識別的主要目的是考察研究軟件需求分析階段具體的情況,識別并記錄該階段存在的或潛在的風(fēng)險,輸入來源是專家的經(jīng)驗分析和歷史風(fēng)險數(shù)據(jù)庫。一般步驟包括:a:找出軟件需求分析風(fēng)險指標;b:搜索歷史數(shù)據(jù)庫,列出存在的數(shù)據(jù)庫中的歷史案例;c:通過專家分析,列出具有風(fēng)險等級的列表;d:將確定了的風(fēng)險列表提交數(shù)據(jù)庫并更新。風(fēng)險分析是細化第一階段的風(fēng)險,分析其產(chǎn)生的影響和等級,找出各指標與風(fēng)險級別之間的線性關(guān)系亦或非線性關(guān)系。本文引入BP神經(jīng)網(wǎng)絡(luò)和模糊理論,利用BP神經(jīng)網(wǎng)絡(luò)實現(xiàn)風(fēng)險評估指標和風(fēng)險級別之間的非線性映射關(guān)系,還利用模糊理論的超強表達能力和容易理解的屬性,提高整個風(fēng)險評估模型的學(xué)習(xí)能力和表達能力,得出更符合實際的評估報告。主要的方法包括:a:揭示原因和結(jié)果之間的聯(lián)系,追根溯源;b:建立模型進行認識和理解;C:通過嘗試各種組合找出導(dǎo)致失敗的因素。風(fēng)險評估需最后明確所有存在的風(fēng)險和它們的等級,給予開發(fā)者一個詳細的報告。本階段只要利用BP神經(jīng)網(wǎng)絡(luò)的輸入層、輸出層、隱含層數(shù)、隱含層節(jié)點數(shù)。輸入層節(jié)點是經(jīng)過模糊預(yù)處理的17個需求分析風(fēng)險評估指標;輸出層節(jié)點是需求分析風(fēng)險等級;隱含層數(shù)越多性能越高誤差越低;隱含節(jié)點越多,網(wǎng)絡(luò)功能越強大,但是過多則會使網(wǎng)絡(luò)功能減弱。在BP神經(jīng)網(wǎng)絡(luò)基礎(chǔ)上,建立的軟件需求分析風(fēng)險評估模型,它操作的流程大致是三個方向。首先,識別軟件需求分析階段存在的、潛在的風(fēng)險;然后,利用BP神經(jīng)網(wǎng)絡(luò)和模糊理論的特有屬性、眾多優(yōu)點進行分析,通過歷史數(shù)據(jù)庫,專家知識、專家討論,列出風(fēng)險表格;最后,對風(fēng)險進行最后的評估,從而有效預(yù)測軟件開發(fā)過程中所遇到的風(fēng)險,并且進行規(guī)避。

4結(jié)束語

隨著經(jīng)濟的高速發(fā)展,網(wǎng)絡(luò)軟件也成為人們工作生活中一個非常重要的工具。軟件需求的增多帶來了很多的問題,軟件開發(fā)的過程充滿了阻礙,軟件需求的滿意度也在日漸降低。因此,提高軟件開發(fā)的速度、保證開發(fā)軟件的質(zhì)量,降低風(fēng)險、減少開發(fā)成本、滿足用戶真正的需求等等,對軟件需求分析風(fēng)險進行評估,建立軟件需求分析風(fēng)險評估模型,是一件非常值得研究和實施的事情。本文研究的內(nèi)容不僅僅達到了需求分析的目的,提出了新的思維方式和參考方向,而且還能更有效的預(yù)測軟件需求分析風(fēng)險,真正滿足用戶的軟件需求。基金項目:吉林省教育廳“十二五”科學(xué)技術(shù)研究項目“基于AHP和群決策向量分析高校干部綜合測評方法和系統(tǒng)實現(xiàn)”(吉教科合字第2013402號);吉林省教育科學(xué)“十二五”規(guī)劃課題“構(gòu)建以學(xué)習(xí)者為主體的遠程教育支持服務(wù)體系的研究”(GH150583)。

作者:楊明莉 單位:吉林工商學(xué)院信息工程學(xué)院

篇(4)

水工隧洞一般都有過水要求,加上其復(fù)雜的地質(zhì)條件,因此正確的進行圍巖分類后采取相應(yīng)的支護措施將對保證隧洞穩(wěn)定性起決定性的作用。圍巖分類是一類非線性的綜合判定問題,用人工神經(jīng)網(wǎng)絡(luò)方法來判別水工隧洞圍巖類別是一種新的嘗試和新的方法。

1.圍巖分類的判定依據(jù)

水工隧洞圍巖工程地質(zhì)分類應(yīng)以控制圍巖穩(wěn)定的巖石強度、巖體完整程度、張開度、地下水力狀態(tài)和主要結(jié)構(gòu)面產(chǎn)狀等五項因素綜合評分為依據(jù),圍巖強度應(yīng)力比為限定依據(jù),見表1。

表1圍巖工程地質(zhì)分類依據(jù)

指標名稱評價因素

巖石強度(A1)采用巖塊的單軸抗壓強度(MPa)

巖體完整程度(A2)采用完整性系數(shù)Kv

張開度(A3)考慮結(jié)構(gòu)面的連續(xù)性、粗糙度和充填物

地下水狀態(tài)(A4)考慮地下水的發(fā)育程度,用單位洞長單位時間的涌水量

主要結(jié)構(gòu)面產(chǎn)狀(A5)采用結(jié)構(gòu)面走向與洞軸線的夾角

以上五個因素是控制圍巖穩(wěn)定性的主要因素,圍巖的分類標準見表2。

表2圍巖工程地質(zhì)分類標準

評價因素圍巖類別

Ⅰ(穩(wěn)定)Ⅱ(基本穩(wěn)定)Ⅲ(局部穩(wěn)定性差)Ⅳ(不穩(wěn)定)Ⅴ(極不穩(wěn)定)

A1(MPa)>200100~20050~10025~50<25

A20.9~1.00.75~0.90.5~0.750.25~0.5<0.25

A3(mm)<0.50.5~11~33~5>5

A4(L/min·10m)<2525~5050~100100~125>125

A5(o)90~7575~6060~4545~30<30

2.水工隧洞圍巖分類的人工神經(jīng)網(wǎng)絡(luò)模型

神經(jīng)網(wǎng)絡(luò)系統(tǒng)是由大量的、簡單的處理單元廣泛的互相連接而形成的復(fù)雜的網(wǎng)絡(luò)系統(tǒng)。人工神經(jīng)網(wǎng)絡(luò)模型最基本的有兩大類:一類是以Hopfield網(wǎng)絡(luò)模型為代表的反饋型模型,它具有非線性和動態(tài)性;另一類是以多層感知器為基礎(chǔ)的前饋模型。其中BP(BackPropagation)網(wǎng)絡(luò)是目前應(yīng)用最廣泛的多層前饋神經(jīng)網(wǎng)絡(luò)模型。本文采用BP網(wǎng)絡(luò)模型。

2.1BP神經(jīng)網(wǎng)絡(luò)模型及其算法

BP神經(jīng)網(wǎng)絡(luò)由輸入層、隱含層和輸出層三層感知器組成,每層由若干個神經(jīng)元組成。輸入層接受信息,傳入到隱含層,經(jīng)過作用函數(shù)后,再把隱結(jié)點的輸出信號傳到輸出層輸出結(jié)果。節(jié)點的作用函數(shù)選用Sigmoid函數(shù),即:

(1)

BP神經(jīng)網(wǎng)絡(luò)采用誤差逆?zhèn)鞑シ磳W(xué)習(xí)算法。學(xué)習(xí)過程由正向傳播和反向傳播組成。在正向傳播過程中,輸入信號由輸入層經(jīng)隱含層處理后傳向輸出層,每一層神經(jīng)元的狀態(tài)只影響下一層神經(jīng)元的狀態(tài)。如果在輸出層得不到一個期望的輸出,則轉(zhuǎn)向反傳播,將輸出信號的誤差按原來的連接通路返回,通過修改各層神經(jīng)元的權(quán)值,使得誤差信號最小,得到合適的網(wǎng)絡(luò)連接權(quán)后,便可對新的樣本進行識別。BP網(wǎng)絡(luò)學(xué)習(xí)過程具體步驟如下:

(1)初始化,設(shè)置網(wǎng)絡(luò)結(jié)構(gòu),賦初始權(quán)值;

(2)為網(wǎng)絡(luò)提供一組學(xué)習(xí)樣本,包括M個樣本對(),輸入向量,輸出向量,n、m分別為輸入層和輸出層神經(jīng)元個數(shù),;

(3)對每個學(xué)習(xí)樣本P進行(4)~(8);

(4)逐層正向計算網(wǎng)絡(luò)各節(jié)點的實際輸出:

(2)

其中,為神經(jīng)元i、j之間的權(quán)值;為前層第i個神經(jīng)元的實際輸出,為式(1)給出的函數(shù);

(5)計算網(wǎng)絡(luò)輸出誤差:

第P個樣本的輸出誤差為(3)

其中,,分別為輸出層第j個神經(jīng)元的期望輸出和實際輸出。

網(wǎng)絡(luò)總誤差為;(4)

(6)當(dāng)E小于允許誤差或達到指定迭代次數(shù)時,學(xué)習(xí)過程結(jié)束,否則進行誤差逆向傳播,轉(zhuǎn)向(7);

(7)逆向逐層計算網(wǎng)絡(luò)各節(jié)點誤差:

對于輸出層,(5)

對于隱含層,(6)

其中代表后層第個神經(jīng)元。

(8)修正網(wǎng)絡(luò)連接權(quán):,其中為學(xué)習(xí)次數(shù),為學(xué)習(xí)因子,值越大,產(chǎn)生的振蕩越大。通常在權(quán)值修正公式中加入一個勢態(tài)項,變成:

(7)

其中,a稱為勢態(tài)因子,它決定上次學(xué)習(xí)的權(quán)值變化對本次權(quán)值更新的影響程度。

2.2圍巖分類的BP模型

在以表2中數(shù)據(jù)為基礎(chǔ)進行網(wǎng)絡(luò)訓(xùn)練前,須對表中指標作如下處理:Ⅰ、Ⅴ類對應(yīng)的指標取其界限值或平均值;Ⅱ、Ⅲ、Ⅳ類對應(yīng)的指標取其平均值。作上述處理后,可以得到網(wǎng)絡(luò)訓(xùn)練模型的5個學(xué)習(xí)樣本,如表3。

表3圍巖類別識別模型的學(xué)習(xí)樣本

類別樣本類別A1A2A3A4A5

P1Ⅰ2000.950.52582.5

P2Ⅱ1500.8250.7537.567.5

P3Ⅲ750.62527552.5

P4Ⅳ37.50.3754112.537.5

P5Ⅴ250.25512530

以上表中5個類別樣本作為神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)樣本,在輸入層和隱含層各設(shè)置一個特殊單元作為閾值單元,其值設(shè)為1。模型結(jié)構(gòu)如下圖1所示。

圖1圍巖類別分類的BP網(wǎng)絡(luò)模型

設(shè)圍巖類別為P1、P2、P3、P4、P5這5個類別樣本的預(yù)期輸出矢量,各分量定義為

網(wǎng)絡(luò)訓(xùn)練時,當(dāng)所有樣本在網(wǎng)絡(luò)輸出節(jié)點的實際輸出與網(wǎng)絡(luò)期望輸出之間的最大誤差小于預(yù)先給定的常數(shù),即時學(xué)習(xí)結(jié)束。

網(wǎng)絡(luò)經(jīng)過15000次訓(xùn)練,每個樣本的網(wǎng)絡(luò)輸出與期望輸出最大誤差為0.2,絕大部分在0.1之內(nèi)。應(yīng)用訓(xùn)練后的BP模型劃分新的圍巖類別樣本,等判定圍巖類別樣本W(wǎng)經(jīng)網(wǎng)絡(luò)變換后輸出O與各期望輸出比較,設(shè),。

如果,則,,即隧洞圍巖類別樣本屬于級。

3.沙灣隧洞的圍巖分類應(yīng)用實例

東深供水改造工程沙灣隧洞位于深圳市北東面內(nèi)15公理處,區(qū)域地勢東高西低。工程區(qū)域周圍沉積巖、巖漿巖和變質(zhì)巖三大巖類均有出露。隧洞線路地帶分布的地層,除洞口溝谷部位為第四系松散堆積層外,其余均為侏羅系中統(tǒng)塘夏群碎屑巖,基本為單斜構(gòu)造,但末端因受深圳斷裂帶影響,巖層產(chǎn)狀較為紊亂,地質(zhì)條件復(fù)雜多變。

隧洞開挖后,測得三種圍巖地段的力學(xué)性質(zhì)和環(huán)境條件,取三個樣本為a、b、c。用BP人工神經(jīng)網(wǎng)絡(luò)判定該工程隧洞圍巖類別。

根據(jù)水利水電工程地質(zhì)勘察規(guī)范,隧洞圍巖類別分為5級:Ⅰ(穩(wěn)定)、Ⅱ(基本穩(wěn)定)、Ⅲ(局部穩(wěn)定性差)、Ⅳ(不穩(wěn)定)、Ⅴ(極不穩(wěn)定)。對照學(xué)習(xí)樣本各特征變量,用訓(xùn)練好的BP模型對a、b、c三個樣本進行判定,其結(jié)果見表4。

表4沙灣隧洞三組樣本實測指標與圍巖類別判定結(jié)果

指標名稱實測指標值

abc

巖石強度(A1)2845100

巖體完整程度(A2)0.220.50.55

張開度(A3)341

地下水狀態(tài)(A4)1208025

主要結(jié)構(gòu)面產(chǎn)狀(A5)305060

圍巖類別判定結(jié)果ⅤⅣⅢ

4.結(jié)論

水工隧洞圍巖類別判定,不僅影響因素多,而且具有很大的模糊性和不確定性。人工神經(jīng)網(wǎng)絡(luò)是一門新興的交叉學(xué)科,它具有聯(lián)想、記憶功能和判別識別的模糊性等優(yōu)點,用它來進行圍巖類別分類,不需對輸入輸出指標的關(guān)系作任何假設(shè),這種關(guān)系是神經(jīng)網(wǎng)絡(luò)從實例中自適應(yīng)學(xué)習(xí)而獲得的,大大減少了人為因素的影響,省去了事后的經(jīng)驗判斷。實踐證明,它在理論和應(yīng)用上都是可行的和有實際意義的。

參考文獻

篇(5)

論文關(guān)鍵詞:咸潮,東江,神經(jīng)網(wǎng)絡(luò)

 

東江為珠江三大干流之一,發(fā)源于江西省尋烏縣,由東向西流經(jīng)龍川、惠州等地,于東莞橋頭鎮(zhèn)進入東莞市,流經(jīng)約20公里至石龍分為南、北二大干流進入河網(wǎng)區(qū),經(jīng)東莞虎門出海。整個東江下游近入河口處,受徑流和潮汐共同影響,海水隨著海洋潮汐漲潮流沿著東江河口的主要潮汐通道向上推進,成為感潮河段。東江下游分布了東莞市主力水廠,咸水上溯將影響當(dāng)?shù)氐墓┧|(zhì)。當(dāng)水體含氯化物濃度超過250mg/L時數(shù)學(xué)建模論文,就不能滿足供水水質(zhì)標準,影響城鎮(zhèn)生活供水。自2004年開始,每年的11月至次年2月易遭受咸潮的侵襲。2004年底東江徑流量比多年同期減少約五成,咸潮持續(xù)了近六個月,東莞部分水廠因為氯化物超標停止取水,對當(dāng)?shù)鼐用裆詈凸まr(nóng)業(yè)用水造成極大的影響。

咸潮發(fā)生的機制十分復(fù)雜,受徑流、潮汐、河口等多個因素共同影響,且各個因素之間有著復(fù)雜的聯(lián)系,同時所需的觀測資料不完整,因此難以用數(shù)學(xué)模型準確地描述咸潮的發(fā)生規(guī)律,而采用數(shù)理統(tǒng)計方法只能確定“點”到“點”的關(guān)系,不能描述咸潮空間變化的連續(xù)過程,具有一定的局限性。真正意義上的咸潮預(yù)報模型方面的研究與應(yīng)用不多見,以基于偏最小二乘回歸與支持向量耦合建立的咸潮預(yù)報需要有較高的編程程序【1】,在實際應(yīng)用中具有一定難度。人工神經(jīng)網(wǎng)絡(luò)是近年來發(fā)展起來的一種受到人腦和神經(jīng)系統(tǒng)啟發(fā)而創(chuàng)建的計算方法,根據(jù)以往的數(shù)據(jù)找到一種比較精確的方法使得預(yù)測結(jié)果與實際情況相符合,預(yù)測的結(jié)果具有很高的信任度【2】論文下載。因此,本文以東江下游2009年10月~12月的實測統(tǒng)計資料為基礎(chǔ),建立通過人工神經(jīng)網(wǎng)絡(luò)的耦合潮位、上游徑流量、咸度等因子建立咸潮預(yù)測模型,能為合理分配現(xiàn)有水資源、水廠抗咸提供可靠的依據(jù)。

1 BP神經(jīng)網(wǎng)絡(luò)原理

統(tǒng)計模型中,常采用回歸分析方法,對事先擬定的因子進行篩選和系數(shù)求解,但當(dāng)擬定的因子樣本數(shù)較少且因子之間存在嚴重的相關(guān)性時,會導(dǎo)致分析失效[2]。人工神經(jīng)網(wǎng)絡(luò)能夠通過大量簡單的神經(jīng)元廣泛互連形成的復(fù)雜的非線性系統(tǒng)。它不需要任何先驗公示,就能從環(huán)境變量和待預(yù)測水質(zhì)指標的歷史數(shù)據(jù)之間中自動地歸納規(guī)則數(shù)學(xué)建模論文,獲得這些數(shù)據(jù)的內(nèi)在規(guī)律,具有很強的非線性映射能力,特別適合于因果關(guān)系的非確定性推理、判斷、識別和分類等問題。其中的BP網(wǎng)絡(luò)算法使用反向傳播算法對網(wǎng)絡(luò)的權(quán)值和偏差進行反復(fù)的調(diào)整訓(xùn)練,使輸出的向量與期望向量盡可能地接近,當(dāng)網(wǎng)絡(luò)輸出層的誤差平方和小于指定的誤差時訓(xùn)練完成,保存網(wǎng)絡(luò)的權(quán)值和偏差,是目前運用最廣泛、最為成功的一種算法【3】。

BP 算法“訓(xùn)練”的過程可以分為向前傳輸和向后傳輸兩個階段:

1、向前傳輸階段

(1)從樣本集中取一個樣本,,將輸入網(wǎng)絡(luò)。

(2)運算過程中,對數(shù)據(jù)的取值采集的各數(shù)據(jù)單位不一致,可對數(shù)據(jù)采用歸一化方法處理。

(3)計算出誤差測度和實際輸出

(4)對權(quán)重值各做一次調(diào)整,重復(fù)這個循環(huán),直到。

2、向后傳播階段――誤差傳播階段

(1)計算實際輸出O與理想輸出地差

(2)用輸出層的誤差調(diào)整輸出層權(quán)矩陣

(3)

(4)用此誤差估計輸出層的直接前到層的誤差,再輸出層前導(dǎo)層誤差估計更前一層的誤差。如此獲得所有其他各層的誤差估計。

(5)并用這些估計實現(xiàn)對矩陣的修改。形成講輸出端表現(xiàn)出的誤差沿著與輸出信號相反的方向逐級向輸出端傳遞的過程。

網(wǎng)絡(luò)關(guān)

于整個樣本集的誤差測度:

2 東江下游河道咸潮預(yù)測模型的建立

根據(jù)多年的歷史觀測資料,東江下游咸度一方面受上游徑流量大小的影響(上游來水量越小,咸度值偏高的可能性越大,反之亦然),另一方面還與漲落潮的潮位緊密相關(guān)[4-5]。因此,本文選取博羅水文站記錄的上游徑流量、東江河口潮位、東江下游大王洲橋的咸度作為本模型的自變量和因變量(見圖1)。根據(jù)2009年10月~12月的實測資料,首先選用2009年10月共60日的數(shù)據(jù),對模型進行訓(xùn)練和模擬,建立東江下游月時段水量預(yù)測模型。

在應(yīng)用BP網(wǎng)絡(luò)運算過程中,輸入向量有2個元素數(shù)學(xué)建模論文,輸出向量有1個元素,所以網(wǎng)絡(luò)的輸入層有5個結(jié)點,輸出結(jié)點1個,采用3層BP網(wǎng)絡(luò)結(jié)構(gòu),即網(wǎng)絡(luò)只有1個隱含層,當(dāng)隱含層節(jié)點為4個時,所建模型具有相對較小的模擬誤差,因而,隱含層節(jié)點設(shè)置為4個。網(wǎng)絡(luò)的訓(xùn)練目標為0.001,最大訓(xùn)練次數(shù)為20000次。為了防止網(wǎng)絡(luò)發(fā)生過度擬合,訓(xùn)練方法采用泛化能力較強的貝葉斯正則化方法論文下載。整個過程通過大量的試驗計算獲得,這無形增加了研究工作量和編程計算工作量,Matlab軟件提供了一個現(xiàn)成的神經(jīng)網(wǎng)絡(luò)工具箱,為解決這個矛盾提供了便利條件。

圖1 東江下游地理位置圖

3討論

為檢驗?zāi)P偷念A(yù)測效果,運用前面已訓(xùn)練過的用2009年12月共18日的咸潮情況進行預(yù)測,預(yù)測值和實測值見表2,結(jié)果顯示數(shù)學(xué)建模論文,通過bp人工神經(jīng)網(wǎng)絡(luò)模型,以徑流及潮差變化預(yù)測咸潮的方法是可行的,對咸潮的預(yù)測基本符合實際情況。

二十世紀九十年代,東江100m3/s的流量可以將咸潮壓制在東江萬江――中堂入??谔?。2004年東江劍潭樞紐工程建設(shè)竣工后,上游徑流流速減慢,對東江河道輸砂量的攔截作用增大,下游河道的水位呈下降趨勢并降到海平面以下,水力坡降的壓咸作用消失【6】,海水入侵由原來的主要受流量影響轉(zhuǎn)變?yōu)槭艹毕土髁抗餐绊?。從實測數(shù)據(jù)來看,由于潮差的半月變化直接影響到潮流的強弱,大潮(為農(nóng)歷十五至十八)時,咸潮強度大,上溯距離長,上游徑流量要增加。整個東江下游作為感潮河段,一般情況下,上游徑流量只要維持在270m3/s就能將咸潮線控制在萬江至中堂一線以下。但是,在初一、十五大潮時段,如果上游壓咸的需水量無法維持到360m3/s,咸潮有可能越過第二水廠,上溯到石龍段。2009年12月1-9日,大潮前后,潮位超過了1.00m,上游徑流量最大僅為348m3/s數(shù)學(xué)建模論文,東莞市第二水廠的取水口氯化物濃度出現(xiàn)峰值,曾一度停產(chǎn),影響正常生產(chǎn);2009年12月16日-20日,小潮前后,由于上游徑流量大幅度增加至370m3/s,咸潮無法達到第二水廠,保障了生產(chǎn)水廠的正常取水。

表1 2009年12月東江上游流量、河口潮位的實測值

 

日期

1日

2日

3日

4日

5日

6日

7日

8日

9日

東江河口最大潮位m

1.08

1.21

1.28

1.27

1.28

1.19

1.02

0.76

0.45

博羅水文站流量m3/s

279

271

302

317

312

348

340

299

258

日期

16日

17日

18日

19日

20日

21日

22日

23日

24日

東江河口最大潮位m

1.06

1.07

1.06

1.04

0.97

0.86

0.71

0.50

0.25

博羅水文站流量m3/s

370

370

330

342

338

284

285

篇(6)

BP神經(jīng)網(wǎng)絡(luò)模型的應(yīng)用范圍比較寬廣,它也是眾多神經(jīng)網(wǎng)絡(luò)模型中的一種使用效率較好的方式。該種神經(jīng)網(wǎng)絡(luò)利用存儲空間和不斷學(xué)習(xí)注入新的內(nèi)容將工程造價中的輸入、輸出關(guān)系具體呈現(xiàn)出來,運行時,可以有效降低網(wǎng)絡(luò)使用的誤差幾率。這一過程中使用的算法為梯度下降法,利用反向傳播的理論對網(wǎng)絡(luò)中的權(quán)值和閥值進行靈活調(diào)整和運用。BP神經(jīng)網(wǎng)絡(luò)中統(tǒng)計數(shù)據(jù)的輸入是由輸入層完成的,輸入層直接和隱層相聯(lián)系,隱層又直接和輸出層對接,而隱層可由單一層充當(dāng),也可以是多層結(jié)構(gòu),此時輸入層和輸入層之間神經(jīng)個數(shù)的具體量可以根據(jù)系統(tǒng)公式來定,因此數(shù)據(jù)在輸入后的輸出過程比較便捷。實際運算中,每一神經(jīng)元連接強度的權(quán)值存在差異性,輸入數(shù)據(jù)的影響程度也會隨著權(quán)值的增大而加深。BP神經(jīng)網(wǎng)絡(luò)算法通常包括兩項內(nèi)容,一是通過正向傳播的樣本輸入,二是通過反向傳播的誤差數(shù)據(jù)反饋修正權(quán)值。正向傳播主要是從輸入層完成樣本的輸入過程,接著經(jīng)過隱層將數(shù)據(jù)信息傳遞到輸出層,此時若實際輸出結(jié)果和期望數(shù)值存在的差異,已經(jīng)超過了事先設(shè)定的誤差,則為反向傳播。如果實際的輸出值和期望效果的差異比事前設(shè)定值要小,系統(tǒng)結(jié)束學(xué)習(xí)算法。該種算法可以利用反復(fù)學(xué)習(xí)與功能連續(xù)鍛煉的機會而促進運行過程的不斷更新,對權(quán)值和閥值的靈活調(diào)整要通過幾百次甚至幾萬次的映射,同時也要經(jīng)過正向傳播和反向傳播的交替運行來完成,這樣才可以最大限度降低誤差。

2TOC理論概述和在工程造價預(yù)控中的應(yīng)用

TOC理論也叫做約束理論,英文全稱是TheoryofContraint,起初是用在制造業(yè)中的管理思維方式。不同事物中或者客觀系統(tǒng)中,對事物發(fā)展方向產(chǎn)生重要影響的總是關(guān)鍵的極少數(shù),而絕大多數(shù)處于被制約地位,這是TOC理論的假設(shè)基礎(chǔ),因此在對系統(tǒng)進行控制和領(lǐng)導(dǎo)時,只要將關(guān)鍵部分管理好,則可以收到事半功倍的效果。這一理論在工程造價的預(yù)控中有著重要的實踐意義。通過將影響工程造價超支的各種因素找出來,并羅列出最為關(guān)鍵的因素,作為調(diào)節(jié)造價的杠桿,著重控制這些因素,盡力消除制約,提高控制效率,可以實現(xiàn)預(yù)期的建設(shè)目標。關(guān)鍵鏈法是在TOC理論上形成的常用操作方式,同時也提出了TOC在對待并行項目中如何有效實現(xiàn)資源共享的辦法,核心原則是遵循整體優(yōu)化而非局部優(yōu)化方針,也即要在工程項目中,每一環(huán)節(jié)都要秉持著整體優(yōu)化準則,將完成每一工序的保守時間抽出來,用一個合理的概率乘以相應(yīng)工序時間值來作為工序的估計時間,同時還要在其中考慮相關(guān)的資源約束性。關(guān)鍵鏈的思考方式就是將時間和資源的約束性加以管理,把關(guān)鍵鏈網(wǎng)絡(luò)化并對項目和資源進行合理的規(guī)劃與整合,對工程造價控制過程的管理具有實踐應(yīng)用意義,一般采用五步法實施,一要找出制約系統(tǒng)運行的因素,二是將制約因素中存在的潛力充分挖掘出來,三是使系統(tǒng)中的其余任務(wù)都服從第二步的挖掘策略,四是不斷提升制約因素的能力,五是若已有的制約因素已經(jīng)消除,回到第一步,否則回到第二步,但是在回到第一步時不要讓管理慣性成為新的制約因素。

3BP神經(jīng)網(wǎng)絡(luò)與TOC理論聯(lián)合使用對工程造價預(yù)控作用

工程造價通常是指一般的建設(shè)工程從計劃籌建到竣工驗收交付這一過程中,各個環(huán)節(jié)運作需要投資的總和,兼具投資和成本的雙重性。工程造價通從政府部門角度衡量算作一種投資從開發(fā)商角度來說則屬于項目成本。利用BP神經(jīng)網(wǎng)絡(luò)和TOC理論可以對工程造價起到準確的預(yù)測作用,同時可以有效控制工程造價成本,最關(guān)鍵的問題是要處理好BP神經(jīng)網(wǎng)絡(luò)最終預(yù)測結(jié)果與TOC理論的有機結(jié)合方式。一般來說,當(dāng)工程造價中的BP神經(jīng)網(wǎng)絡(luò)模型投入使用時,選擇的樣本數(shù)據(jù)也滿足建模的需求,那么可以進行擬建工程的初步概算,同時,也可以將合同金額的有關(guān)數(shù)據(jù)信息當(dāng)做預(yù)測分析應(yīng)用數(shù)據(jù)加以利用,計算出預(yù)測結(jié)果,確定建設(shè)工程決算和合同金額相比,實際增加或者降低的比值,依據(jù)預(yù)測結(jié)果的正值,可以為項目工程成本的超支項和負值節(jié)約不必要的開銷,按照預(yù)測結(jié)果中的向量水平將與其對應(yīng)的合同各條款項相乘得出最終的統(tǒng)一值,依據(jù)制約理論的原則將該項結(jié)果的一半作為工程施工預(yù)留金控制的一部分,根據(jù)實際的情況,對預(yù)留金中的每一項采取增加或者減少的方式,確保新合同中的金額數(shù)量能夠滿足工程造價的需求,或者以此為依托,再形成新的金額向量。在這份新合同中,所計算的金額不僅包括原來工程量的清單計算方式,并且是已經(jīng)進行優(yōu)化的,具有可操作意義的,同時也包括了未來擬建工程依據(jù)原先的預(yù)測結(jié)果而形成的工程決算金額計劃,是具有科學(xué)預(yù)測性和前瞻性的,也能夠考慮到當(dāng)前的狀態(tài)。所以,單純擬建工程項目在最初成本預(yù)測方面并不具有顯著的優(yōu)勢,這和影響成本增高的因素有關(guān)。例如工程量的大小、工期的延長時間不同等,所以僅僅采用傳統(tǒng)的計算和預(yù)測方式?jīng)]有辦法獲取更為準確的數(shù)據(jù),利用BP神經(jīng)網(wǎng)絡(luò)可以更為精確地計算和度量各種數(shù)據(jù),同時也可以為工程預(yù)算過程和建設(shè)目標成本控制提供更為科學(xué)的依據(jù)。TOC理論則在工程建設(shè)監(jiān)督管理中發(fā)揮重要的作用,過程控制水平也會對造價預(yù)控質(zhì)量起到重要的影響,即便預(yù)測得再精確與科學(xué),離開完善的過程控制和管理,造價預(yù)控水平依然達不到預(yù)期的目的。TOC理論的運用,能夠有效發(fā)現(xiàn)工程建設(shè)中合同金額出現(xiàn)的變動問題,新構(gòu)建的合同在實行過程中難免會遇到實際阻力,如果工程成本管理中出現(xiàn)了與原計劃背離的跡象,或者工程的決算方向沒有依據(jù)BP神經(jīng)網(wǎng)絡(luò)的預(yù)測規(guī)則,那么很容易造成工程運行的瓶頸問題,此時為了保證工程建設(shè)項目的順利進行,或者為將風(fēng)險與損失控制在最小范圍內(nèi),就要當(dāng)機立斷根據(jù)預(yù)留資金的數(shù)量對整個決算實施過程進行相應(yīng)的調(diào)整,同時還要對工程總合同金額做出適當(dāng)?shù)恼{(diào)整,以便使得每一環(huán)節(jié)都能夠協(xié)調(diào)運作,確保瓶頸問題不會帶來無法彌補的損失,控制好工程建設(shè)朝著良性循環(huán)方向發(fā)展。TOC理論的應(yīng)用是為BP理論在過程干預(yù)中進行的補充,使二者達到優(yōu)勢互補的效果,BP神經(jīng)網(wǎng)絡(luò)重在事前的控制,也即通過精確計算和預(yù)測,可以提高事前控制力度,而TOC理論對過程控制效果良好,是典型的事中控制理論,將工程造價的事前控制與事中控制有機統(tǒng)一在一起,造價預(yù)控水平大為提高,可為工程建設(shè)項目節(jié)約成本的同時創(chuàng)造利潤,也是實現(xiàn)資源優(yōu)化配置的有效途徑。

4總結(jié)

篇(7)

 

 

本 科 生 畢 業(yè) 論 文(設(shè)計)

 

本 科 生 畢 業(yè) 論 文(設(shè)計)

題目 陣列化的非晶體納米硅神經(jīng)突觸器件制備與數(shù)值模擬        

 

 

姓名與學(xué)號     鄭浩 315104964    

指導(dǎo)教師        皮孝東          

合作導(dǎo)師                        

年級與專業(yè)  2015級 材料科學(xué)工程  

所在學(xué)院        材料科學(xué)工程        

 

提交日期                          

A Dissertation Submitted to Zhejiang University for

Bachelor Degree of Engineering

 

Preparation and Numerical Simulation of Arrayed Amorphous Nano Silicon Synaptic Devices

 

Submitted by

Hao Zheng

 

Supervised by

Prof. XiaoDong Pi

 

 

School of Materials Science and Engineering

 Laboratory of Silicon Materials, Zhejiang University, Hangzhou

 People’s Republic of China

May, 20th, 2019

 

 

浙江大學(xué)本科生畢業(yè)論文(設(shè)計)承諾書

1.本人鄭重地承諾所呈交的畢業(yè)論文(設(shè)計),是在指導(dǎo)教師的指導(dǎo)下嚴格按照學(xué)校和學(xué)院有關(guān)規(guī)定完成的。

2.本人在畢業(yè)論文(設(shè)計)中除了文別加以標注和致謝的地方外,論文中不包含其他人已經(jīng)發(fā)表或撰寫過的研究成果,也不包含為獲得 浙江大學(xué) 或其他教育機構(gòu)的學(xué)位或證書而使用過的材料。

3.與我一同工作的同志對本研究所做的任何貢獻均已在論文中作了明確的說明并表示謝意。

4. 本人承諾在畢業(yè)論文(設(shè)計)選題和研究內(nèi)容過程中沒有偽造相關(guān)數(shù)據(jù)等行為。

5. 在畢業(yè)論文(設(shè)計)中對侵犯任何方面知識產(chǎn)權(quán)的行為,由本人承擔(dān)相應(yīng)的法律責(zé)任。

6.本人完全了解 浙江大學(xué) 有權(quán)保留并向有關(guān)部門或機構(gòu)送交本論文(設(shè)計)的復(fù)印件和磁盤,允許本論文(設(shè)計)被查閱和借閱。本人授權(quán) 浙江大學(xué) 可以將本論文(設(shè)計)的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進行檢索和傳播,可以采用影印、縮印或掃描等復(fù)制手段保存、匯編本論文(設(shè)計)。

 

 

作者簽名:                         導(dǎo)師簽名:

 

簽字日期:     年   月   日      簽字日期:      年   月   日

 

 

 

致  謝

致謝內(nèi)容。(仿宋字體或Times New Roman,小四號,兩端對齊,首行縮進兩個漢字符位,段前0磅,段后0磅,固定行距20磅。)

致謝內(nèi)容。

致謝內(nèi)容。

致謝內(nèi)容。

致謝內(nèi)容。

致謝內(nèi)容。

致謝內(nèi)容。

致謝內(nèi)容。

致謝內(nèi)容。

致謝內(nèi)容。

致謝內(nèi)容。

致謝內(nèi)容。

致謝內(nèi)容。

致謝內(nèi)容。

致謝內(nèi)容。

致謝內(nèi)容。

致謝內(nèi)容。

致謝內(nèi)容。

致謝內(nèi)容。

致謝內(nèi)容。

致謝內(nèi)容。

致謝內(nèi)容。

致謝內(nèi)容。

致謝內(nèi)容。

致謝內(nèi)容。

致謝內(nèi)容。

致謝內(nèi)容。

致謝內(nèi)容。

致謝內(nèi)容。

致謝內(nèi)容。

 

致謝內(nèi)容。

致謝內(nèi)容。

致謝內(nèi)容。

致謝內(nèi)容。

致謝內(nèi)容。

致謝內(nèi)容。

致謝內(nèi)容。

致謝內(nèi)容。

致謝內(nèi)容。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

摘  要

信息時代的來臨,人類在處理大數(shù)據(jù)與多信息的任務(wù)面前面臨著很大的挑戰(zhàn),傳統(tǒng)的馮-諾依曼式計算機思想在處理這些問題時出現(xiàn)了本質(zhì)上的不足,因此神經(jīng)網(wǎng)絡(luò)的應(yīng)用于硬件化變得十分迫切。隨著憶阻器的發(fā)現(xiàn),類腦計算的實際應(yīng)用變得可能。本文從硬件神經(jīng)網(wǎng)絡(luò)的興起出發(fā),闡述了硬件神經(jīng)網(wǎng)絡(luò)的研究現(xiàn)狀與實現(xiàn)途徑,之后引入了生物神經(jīng)元的特征,闡述了以往關(guān)于人類神經(jīng)元建立的數(shù)學(xué)模型。之后本文提出了一種陣列化硅納米晶體神經(jīng)突觸器件的制備方法與過程,并且在基于這樣的器件上,得到相應(yīng)的LTP與STDP數(shù)據(jù),將這些數(shù)據(jù)分別用于探究:神經(jīng)元激活函數(shù)數(shù)值模擬,有監(jiān)督脈沖神經(jīng)網(wǎng)絡(luò)之tempotron算法數(shù)值模擬與STDP無監(jiān)督學(xué)習(xí)網(wǎng)絡(luò)數(shù)值模擬,在得到結(jié)果的基礎(chǔ)上,提出了硬件化神經(jīng)網(wǎng)絡(luò)所需要的器件的基本性質(zhì)與要求。為未來的硬件化目標提出了可行性與基本方向。

關(guān)鍵詞:硬件神經(jīng)網(wǎng)絡(luò);神經(jīng)元;神經(jīng)突觸器件;激活函數(shù);Tempotron算法;STDP;無監(jiān)督學(xué)習(xí)

Abstract

With the advent of the information age, human beings face great challenges in dealing with the task of big data and multiple information. The traditional von Neumann-style computer thought has its essential shortcomings in dealing with these problems, so the application of Hardware

neural networks have become very urgent. The discovery of memristors made it possible for the practical application of brain-like calculations. Starting from the rise of hardware neural networks, this thesis firstly expounds the research status and implementation of hardware neural networks, and then introduces the characteristics of biological neurons, and expounds the previous mathematical models of human neuron establishment. After that, an arrayed hybrid silicon nanocrystal based synaptic devices have been prepared. Nervous function behaviors, e.g. LTP and STDP, have been obtained based on this device. These data are then separately used to explore neuron activation function values Simulation, numerical simulation of tempotron algorithm with supervised pulse neural network and numerical simulation of STDP unsupervised learning network. Based on the results, the basic properties and requirements of the hardware required for hardware neural network are proposed. The feasibility and basic direction for future hardware goals are proposed.

Keywords: Hardware neuron network; neurons; Synaptic device; activation function; Tempotron algorithm; STDP; unsupervised learning;

目  次

第一部分  畢業(yè)論文(設(shè)計)

A DiSubmitted to Zhejiang University for

I

III

V

VII

IX

第一章 緒論

1.1.1 硬件神經(jīng)網(wǎng)絡(luò)的興起

1.1.2 硬件神經(jīng)網(wǎng)絡(luò)的實現(xiàn)

1.3.1 生物神經(jīng)元介紹

1.3.2 人工神經(jīng)元介紹

1.3.3 人工神經(jīng)網(wǎng)絡(luò)介紹

1.3.4 脈沖神經(jīng)網(wǎng)絡(luò)介紹

3.1.1 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)

3.1.2 神經(jīng)元硬件化結(jié)論

3.2.1 脈沖編碼

3.2.2 權(quán)值更新

3.2.3 數(shù)值模擬結(jié)果

3.2.4 LTP權(quán)值改變法

3.2.5 STDP權(quán)值改變法

3.2.6 結(jié)論

3.3.1 理論背景與基礎(chǔ)

3.3.2 網(wǎng)絡(luò)設(shè)計

3.3.3 模擬結(jié)果

作者簡歷

攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文與取得的其他研究成果

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

第一部分

 

畢業(yè)論文(設(shè)計)

第一章  緒論

11.1  硬件神經(jīng)網(wǎng)絡(luò)1.1.1  硬件神經(jīng)網(wǎng)絡(luò)的興起

21世紀進入信息時代后,計算機的普及率大大上升,計算機本身也在計算力與邏輯處理上遠遠超過了人腦,然而不足的是,在數(shù)據(jù)的存取與記憶上,仍然是采用馮-洛伊曼式的串行方法,且功耗很大,而人類大腦擁有10^11 個神經(jīng)元和10^15神經(jīng)突觸。這使得人類處理信息的方式是高效的并行方式,并且功耗很低。例如人類大腦看到一種東西,識別它的過程往往使視覺神經(jīng)信號與記憶信號同時作用的結(jié)果,功耗在fj量級。在使得馮-洛伊曼式計算機處理復(fù)雜指令與控制上體現(xiàn)出了根本性的缺陷?;谶@一點,神經(jīng)網(wǎng)絡(luò)的研究開始興起,在1943年,McCulloch 和 Pitts 提出了神經(jīng)元的形式化模型后, 有關(guān)于神經(jīng)網(wǎng)絡(luò)的討論也逐漸火熱起來,但其發(fā)展的中途受到很多科學(xué)家對其的質(zhì)疑[19]。直到 1980年左右, Rumelhert 與他的研究伙伴[20]一起發(fā)表了著名的并行分布式處理( Parallel Distributed Processing)方法的工作 , 并且建立了 BP 算法和前向神經(jīng)網(wǎng)絡(luò),從數(shù)學(xué)上的形式,證明了這種算法的可行性,BP神經(jīng)網(wǎng)絡(luò)是一種前饋式的誤差逆向傳播網(wǎng)絡(luò),通過訓(xùn)練集不斷縮小輸出值與目標值的差值從而達到非線性優(yōu)化的目的。由此,神經(jīng)網(wǎng)絡(luò)的數(shù)學(xué)原理得到證明,其實在1970年神經(jīng)網(wǎng)絡(luò)存在一段低落期,也受到了很多懷疑。但是BP神經(jīng)網(wǎng)絡(luò)的興起與提出,讓科學(xué)們對于神經(jīng)網(wǎng)絡(luò)的態(tài)度再次火熱起來。21世紀隨著深度學(xué)習(xí)的提出,又掀起了一股關(guān)于人工智能的熱潮,Deep learning 是在多層感知機的基礎(chǔ)上,不斷增加隱含層的層數(shù),這上面又出現(xiàn)了一些數(shù)學(xué)上的問題比如激活函數(shù)的梯度彌散問題,但是由于Relu激活函數(shù)替代sigmod函數(shù)的提出,這些問題逐步得到了解決,深度學(xué)習(xí)向前發(fā)展了一大步。比如IBM的“深藍”擊敗世界圍棋選手李智石等,但是實際上,“深藍”在擊敗李智石時消耗的電量等于一桶油的燃燒的焦耳值,但是李智石僅僅使用了兩個饅頭的熱量戰(zhàn)斗。也就是說,這場比賽其實并不公平。其實這反應(yīng)的是人工智能的工作效率與真正人腦的學(xué)習(xí)效率仍然有很大的差距。神經(jīng)網(wǎng)絡(luò)本質(zhì)是由多個簡單的信號處理單元組成,這些簡單的信號單元之間由一種方式連接形成網(wǎng)絡(luò),它意在模仿人類大腦處理信息的模式,從而實現(xiàn)圖像識別,音像識別,特征提取和記憶等功能。現(xiàn)在計算機能夠從軟件上對神經(jīng)網(wǎng)絡(luò)進行實現(xiàn),然而關(guān)于數(shù)據(jù)的存取方式仍然無法得到突破,數(shù)據(jù)的存取方式仍然是老式馮-諾依曼式的串行處理方式。但是人類識別圖像,獲得信息是并行的。因此硬件神經(jīng)網(wǎng)絡(luò)的開發(fā)是必要的,硬件神經(jīng)網(wǎng)絡(luò)能夠使用集成電路實現(xiàn)并行處理信息,并且能耗低,效率高,能夠更貼近人類大腦的工作方式。因此硬件神經(jīng)網(wǎng)絡(luò)的開發(fā)受到很多的關(guān)注與研究,未來人工智能和類腦計算的發(fā)展前景中,硬件神經(jīng)網(wǎng)絡(luò)的研究是必須的。

[ANNOTATION:

BY 'wenhuang'

ON '2019-05-23T09:23:00'w

NOTE: '這部分放到前言部分比較好,或者干脆就不要了,放在這里是不合適的。']本文的第一章即緒論,主要是闡述當(dāng)前關(guān)于硬件化神經(jīng)網(wǎng)絡(luò)的突破,現(xiàn)狀與發(fā)展形勢。

第二章主要從人類的神經(jīng)元開始,講述人類生物神經(jīng)元的特點,講述現(xiàn)在人工神經(jīng)元的數(shù)學(xué)模型,以及硬件化神經(jīng)元需要的要求與方式

第三章主要講述制備實驗器件的技術(shù)路線,與制備的過程和使用的材料

第四章從數(shù)值模擬的角度,探究神經(jīng)元硬件化的條件是怎么樣的,數(shù)值模擬選取MNIST數(shù)據(jù)集作為樣本數(shù)據(jù)集,通過使用實驗得到的激活函數(shù)替論激活函數(shù),觀察網(wǎng)絡(luò)的準確率,得出相關(guān)結(jié)論,探究硬件需要滿足的條件

第五章從數(shù)值模擬的角度,探究突觸硬件需要滿足的條件,突觸與神經(jīng)元不同,它是作為神經(jīng)網(wǎng)絡(luò)中存儲權(quán)值,改變權(quán)值的存在,與神經(jīng)元有本質(zhì)上的區(qū)別,數(shù)值模擬采用26個英文字母的圖片作為數(shù)據(jù)集,進行編碼后發(fā)送脈沖,使用Tempotron 的有監(jiān)督脈沖神經(jīng)網(wǎng)絡(luò)進行數(shù)值模擬,通過實驗硬件得到的LTP與LTD圖像進行權(quán)值更新。得到預(yù)測率的圖像,證明了LTP的電或者光電器件能夠作為脈沖神經(jīng)網(wǎng)絡(luò)硬件化的一個器件,為未來做出相關(guān)硬件網(wǎng)絡(luò)道出了一種可行性。

第六章主要是針對STDP的學(xué)習(xí)機制擴大網(wǎng)絡(luò)規(guī)模,將數(shù)據(jù)集擴展到MNIST手寫數(shù)據(jù)集,使用STDP無監(jiān)督學(xué)習(xí)網(wǎng)絡(luò)[16]對數(shù)據(jù)進行訓(xùn)練,之后再對訓(xùn)練好的神經(jīng)元進行分類。得到我們想要的結(jié)果。

第七章主要是總結(jié)本文的工作得到的結(jié)論,以及對于未來硬件神經(jīng)網(wǎng)絡(luò)的發(fā)展的一些展望與看法

 

 

1.1.2  硬件神經(jīng)網(wǎng)絡(luò)的實現(xiàn)

一般硬件神經(jīng)網(wǎng)絡(luò)的實現(xiàn)方式有三種,即采用電子學(xué)方法——依靠微電子技術(shù)實現(xiàn)人工神經(jīng)網(wǎng)絡(luò), 采用光電方法——依靠半導(dǎo)體光電集成技術(shù)實現(xiàn)人工神經(jīng)網(wǎng)絡(luò), 采用光學(xué)方法實現(xiàn)人工神經(jīng)網(wǎng)絡(luò)[18]。微電子技術(shù)應(yīng)該是通過各種電路設(shè)計,例如放大電路,差分電路等集成電路,實現(xiàn)神經(jīng)網(wǎng)絡(luò)的reference部分。依靠光電實現(xiàn)的硬件神經(jīng)網(wǎng)絡(luò)是本文的重點,利用電學(xué)元器件,憶阻器器件,或者是光電器件,模擬生物神經(jīng)元的膜電位變化曲線,與人類大腦的權(quán)重學(xué)習(xí)規(guī)則,從而實現(xiàn)神經(jīng)網(wǎng)絡(luò)的硬件化。采用光學(xué)的方法實現(xiàn)網(wǎng)絡(luò)計算的方法十分有趣,UCLA大學(xué)的研究小組發(fā)明了一種全光的深層神經(jīng)網(wǎng)絡(luò),通過光的反射與折射傳遞信號,利用光入射的相位差記錄權(quán)值變化,實現(xiàn)了全光的神經(jīng)網(wǎng)絡(luò),而且由于光的傳播速度是光速,在整個網(wǎng)絡(luò)的效率與速度上都十分驚人,能耗也十分低[21]。神經(jīng)網(wǎng)絡(luò)的電子學(xué)硬件實現(xiàn)方法主要有四種,其中分別是數(shù)字實現(xiàn)、模擬實現(xiàn)、混合數(shù)/模實現(xiàn)和脈沖技術(shù)實現(xiàn)等[18]。通過數(shù)字實現(xiàn)的神經(jīng)網(wǎng)絡(luò)一般精度很高[1,2],權(quán)值易存儲也容易改變,并且能夠通過電路實現(xiàn)并行處理,克服傳統(tǒng)計算機串行處理數(shù)據(jù)的弊病,但是缺點是電路難以集成,體積很大,很難適用于計算機新型芯片這種地方。通過模擬實現(xiàn)的神經(jīng)網(wǎng)絡(luò)能夠很好克服上面的缺點[3,4,5],但是由于突觸和神經(jīng)元器件對參數(shù)敏感,準確度下降,更關(guān)鍵是對于權(quán)值的存儲存在困難。1987年是一個轉(zhuǎn)機,即脈沖技術(shù)第一次用于了神經(jīng)網(wǎng)絡(luò),使用VLSI技術(shù)作為實現(xiàn),從這以后,神經(jīng)網(wǎng)絡(luò)的脈沖技術(shù)受到了很多關(guān)注[9,12]。

脈沖技術(shù),簡單來說就是將神經(jīng)元的興奮或者抑制狀態(tài)通過一定的編碼方式轉(zhuǎn)化到脈沖的波形上,編碼的方法一般有高斯編碼,或者可以自定義的編碼方式。由于脈沖化的信號是離散的,因此一定程度上可以簡化運算電路:例如突觸電路。神經(jīng)元與一般的電路元件不同,它本身的密度很高,正如人類神經(jīng)元的密度很高一樣。這種緊密的排列方式使得脈沖信號把芯片和外圍設(shè)備的接口變得更容易連接。本文正是利用從脈沖神經(jīng)網(wǎng)絡(luò)出發(fā),制備出硬件化的元件,通過數(shù)值模擬硬件的實際可行性,并且對于未來硬件化神經(jīng)網(wǎng)絡(luò)的方向提出一些看法

21.2  硬件神經(jīng)網(wǎng)絡(luò)研究進展當(dāng)前的人工神經(jīng)網(wǎng)絡(luò)存在三種模式,第一種是非學(xué)習(xí)型神經(jīng)網(wǎng)絡(luò),即網(wǎng)絡(luò)的前饋過程與權(quán)值計算過程全部由軟件進行實現(xiàn),權(quán)值是固定不變的,只用神經(jīng)網(wǎng)絡(luò)的電路結(jié)構(gòu)完成之后,再與實際電路結(jié)構(gòu)匹配即可。另外一種是on-chip的模式,即前饋過程通過微電子電路進行實現(xiàn),權(quán)值的更新與計算通過計算機實現(xiàn)。還有一種off-chip模式,即是一種全自動的自主性芯片,從神經(jīng)網(wǎng)絡(luò)的前饋環(huán)節(jié)到神經(jīng)網(wǎng)絡(luò)的BP算法實現(xiàn)都一并完成。目前的研究狀況,我們已經(jīng)能夠熟練通過電路的設(shè)計實現(xiàn)非學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)。在on-chip式的人工神經(jīng)網(wǎng)絡(luò)上,我們也能通過一定的模擬方式得到實現(xiàn)?,F(xiàn)在的當(dāng)務(wù)之急是開發(fā)off-chip式的神經(jīng)網(wǎng)絡(luò),使用硬件對權(quán)值的存儲與改進是必要的。自從20世紀60年代后期引入憶阻器概念以來,由于其簡單性和功能相似性,它們被認為是模擬突觸裝置的最有希望的候選者。2008年,惠普公司公布了基于TiO2的RRAM器件[6],開拓了RRAM和憶阻器之間聯(lián)系,做出了一定的應(yīng)用之后以非易失性存儲器件和神經(jīng)突觸晶體管為代表開始成為神經(jīng)突觸器件的基礎(chǔ)。但將這些器件用于第二代神經(jīng)網(wǎng)絡(luò)(也就是多層感知機)上,取得了一定的成就,現(xiàn)在關(guān)于這方法的也在如火如荼的進行著,但是由于第二代神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)仍然是基于計算機的算力達到的深度,也就是說,加深隱含層的數(shù)目提高準確度,知識因為有著強大的計算芯片作為支持。我們需要考慮一種完全類似于人腦思考問題的神經(jīng)網(wǎng)絡(luò)與算法,于是脈沖神經(jīng)網(wǎng)絡(luò)開始興起,并且被譽為第三代神經(jīng)網(wǎng)絡(luò),這是一種完全基于人腦計算模式的神經(jīng)網(wǎng)絡(luò),從長程記憶可塑性LTP,時間可塑依賴性STDP等研究的深入,這一網(wǎng)絡(luò)的硬件化也成為了可能

31.3  從生物神經(jīng)元到人工神經(jīng)網(wǎng)絡(luò)1.3.1 生物神經(jīng)元介紹

人的大腦中有超過 1011個神經(jīng)元,這些神經(jīng)元之間的連接的突觸又大約有10^15個,這些突觸使得神經(jīng)元互相連接,從而構(gòu)成了復(fù)雜多變而又有條不紊的神經(jīng)網(wǎng)絡(luò)[7]。這些神經(jīng)元的單獨處理信息的速度并不算很快,但是人類的大腦能夠很有效的利用這些神經(jīng)元并行處理。即大量神經(jīng)元一起處理一個任務(wù),這有些類似于計算機里的多線程并行操作算法。人類大腦的神經(jīng)元數(shù)目雖然龐大,但是它的能耗低卻是特點,我們每日攝入的熱量與一些機器的能源是不能夠比擬的,然而我們的大腦就能夠?qū)崿F(xiàn)很多計算功能,有數(shù)據(jù)顯示,腦神經(jīng)系統(tǒng)一個動作每秒消耗的能量比最優(yōu)秀的處理器能耗小1010個數(shù)量級。

人的生物神經(jīng)元有兩個部分,分別是細胞體和突起。具有處理并且整合輸入的神經(jīng)信號,然后傳出這些信息的作用。突起有樹突和軸突兩種。樹突相對較短但分枝很多,其作用是接受其他神經(jīng)元軸突傳來的沖動并傳給細胞體。軸突長而分枝少,常常出現(xiàn)在軸丘,一般為粗細均勻的細長突起,其作用是接受外來刺激,再由細胞體傳出。神經(jīng)元與神經(jīng)元之間的連接被稱為神經(jīng)突觸,兩個神經(jīng)元之間連接強度或者關(guān)聯(lián)程度體現(xiàn)在突觸的連接強度。一般而言神經(jīng)元有以下的特點[8]:

1):可塑性:即神經(jīng)元之間的突觸可以連接,也可以取消,連接可以變強,也可以慢慢變?nèi)?,方便與人類去適應(yīng)不同的環(huán)境。

2):興奮與抑制:神經(jīng)元受到外界刺激之后,會產(chǎn)生膜內(nèi)外滲透壓的差別從而導(dǎo)致Na+或者Ca2+的流入或者流出,這些離子的遷移會產(chǎn)生動作電位,導(dǎo)致膜電位的上升或者下降,也就對應(yīng)了人類神經(jīng)元的興奮和抑制過程。

3):學(xué)習(xí)與遺忘:由于可塑性的存在,當(dāng)人類在長時間受到同一種刺激的時候,會產(chǎn)生我們的所說的學(xué)習(xí)功能,而這種功能其實是神經(jīng)元之間的連接得到了加強,同理,如果我們慢慢遺忘了一些東西,是因為長期不去使用從而神經(jīng)元之間的連接衰弱了。對應(yīng)的有LTP,LTD圖像來進行表征。

4):突觸的延時和不應(yīng)期。神經(jīng)沖動的傳遞在突觸中是需要時間的,一般這個時間是1-150ms。另外,神經(jīng)元也不會在短時間內(nèi)接受兩次沖動,一般需要間隔一定的時間,這個被稱為不應(yīng)期。

從上面可以看到,想要用神經(jīng)元器件模擬人類的生物的神經(jīng)元,一定要從生物本質(zhì)和特征去進行模擬。本文后面的數(shù)值模擬會再把這些特征一一強調(diào)一次,從而達到一種仿真的目的。

1.3.2 人工神經(jīng)元介紹

早在1943 年 McCulloch 和 Pitts 提出了神經(jīng)元的形式化模型, 神經(jīng)元可用簡單的zha值函數(shù)表示,并完成邏輯函數(shù)功能[19]。20世紀初期,美國心理學(xué)家Willian Jame 提出,一個神經(jīng)元應(yīng)該是同時接受來自不同神經(jīng)元的信號后,由于不同神經(jīng)元之間的突觸連接強度不同,神經(jīng)元相當(dāng)于是一個加權(quán)和,并且由于興奮存在一個閾值電壓,需要一定的電壓值才會fire,因此神經(jīng)元可以用一個數(shù)學(xué)模型來勾畫,即著名的MP模型。

y=f(∑i=1nwixi+b)

                        (2-1)

 

其中,表征每個神經(jīng)元的輸入值,表征神經(jīng)元之間的連接強度,b代表閾值電壓。外界的f函數(shù)則是一種神經(jīng)元的處理函數(shù)。

 

圖1-1 MP 神經(jīng)元模型

Fig.1.1 Neurons model

可以看到,對于神經(jīng)元的硬件實現(xiàn)實際上是一個乘法器的實現(xiàn)以及加權(quán)和非線性處理,這個可以通過放大電路等進行實現(xiàn)。后續(xù)本文也將探究一下神經(jīng)元應(yīng)該具備怎樣的條件,或者怎么樣的器件適合作為神經(jīng)元器件。

1.3.3 人工神經(jīng)網(wǎng)絡(luò)介紹20世界80年代,J.Hopfield 提出了 Hopfiel 神經(jīng)網(wǎng)絡(luò), 引起了神經(jīng)網(wǎng)絡(luò)理論在優(yōu)化學(xué)術(shù)界的轟動。然而熱潮還遠遠沒有結(jié)束。1986年,Rumelhart和McCelland提出了BP神經(jīng)網(wǎng)絡(luò),這種神經(jīng)網(wǎng)絡(luò)是現(xiàn)在很多網(wǎng)絡(luò)算法的基礎(chǔ),它是一種依靠逆向傳播輸出值與實際值誤差修正網(wǎng)絡(luò)權(quán)值的網(wǎng)絡(luò),利用梯度下降算法或者隨機梯度下降法降低目標值與實際值的誤差,隨機梯度下降算法時為了加速算法收斂速度提出的更好的方式,現(xiàn)在很多網(wǎng)絡(luò)也應(yīng)用這種方法

 

圖 1-2 經(jīng)典的神經(jīng)BP神經(jīng)網(wǎng)絡(luò)模型

從圖中我們可以看到的是,網(wǎng)絡(luò)一般由輸入層,隱含層和輸出層三個部分構(gòu)成,其中輸入層可以是圖像的像素值,音頻信號等等,因此神經(jīng)網(wǎng)絡(luò)現(xiàn)在廣泛用于人臉識別,圖像識別,聲音識別等等領(lǐng)域。隱含層的多少是決定一個網(wǎng)絡(luò)是否是深層網(wǎng)絡(luò)的基本要素,隱含層如果越多,那么挖掘的信息,提取的特征就越難以用表面語言描述,訓(xùn)練的精度也會逐步的提升。輸出層是網(wǎng)絡(luò)的輸出,網(wǎng)絡(luò)的輸出后往往會選擇一個損失函數(shù),這個損失函數(shù)是用于衡量目標值與實際值的差值從而進行誤差反向傳播計算。常見的損失函數(shù)有MSE函數(shù),Cross-Entorpy函數(shù)等等。

 

圖1-3 硬件神經(jīng)網(wǎng)絡(luò)的一種實現(xiàn)[15]

基于經(jīng)典的BP神經(jīng)網(wǎng)絡(luò)MLP的硬件實現(xiàn)如上圖所示,使用電路模擬整個網(wǎng)絡(luò)的結(jié)構(gòu),在電路橫向與縱向的cross_bar 的地方放置突觸裝置,利用電流與電壓的比值進行權(quán)值的存儲與更新。這樣的網(wǎng)絡(luò)往往需要得到的I-V曲線是對稱的,就是說,權(quán)值的變化需要是隨著強度的增加而增加,減少而減少,呈現(xiàn)一種線性的變化,從而保證在進行BP算法時,誤差能夠不斷減小。

1.3.4 脈沖神經(jīng)網(wǎng)絡(luò)介紹隨著在21世紀早期計算能力的顯現(xiàn),DNN(多層感知器,深層信念網(wǎng)絡(luò),傳統(tǒng)神經(jīng)網(wǎng)絡(luò)等等)迅速發(fā)展,DNN的基本特征是有很多隱含層,這些神經(jīng)網(wǎng)絡(luò)能夠?qū)崿F(xiàn)監(jiān)督與非監(jiān)督學(xué)習(xí),并且能夠優(yōu)秀的完成有大量數(shù)據(jù)的任務(wù)。然而實際上,現(xiàn)在的DNN的優(yōu)秀來源于GPU的并行加速機制,是在計算機多核算力上的體現(xiàn),在其本身的算法上,其效率遠遠不如人腦高。SNN(脈沖神經(jīng)網(wǎng)絡(luò))最近引起了很多關(guān)注,因為它們與生物系統(tǒng)非常相似,在SNN中,輸入信號是尖峰,而不是傳統(tǒng)神經(jīng)元中的恒定饋送。 人們普遍認為能夠處理尖峰是大腦在序列識別和記憶方面如此壯觀的主要原因之一[9]。序列識別是計算中更重要的主題之一,因為它直接影響系統(tǒng)處理強烈時序依賴的刺激的能力,例如語音識別和圖像檢測[10]

 

圖1-4  STDP圖像

對應(yīng)STDP的最簡單理解是,如果前突觸神經(jīng)元的信號在后突觸神經(jīng)元的信號之前達到,有理由認為前突觸的信號導(dǎo)致后突觸神經(jīng)元的信號產(chǎn)生,那么這兩者之間的突觸連接強度應(yīng)該增加,反之就該減少。但如何保證這種訓(xùn)練模式一定是有效的呢?Bengio 和 Fischer 兩人在2015發(fā)表的文章[11]指出具有對稱反饋權(quán)重的網(wǎng)絡(luò)將具有以下特性:“輸出單元”的小擾動將向更好的預(yù)測傳播到內(nèi)部層,使得隱藏單元移動到大致遵循預(yù)測誤差J相對于隱藏單元的梯度。而STDP規(guī)則大致對應(yīng)于預(yù)測誤差的梯度下降,即STDP的規(guī)則其實和SGD算法有著異曲同工之妙。Scellier和Bengio(2016)報告的實驗已經(jīng)真實地表明這些近似值可以工作并且能夠訓(xùn)練有監(jiān)督的多層神經(jīng)網(wǎng)絡(luò)[12]。

脈沖神經(jīng)網(wǎng)絡(luò)被稱為新一代神經(jīng)網(wǎng)絡(luò),與經(jīng)典的神經(jīng)網(wǎng)絡(luò)不同在于它的輸入實際上不是一個連續(xù)值而是一系列脈沖,更為重要的是他的神經(jīng)元膜電位,一旦達到了膜電位的峰值,那么這個神經(jīng)元就被激活,后面的脈沖會進入一段不應(yīng)期。關(guān)于神經(jīng)元的模型,已經(jīng)提出了HH模型,Izhikevich模型與LIF模型,其中以LIF模型為例,其微分方程的表示如下:

τdVdt=?(V?Vr)+RI

                      (2-2)

 

τ

是膜的時間常數(shù),R為膜電阻,V是膜電位,Vr是復(fù)位電位,I是注入電流,當(dāng)膜電壓超過一個閾值時,神經(jīng)元會發(fā)送一個脈沖。如果后面沒有連續(xù)的刺激,這個產(chǎn)生的脈沖信號會不斷衰退,膜電位也會恢復(fù)到復(fù)位電位后穩(wěn)定。之后再接受電流再刺激。

 

針對脈沖神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過程,也分為有監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí),無監(jiān)督學(xué)習(xí)主要以STDP為主[13,14],有監(jiān)督學(xué)習(xí)包括Tempotron算法,ReSuMe算法和SpikeProp算法等等。本文主要采用Tempotron算法,下面做個詳細的介紹:

在Tempotron算法中,考慮在閾值下,突觸前神經(jīng)元產(chǎn)生的脈沖信號,對突觸后膜電位(PSPs)的貢獻是來自所有脈沖輸入的加權(quán)和:

V(t)=∑iωi∑tiK(t?ti)+Vrest

                  (2-3)

 

ti

表示第i個神經(jīng)元的脈沖發(fā)送時間,

K(t?ti)

表示第i個脈沖對于膜電位的貢獻,即突觸前神經(jīng)元發(fā)出的脈沖對于突觸后神經(jīng)元膜電位的影響。其標準形式如下:

 

K(t?ti)=V0(exp[?(t?ti)/τ]?exp[?(t?ti)/τs])

          (2-4)

 

τ,τs

是時間常數(shù),為了保證K(t)在(0,1)之內(nèi)變動,我們需要用V_0進行歸一化處理,K(t)圖像繪制如下圖:

 

 

圖1-5 K(t)隨時間變化圖

由監(jiān)督學(xué)習(xí)的重點是要將權(quán)重更新向著誤差減少的方向進行,獲得期望的輸出脈沖,更新規(guī)則如下:

Δωi=λ∑ti?tmaxK(tmax?ti)

                     (2-5)

 

即以二分類為例,ti

為突觸前神經(jīng)元峰值的產(chǎn)生時間,這里的

tmax

設(shè)定為我們設(shè)置的時間序列的終點,默認為突觸后神經(jīng)元的峰值的產(chǎn)生時間,但這和一般的STDP不一樣,因為STDP的神經(jīng)網(wǎng)絡(luò)訓(xùn)練規(guī)則實際是不需要有監(jiān)督的,而這里有一個參數(shù)

λ

,用于控制輸出值與期望值的誤差方向,如果突觸前神經(jīng)元產(chǎn)生峰值超過閾值電壓的神經(jīng)脈沖,并且突觸后神經(jīng)元指向分類標準與前神經(jīng)元指向的分類相同,則不需要修改權(quán)值(說明這個連接正確),如果突觸前神經(jīng)元峰值未超過閾值電壓,那么需要根據(jù)上式指定

λ

>0,并且計算需要增加的權(quán)值。反之當(dāng)

λ

<0時,需要進行減小權(quán)值。總體看來,這是在借助有監(jiān)督學(xué)習(xí)的條件下,在明白誤差修正方向下利用STDP中的LTP與LTD曲線獲得修正的幅度(可以認為是學(xué)習(xí)的速率),從而使我們獲得期望的輸出。注意上面提出一種概念:即在有監(jiān)督學(xué)習(xí)的條件下,后突出神經(jīng)元的峰值由標簽值決定,并且根據(jù)誤差值指明誤差修正放向(體現(xiàn)為

λ

的正負性),然后依靠STDP決定修正幅度。這也是一種將STDP曲線用于有監(jiān)督學(xué)習(xí)的可行性展示。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

第二章  實驗部分12.1  陣列化基于硅納米晶體雜化結(jié)構(gòu)的神經(jīng)突觸器件制備2.1.1  制備技術(shù)路線在本論文里面,采用了冷等離子方法制備了摻B的Si量子點,相比于其他的摻雜方法,冷等離子法是借助了動力學(xué)的原理,從而實現(xiàn)了對硅納米晶體的高效摻雜,一定程度上避免了利用熱力學(xué)原理來摻雜的過程中出現(xiàn)的“自潔凈”現(xiàn)象。相比之下能夠?qū)崿F(xiàn)比較高濃度的摻雜。

 

圖2.1 使用冷等離子法制備摻雜硅納米晶體示意圖

使用冷等離子體法制備摻雜硅納米晶體的裝置設(shè)計示意如圖2.1所示。先準備每分鐘流量值12標準公升的硅烷氬氣混合氣(20% SiH4)、157 sccm的硼烷氬氣混合氣(其中含有0.5% B2H6)和105 sccm的高純氬氣通入到石英管中混合,調(diào)節(jié)系統(tǒng)尾部的真空泵,使腔體內(nèi)的氣壓穩(wěn)定在6 mbar。石英管中間部位套有兩個銅環(huán),分別接匹配箱和射頻發(fā)生器的正負兩級。在射頻發(fā)生器(功率約為150 w)的激發(fā)下,銅環(huán)之間的石英管內(nèi)將產(chǎn)生等離子體,混合氣體在通過等離子體區(qū)域時將會發(fā)生分解反應(yīng),這個反應(yīng)的產(chǎn)生是因為氣體受到了高能粒子和電子的轟擊產(chǎn)生的,具體化學(xué)反應(yīng)式如下:

SiH4?Si+H2B2H6?2B+3H2

 

在器件制備方面,本文利用硅納米顆粒的光電性能與以及表面缺陷對載流子具有俘獲的性質(zhì),首先與鈣鈦礦進行雜化形成混合容易。通過旋涂工藝制備成了太陽能電池結(jié)構(gòu)的神經(jīng)器件,器件的結(jié)構(gòu)是:Ito/pcbm/鈣鈦礦與硅量子點雜化層/spiro/Au。在該結(jié)構(gòu)里面,ITO是通過光學(xué)刻蝕得到。PCBM, 鈣鈦礦與硅量子點雜化層, Spiro是通過旋涂方法得到。其中鈣鈦礦CH3PbI3與硅量子在DMF溶液(461mg PbI2, 159mg MAI,  71uL DMSO, 630 ul DMF.。Si量子點在溶液里面的濃度為10mg/ml.雜化旋涂后就制備出了膜。)里面。硅量子點摻雜B,摻雜B的硅納米晶體尺寸是6nm, 鈣鈦礦膜厚大概在300nm左右,晶粒尺寸大概在200nm。Au電極采用熱蒸發(fā)工藝得到,厚度大約為100nm。

[ANNOTATION:

BY 'wenhuang'

ON '2019-05-23T10:15:00'w

NOTE: '這一段是不是應(yīng)該要刪掉?']2.1.1  器件制備路線

在器件制備方面,本文準備利用硅納米顆粒的光電性能與decay長的性質(zhì),與鈣鈦礦進行雜化形成自驅(qū)動電池,在制備電池的工藝上,選擇旋涂工藝做成太陽能電池的結(jié)構(gòu),器件結(jié)構(gòu)分別是:Ito/pcbm/鈣鈦礦與硅量子點雜化層/spiro/Au,之后使用熱蒸發(fā)工藝將電極Au安裝上,設(shè)置厚度大約為100nm。鈣鈦礦CH3PbI3與硅量子在DMF溶液(461mg PbI2, 159mg MAI,  71uL DMSO, 630 ul DMF. Si以DMF為溶劑,濃度為10mg/ml. 雜化旋涂后就制備出了膜。)里面。硅量子點摻雜B,摻雜B的硅納米晶體尺寸是6nm, 鈣鈦礦膜厚大概在300nm左右,晶粒尺寸大概在200多納米。段落內(nèi)容。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 第三章  數(shù)值模擬13.1 神經(jīng)元硬件化數(shù)值模擬3.1.1  神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)對于神經(jīng)元的模擬,和突觸的模擬不同,神經(jīng)元的功能由上文中的MP模型已經(jīng)表述很清楚,他承擔(dān)一個乘法器和加權(quán)和、還有實現(xiàn)一個神經(jīng)元函數(shù)的功能,這個功能也是我們下面模擬要探索的。

 

圖3-1 MINST數(shù)據(jù)集對于的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)

采用常用的MNIST手寫識別數(shù)據(jù)集作為整個網(wǎng)絡(luò)的輸入,先將圖像的RGB值轉(zhuǎn)換成一個單位的灰度值,設(shè)計輸入層應(yīng)該有784個節(jié)點,隱含層300個節(jié)點,輸出層設(shè)置10個節(jié)點,分別對應(yīng)0-9個數(shù)字的pattern。在實際模擬時,采用兩種方式處理,第一種是利用STDP非線性函數(shù)直接對輸入的圖像像素值進行處理,意在將灰度值轉(zhuǎn)換為強度值。再用網(wǎng)絡(luò)進行訓(xùn)練。第二張利用STDP非線性函數(shù)作為神經(jīng)網(wǎng)絡(luò)中的激活函數(shù),意在探究神經(jīng)元的基本性質(zhì)。

訓(xùn)練模式采用SGD算法,樣本集總共55000個圖片,每張圖片28×28有784個輸入值,epoch設(shè)置掃描樣本集10次以上,損失函數(shù)使用交叉熵函數(shù),激活函數(shù)選擇softmax函數(shù)進行激活分類,因為這個函數(shù)比較適合于多分類問題,在優(yōu)化上也得到了理論的證明。首先我們先將實驗中得到的STDP數(shù)據(jù)擬合結(jié)果如下:

 

圖3-2 STDP Positive 擬合圖像

這里故意選擇了一個與常規(guī)激活函數(shù)相關(guān)性為負的激活函數(shù),一般的激活函數(shù)比如sigmod,relu激活函數(shù),其強度其實和輸入值是呈

[ANNOTATION:

BY 'wenhuang'

ON '2019-05-23T10:23:00'w

NOTE: '什么意思']現(xiàn)正相關(guān)的,這里選取的作為負相關(guān)的原因是想探究是否能夠作為激活函數(shù)使用。其結(jié)果如下:

 

圖 3-3 擬合的Loss與Accuracy隨訓(xùn)練次數(shù)的變化圖

可以看到上述的結(jié)果是可觀的,也就是說,激活函數(shù)的選取,與是否與輸入值正相關(guān)沒有關(guān)系。另外我比較了理論激活函數(shù),實驗激活函數(shù),與對輸入直接非線性處理得到結(jié)果的異同性:

 

圖3-4 三種不同方法得到Loss函數(shù)變化情況

 

圖3-5 三種方法得到的Accuracy變化情況

可以看到,理論激活函數(shù)(紅色)在準確率上仍然時最高的,最后的樣本內(nèi)準確率有98.42%,但在loss的下降速度上,實驗激活函數(shù)體現(xiàn)的更好,但實驗的激活函數(shù)最后準確率只有96.69%。

3.1.2  神經(jīng)元硬件化結(jié)論根據(jù)上面的模擬結(jié)果我們可以得到結(jié)論,對于神經(jīng)元的硬件模擬,作為激活函數(shù),只需完成非線性這個條件即可,但是在實現(xiàn)乘法器的過程中,需要電路由很好的線性度。這個線性度的要求實際是從BP算法的推導(dǎo)中獲得的,這里簡單的推導(dǎo)一下:

Δw=?Loss?w=?Loss?y??y?output??output?w

              (3-1)

 

上式想說明的是,我們需要調(diào)節(jié)權(quán)值w使得我們計算出的loss函數(shù)達到最小值,因此我們需要求其導(dǎo)數(shù)從而獲得調(diào)整的方向,可以看到等式右邊第一項實際是損失函數(shù)對于輸入值的導(dǎo)數(shù),第二項時激活函數(shù)對于輸入值的導(dǎo)數(shù),這兩項在有輸入值的條件下是可以求出的。而根據(jù)神經(jīng)網(wǎng)絡(luò)的矩陣運算:

output=w?x+b

                       (3-2)

 

可以看到,output值與輸入的值時存在線性關(guān)系的,那么也就是說,我們權(quán)值變化量Δw

與輸入的x需要滿足線性關(guān)系。因此神經(jīng)元硬件化需要實現(xiàn)的線性度不僅僅影響了加權(quán)的效果,還影響到權(quán)值更新的效率性。很多關(guān)于神經(jīng)網(wǎng)絡(luò)硬件化的論文一定會提到這個線性度,因為這個線性度時實現(xiàn)神經(jīng)網(wǎng)絡(luò)算法達到收斂的基本保障。

 

 

圖3-6.a SET與RESET模式下的I-V曲線;b SET模式下的權(quán)值變化隨刺激次數(shù)的變化;c RESET模式下的權(quán)值變化隨刺激次數(shù)的變化[15]

如上圖清華大學(xué)完成的憶阻器神經(jīng)突觸器件,選取電導(dǎo)作為權(quán)值時,需要I-V曲線在第一二想象有近似的對稱值,其導(dǎo)數(shù)值(即權(quán)值)隨著固定電壓的刺激次數(shù)線性增加或者減小。一般而言,在硬件神經(jīng)網(wǎng)絡(luò)進行權(quán)值跟新的時候,會選擇一個固定更新電壓,在這個指定的電壓下,我們需要保證權(quán)值的正向更新與負向更新有近似的值,這個在圖像上體現(xiàn)為圖像的對稱。之前也有文章在圖像的對稱性上做了相關(guān)的材料探究。證明這樣的對稱性是必要的

23.2 有監(jiān)督脈沖神經(jīng)網(wǎng)絡(luò)數(shù)值模擬3.2.1  脈沖編碼脈沖神經(jīng)網(wǎng)絡(luò)與第二代神經(jīng)網(wǎng)絡(luò)最為不同的一點在于,它的輸入并不是一系列連續(xù)的值,不是像圖像像素一樣一個個數(shù)據(jù)連續(xù)計入,也沒有二值化的操作。而是離散的脈沖值,就圖像識別而言,簡單的多層感知器輸入是輸入圖像的RGB值或者是圖像的灰度值,將這些值進行標準化后作為網(wǎng)絡(luò)的輸入。而脈沖神經(jīng)網(wǎng)絡(luò)需要對于輸入進行一定的脈沖編碼處理,這個處理可以自己選擇,但轉(zhuǎn)化的思想很重要。即將圖像的灰度值信息編程處理成一系列脈沖,并且將脈沖發(fā)出的時間作為網(wǎng)絡(luò)的輸入。下面介紹本文中tempotron算法的編碼方式。

選取26個英文字母A-Z作為需要識別的樣本集。每一個字母由一張16×16像素的圖像組成,且該圖像只有0和1兩種灰度,即非黑即白。因此我們輸入一張圖片后,它會編程一個16×16的二值矩陣,我們將這一的二維矩陣一維化,使其變成1×256的一維數(shù)組,然后我們對其進行編碼,每次隨機從256個數(shù)中隨機去8個數(shù)且不放回,組成一個32×8的新矩陣,對于每一行數(shù),得到的是一個8位的二進制數(shù),因此我們將其轉(zhuǎn)化成十進制數(shù),得到一個0-255范圍的數(shù),將原來的矩陣轉(zhuǎn)化成了32×1的矩陣。且每一行代表一個脈沖的發(fā)送時間,即將一張16×16的圖像矩陣轉(zhuǎn)化成了在不同時間一共發(fā)送32次脈沖的輸入值。

3.2.2  權(quán)值更新按照tempotron算法的權(quán)值更新規(guī)則:

Δωi=λ∑ti?tmaxK(tmax?ti)

                     (3-3)

 

我們需要設(shè)置一個時間軸,并且對于這個時間軸上進行時間窗口的劃分,等于說我們需要將這個時間軸切割成一份份來進行一個個的循環(huán)。由于之前在輸入編碼的時候,我們將16×16像素的黑白圖像轉(zhuǎn)換成了發(fā)送32次脈沖的輸入,這些輸入的脈沖的時間是0-255,也就是說,我們建立一個長度為256ms的時間軸,并且以1ms為一個時間窗口,每次檢查在當(dāng)前時間窗口前是否有脈沖輸入,并且每次都選取在當(dāng)前時間之前能夠發(fā)送脈沖的數(shù)據(jù),認為他們發(fā)送一次脈沖,將這個脈沖與核函數(shù)相乘,作為我們膜電壓,如果膜電壓超過了我們設(shè)置的threshold電壓值,我們則認為該神經(jīng)元處于fire狀態(tài),并且會進入一段不應(yīng)期,即shut down后面在256ms內(nèi)的所有脈沖輸入。我們輸入是5個神經(jīng)元,這是因為我們需要對26個英文字母分類,即用5個二進制數(shù)最大可以表示到0-31的每個數(shù),于是我們用5個二進制數(shù)表示我們分類的pattern,例如字母A我們使用00001表示,字母B用00010表示。以此類推。當(dāng)神經(jīng)處于fire狀態(tài)時,它會表現(xiàn)出1的狀態(tài),反之如果它沒有能夠達到閾值電壓,它會處于0的狀態(tài),我們將網(wǎng)絡(luò)的輸入與我們準備好的標簽值進行對比,如果說產(chǎn)生了不同,即分類產(chǎn)生了誤差,我們就需要對其進行權(quán)值更新,從而在慢慢的訓(xùn)練過程中,獲得我們期望得到的脈沖值。

即如果網(wǎng)絡(luò)發(fā)出了脈沖,但是實際沒有發(fā)送脈沖,我們降低該脈沖產(chǎn)生的權(quán)值,從而讓其在后面慢慢變得不發(fā)出脈沖。

如果網(wǎng)絡(luò)沒有發(fā)出脈沖,但是實際輸入應(yīng)該發(fā)出脈沖,我們應(yīng)該強化該脈沖的產(chǎn)生,即增大其權(quán)值。

 

圖3.7 訓(xùn)練前脈沖與訓(xùn)練后脈沖對比圖

我們設(shè)置1.0 v為閾值電壓,可以看到,隨著訓(xùn)練次數(shù)的增大,一開始正的脈沖傾向于在后面發(fā)出超過閾值電壓的脈沖。但是一開始負的脈沖,雖然一開始超過了閾值電壓,但是由于隨著訓(xùn)練次數(shù)的增大,變得不斷被抑制,不再發(fā)出脈沖。我們的網(wǎng)絡(luò)就是基于這樣一種思路去訓(xùn)練與優(yōu)化。

3.2.3  數(shù)值模擬結(jié)果數(shù)值模擬上,本文選取了兩組實驗數(shù)據(jù)進行了權(quán)值更新法則函數(shù)的模擬,即使用實驗得到的LTP與STDP數(shù)據(jù)進行了數(shù)值模擬,并且對比了兩者在應(yīng)用于tempotron算法的差異,提出一定看法。

3.2.4  LTP權(quán)值改變法數(shù)值LTP曲線是模擬人類大腦學(xué)習(xí)時候的長程可塑性,在圖像上體現(xiàn)為,施加一段固定脈沖間距和脈沖峰值的脈沖,使突觸器件的模擬膜電壓升高,經(jīng)過一段時間再進行了衰減。表現(xiàn)的圖像如下:

 

圖3.8 LTP擬合圖像

線是得到實驗的LTP數(shù)據(jù)后,使用神經(jīng)網(wǎng)絡(luò)算法進行擬合,得到完美擬合的曲線,這樣保證了能夠使用完全的實驗數(shù)據(jù)。另外由于實驗的數(shù)據(jù)僅僅有LTP數(shù)據(jù),然而對于我們的模擬也需要LTD數(shù)據(jù),基于我們對于這兩個圖像的了解,他們在一定程度上是中心對稱的。我們通過對于LTP數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)擬合,外推LTD的數(shù)據(jù),將LTD的數(shù)據(jù)應(yīng)用于模型的抑制環(huán)節(jié),保證權(quán)值的增加與減少對稱。

將LTP的數(shù)據(jù)帶入,進行訓(xùn)練,設(shè)置最大epoch數(shù)為100次,設(shè)置閾值電壓為1 v。訓(xùn)練結(jié)果如下:

 

圖 3.9 準確率隨訓(xùn)練次數(shù)的變化圖像(LTP)

可以看到,在100 epoch下,準確率在隨訓(xùn)練次數(shù)的增加而增加,最終穩(wěn)定在89%左右。

3.2.5  STDP權(quán)值改變法人腦的學(xué)習(xí)模式是STDP已經(jīng)被大部分論文和實驗所證實,因此也許基于STDP的權(quán)值改變方法能夠更加促進學(xué)習(xí)的效率。STDP的本質(zhì)定義是說:如果突出前神經(jīng)元的峰值脈沖到達時間小于突觸后的神經(jīng)元峰值脈沖,那么認為突觸前神經(jīng)元脈沖的產(chǎn)生可能是有利于突觸后神經(jīng)元的產(chǎn)生,即這兩者之間是存在一定的聯(lián)動關(guān)系的。于是加強這兩個神經(jīng)元的連接。反之則減弱它們之間的連接。

利用實驗得到對的STDP Positive數(shù)據(jù),波張選取375nm的光做刺激。得到光驅(qū)動下的STDP。但實驗與理論存在偏差的一點,是光刺激下的STDP圖像實際上是存在于一、二象限的,這樣意味著,無論是突出前神經(jīng)元的脈沖先到達還是后到達,產(chǎn)生的權(quán)值更新過程,都是加強該兩個神經(jīng)元之間的連接。在保證權(quán)值更新雙向?qū)ΨQ性的情況下,這樣的情況顯然是不允許。于是在三象限部分,本文選取了其他數(shù)據(jù)作為替代,這個數(shù)據(jù)是從電突觸元器件得到的。這里也可以得出一個設(shè)想,是否可以有光與電合并的突觸器件,使用光完成第一象限的STDP工作,由電器件完成第三象限STDP工作。為何要選擇光器件是因為,光學(xué)突觸器件的耗能相比于電學(xué)突觸器件要節(jié)省很多。如果能夠使用光電混合信號實現(xiàn)光電STDP,也不失為一種選擇。

擬合后正向STDP函數(shù)表達式如下:

y=?0.346ln(x)+2.708

 

負向STDP函數(shù)表達式如下:       

y=0.302ln(?x)?2.546

 

根據(jù)上面的STDP函數(shù)更新法則,帶入我們的temportron算法進行求解。得到準確率變化情況如下,設(shè)置參數(shù)與LTP更新規(guī)則相同。

 

圖3.10 準確率隨訓(xùn)練次數(shù)變化情況(STDP)

可以看到,經(jīng)由STDP訓(xùn)練的網(wǎng)絡(luò),在epoch=60左右的時候,已經(jīng)達到了準確率100%,在訓(xùn)練的準確度與效率上,高于使用LTP訓(xùn)練的結(jié)果。這也可能是為什么當(dāng)前很多的研究都著眼于STDP權(quán)重更新機制。這可能也和STDP實際上與人類大腦的學(xué)習(xí)機制十分相似,本次模擬也證明了大腦學(xué)習(xí)模式在權(quán)值調(diào)整上的優(yōu)越性,基于LTP的調(diào)制模式,更多是對于算法當(dāng)中核函數(shù)K(t)的模擬,而并非是對于本質(zhì)上人類大腦學(xué)習(xí)模式的仿真。

3.2.6  結(jié)論無論選取LTP,STDP作為權(quán)值更新的方式,神經(jīng)網(wǎng)絡(luò)的權(quán)值更新一定要是對稱,這樣在梯度下降算法過程中,才能夠有正和負梯度,使得最后的結(jié)果收斂于局部最小點。另外,在學(xué)習(xí)機制上,STDP是存在一定優(yōu)越性的。后面本文將針對SDTP學(xué)習(xí)機制,將網(wǎng)絡(luò)擴展到更大的規(guī)模,展現(xiàn)STDP學(xué)習(xí)機制的強大之處。

33.3 無監(jiān)督脈沖神經(jīng)網(wǎng)絡(luò)數(shù)值模擬3.3.1  理論背景與基礎(chǔ)這SNN的發(fā)展之所以廣受著名,是因為它網(wǎng)絡(luò)的元器件要求是有一定硬件基礎(chǔ)的,不論是在神經(jīng)元的設(shè)計上,如LIF模型,HH模型,還是電導(dǎo)突觸,指數(shù)型的衰減機制,閾值電壓。都可以通過我們設(shè)計的電學(xué)或者光學(xué)器件進行實現(xiàn)。

本文基于2015年P(guān)eter發(fā)表的關(guān)于STDP無監(jiān)督學(xué)習(xí)網(wǎng)絡(luò)的代碼基礎(chǔ)上,加上實驗得到的數(shù)據(jù),進行數(shù)值模擬。模擬之前,先了解一下網(wǎng)絡(luò)的具體結(jié)構(gòu)與基本理論。

對于神經(jīng)元的設(shè)置,應(yīng)用integrated -and-fire model模型:

τdVdt=(Erest?V)+ginh(Einh?V)+gexc(Eexc?V)

            (3-6)

 

這里V是膜電壓,Erest

是神經(jīng)元在沒有外界刺激下的一種靜息電壓。

τ

是抑制或者興奮神經(jīng)元的時間時間常數(shù),這個常數(shù)時間上就是用于控制各種不同的STDP圖像。

galignlink

gexc

是抑制性神經(jīng)元和興奮性神經(jīng)元的電導(dǎo)值,這個值在神經(jīng)網(wǎng)絡(luò)中表現(xiàn)為權(quán)重,也是我們需要訓(xùn)練的東西。訓(xùn)練模式與tempotron算法類似,當(dāng)膜電壓到達閾值電壓的時候,就會發(fā)送尖峰脈沖信號,然后膜電位復(fù)位到靜息電壓。如果有神經(jīng)元的尖峰信號達到突觸,那么突觸就會提升權(quán)值,即電導(dǎo),如果沒有,那么權(quán)值就會指數(shù)型的衰減。權(quán)值更新的模式仍然是取決于突觸前神經(jīng)元與突觸后神經(jīng)元的尖峰達到時間差。如圖3.11所示,由于前后神經(jīng)元的脈沖尖峰抵達時間差不一樣,產(chǎn)生了興奮和抑制兩種模式

 

 

圖 3.11 STDP權(quán)值更新模式圖[17]

我們需要定義興奮性神經(jīng)元與抑制性神經(jīng)元的權(quán)值改變方式。對于興奮性神經(jīng)元的電導(dǎo)更新模式如下:

τgedgedt=?ge

                      (3-7)

 

抑制性電導(dǎo)的更新模式其實只需要更換常數(shù):

τgidgidt=?gi

                      (3-8)

 

時間常數(shù)得控制會影響STDP得學(xué)習(xí)曲線,人腦或者生物的時間常數(shù)一般是10 ms-20 ms量級。我們由實驗得到得時間常數(shù)數(shù)值也靠近這個值

然后是基于STDP的權(quán)值更新法則:

Δw=η(xpre?xtar)(wmax?w)u

               (3-9)

 

實際上,STDP的更新規(guī)則很多,還有指數(shù)型的,這里選取一種更新規(guī)則,他們大多大同小異。這里的η

是學(xué)習(xí)的速率,

Xpre

是該脈沖產(chǎn)生時的上一次脈沖值,每當(dāng)有一次脈沖到達突觸時,

Xpre

會增加1,如果沒有,它會按照指數(shù)型進行衰減。

Xtar

是前一次的突觸前神經(jīng)元產(chǎn)生的脈沖,其反應(yīng)在突觸后神經(jīng)元的目標值。這其實也是在將突觸前神經(jīng)元和后神經(jīng)元產(chǎn)生的時間在進行比較,從而正確的更新權(quán)值。

 

3.3.2  網(wǎng)絡(luò)設(shè)計脈沖神經(jīng)網(wǎng)絡(luò)的設(shè)計與普通的經(jīng)典神經(jīng)網(wǎng)絡(luò)有所不同,由圖5.2看到,Input輸入層圖像的像素編碼脈沖數(shù)據(jù),脈沖的頻率由圖像像素點的灰度值,即成正比關(guān)系,28×28的像素值會變成一個784×1的一維序列,每一個值代表一定頻率的脈沖信號。

 

圖3.12 SNN神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)[16]

 

之后進入激活層,激活層放置激活神經(jīng)元,然后再進入抑制層,放置抑制層神經(jīng)元。這里可以看到,非監(jiān)督學(xué)習(xí)網(wǎng)絡(luò)的結(jié)構(gòu)是不存在標簽值的。更新完全依靠激活層與抑制層之間的關(guān)系。從圖3.12可以看到,輸入層與激活層實際上時全連接模式,即每一個像素點產(chǎn)生的脈沖序列都會再激活層有一個對應(yīng)權(quán)重。激活層與抑制層之間時一一對應(yīng)連接,但抑制層與激活層的連接卻是全連接模式,除了激活層已經(jīng)與抑制層產(chǎn)生連接的神經(jīng)元。這樣的網(wǎng)絡(luò)設(shè)計模式實際上是由理由的。這應(yīng)用的winter take all法則,即當(dāng)某個激活層的神經(jīng)元產(chǎn)生興奮后,該興奮傳遞到抑制層后,抑制層會抑制其他所有神經(jīng)元產(chǎn)生脈沖。也就是說,不斷的訓(xùn)練后,能夠產(chǎn)生脈沖的神經(jīng)元會趨向于越來越容易產(chǎn)生脈沖,而其他神經(jīng)元會越來越無法產(chǎn)生脈沖。從而達到訓(xùn)練的目的。這和傳統(tǒng)的K-means算法也有異曲同工之妙,但不同的是STDP 非監(jiān)督學(xué)習(xí)存在抑制層,從而避免了某幾個神經(jīng)元一直占據(jù)某個pattern。

3.3.3  模擬結(jié)果數(shù)值模擬將MNIST 六萬個訓(xùn)練數(shù)據(jù)編碼后作為脈沖輸入,整個訓(xùn)練集進行了6次迭代,一共是36萬張圖片,訓(xùn)練結(jié)束后學(xué)習(xí)慮被置為零,動態(tài)閾值被鎖定。之后輸入每一類的數(shù)字圖片,記錄每個神經(jīng)元對應(yīng)該類圖片的激活次數(shù),并且選取其中激活次數(shù)最多的為該神經(jīng)元的標簽。之后使用測試集的一萬張圖片作為脈沖輸入,觀察每當(dāng)一張圖片輸入時,哪個神經(jīng)元的激活頻率最高,如果該神經(jīng)元的標簽與輸入圖片屬于同一pattern,那么認為分類正確。統(tǒng)計10000萬張圖片的平均準確率,得到網(wǎng)絡(luò)的訓(xùn)練的評價值即Accuracy。

 

圖3.13 神經(jīng)網(wǎng)絡(luò)權(quán)值矩陣圖

這里訓(xùn)練后激活層的權(quán)值矩陣。之前提到了,當(dāng)網(wǎng)絡(luò)訓(xùn)練完成后,我們會輸入每一個圖片的pattern,以激活次數(shù)最高的神經(jīng)元作為該pattern的標簽,在這樣經(jīng)過改進后,圖5.3是激活層神經(jīng)元重組后的權(quán)值分布,可以看到,不同神經(jīng)元對于不同pattern的適應(yīng)程度不同,體現(xiàn)在顏色的深淺上。

 

圖3.14 輸入層到激活層權(quán)值矩陣可視化圖

 

圖3.15 激活層到抑制層權(quán)值矩陣可視化圖

從圖3.14我們可以看到,只有很少部分的權(quán)值很高,即呈現(xiàn)黃色小點模式,體現(xiàn)即只有少數(shù)pattern才能夠產(chǎn)生脈沖,其他的脈沖都被抑制,這個圖像很好體現(xiàn)了我們在學(xué)習(xí)過程中的winer-take-all的模式。圖3.15體現(xiàn)的更加明顯的是,因為網(wǎng)絡(luò)的設(shè)計是激活層與抑制層一對一連接,抑制層與激活層反向全連接,但除去了從激活層連接過來的神經(jīng)元,因此在權(quán)值的對角線上都是winer,而其他的神經(jīng)元都被抑制,從而達到了我們從眾多神經(jīng)元中選取出適合當(dāng)前輸入的正確pattern。

之后我們輸入10000個MNIST的test集圖片進行外推,結(jié)果是:Sum response - accuracy:  91.43  number incorrect:  857。即我們在驗證集上達到了91.43%的準確度。總的來說還是比較可觀的。

結(jié)  論本文用了三個數(shù)值模擬的方法,分別對于神經(jīng)元硬件化條件,神經(jīng)突觸硬件化條件,神經(jīng)元學(xué)習(xí)規(guī)則優(yōu)越性做了探究。在神經(jīng)元硬件化上,通過使用不同的非線性函數(shù)進行數(shù)值模擬,得到了其實在當(dāng)選取激活函數(shù)時,函數(shù)與輸入值的正相關(guān)性并不是必要的,非線性才是最為重要的基準。并且作者使用簡單的鏈式求導(dǎo)法則,證明了神經(jīng)元的硬件化需要有加權(quán)乘法器的功能,并且強調(diào)了乘法器的線性程度。也就推出了權(quán)值更新時,權(quán)值該變量與輸入值的正相關(guān)性的重要性,也可以說是正負變化的對稱性是對隨機梯度下降法達到收斂的充分條件。在SNN數(shù)值模擬上,本文先嘗試了tempotron有監(jiān)督SNN算法,并且對其權(quán)值改變的方程做出了LTP與STDP法則的兩種試探,發(fā)現(xiàn)STDP的效果更好,也不愧是貼近人類大腦的學(xué)習(xí)模式。這里也需要指出tempotron算法的缺點在于該算法只能針對單神經(jīng)元,即脈沖只能判斷單個神經(jīng)元能不能發(fā)出脈沖,泛用性不是特別強,但是將輸入改成離散的脈沖輸入,在神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和理念上是一個很大的突破。接著文章以STDP學(xué)習(xí)機制更為優(yōu)秀的基礎(chǔ)上,在基于2015年P(guān)eter教授的無監(jiān)督STDP學(xué)習(xí)網(wǎng)絡(luò)[16]這篇論文的基礎(chǔ)上,使用實驗相關(guān)的數(shù)據(jù)進行了數(shù)值模擬,指出了該網(wǎng)絡(luò)的結(jié)構(gòu),采用winter-take-all模式與IF神經(jīng)元結(jié)構(gòu),實現(xiàn)了在沒有任何標簽和領(lǐng)域知識的無監(jiān)督學(xué)習(xí)網(wǎng)絡(luò)的模擬,并且在MNIST的test數(shù)據(jù)集上達到了91.43%的正確率。從實驗上證實了STDP學(xué)習(xí)機制可以用于無監(jiān)督學(xué)習(xí),指出了其在未來發(fā)展的巨大潛力。

最后本文提出一些對于當(dāng)前硬件神經(jīng)網(wǎng)絡(luò)研究的看法,目前實現(xiàn)硬件神經(jīng)網(wǎng)絡(luò)的方法在緒論也有提出,主要有微電子方法、半導(dǎo)體突觸和光學(xué)實現(xiàn)。作者認為想要實現(xiàn)真正的類腦計算。我們就需要研究更與人類達到貼切的器件。盡管在微電子方面,目前的技術(shù)可以實現(xiàn)精度很高的數(shù)字模擬電路。但是實際上那也只是靠我們強大的算力與耗費了很多資源達到的結(jié)果。再說全光學(xué)的神經(jīng)網(wǎng)絡(luò),這樣的設(shè)想只能夠用天才來形容,這樣的網(wǎng)絡(luò)耗能少,效率高,速度快。但這并不能夠算是類腦計算,只是從物理的角度對于神經(jīng)網(wǎng)絡(luò)進行了實現(xiàn)。真正的類腦計算我相信應(yīng)該是基于STDP,LTP, LTD這些與人腦大腦對于信號實際反映做出的模型之上的。近年來已經(jīng)發(fā)展了很多基于STDP或者類腦計算的算法,并且在數(shù)值模擬上都證實了其實現(xiàn)的可能性。目前的當(dāng)務(wù)之急應(yīng)該是制備出與這些理論符合的突觸器件或者神經(jīng)元元件,然后進行集成,實現(xiàn)一個結(jié)合微電子設(shè)計電路與編碼處理,從而實現(xiàn)一個從輸入,到reference,再到自動Back Propagation修改誤差的自主型芯片,真正達到off-chip模式的神經(jīng)網(wǎng)絡(luò)計算與硬件化。

參考文獻[1]Takao Watanabe, Katdutaka Kimura, Masakazu Aoki, et al. A Sinngle 1.5-V Digital Chip for a 106  Synapse Neural Network. IEEE Transactions on Neural Networks. May 1993,4(3): 387-39 

[2]Matthew S Melttn, Tan Phan, Douglas S Reeves, et al. The TInMANN VLSI Chip. 1993, 4(3): 394 -340 

[3]Hendrik C A M, Withagen. Neural Networks: Analog VLSI Implementation and Learning Algorithms. Ph.D thesis, Eindhoven,1997 

[4]高麗娜 邱關(guān)源. 一種連續(xù)可調(diào)權(quán)值 CMOS 神經(jīng)網(wǎng)絡(luò). 電子學(xué)報, 1998, 26(2): 120-122 

[5]Bernabé Linares-Barranco et al. A Modular T-Mode Design Approach for Analog Neural Network Hardware Implementations. IEEE Journal of Solid-State Circuits,1992, 27(5): 701-712 

[6]Strukov, Dmitri B, Snider, Gregory S, Stewart, Duncan R and Williams, Stanley R. The missing memristor found. Nature. 2008, 453: 80–83. doi:10.1038/nature06932. 

[7]賀靜, 基于CMOS 模擬技術(shù)的多種前饋人工神經(jīng)網(wǎng)絡(luò)硬件的研究與實現(xiàn) [D]. 湘潭大學(xué), 2014 

[8]侯媛彬,杜京義,汪梅. 神經(jīng)網(wǎng)絡(luò) [M]. 西安:西安電子科技大學(xué)出版社, 2007: 16-19. 

[9]Q. Yu, S. Member, R. Yan, H. Tang, K. C. Tan, H. Li, IEEE Trans. Neural Networks Learn. Syst. 2016, 27, 621. 

[10]M. Giulioni, X. Lagorce, F. Galluppi, R. B. Benosman, Front. Neurosci. 2016, 10, 1 

[11]Bengio, Y. and Fischer, A. (2015). Early inference in energy-based models approximates back-propagation. Technical Report arXiv:1510.02777, Universite de Montreal. 

[12]Scellier. B. and Bengio, Y. (2016).Towards a biologically plausible backprop. arXiv:1602.05179 . 

[13]Markram H, Lübke J, Frotscher M, et al. Regulation of synaptic efficacy by coincidence of postsynaptic APs and EPSPs[J]. Science, 1997, 275(5297): 213-215. 

[14]Bi G, Poo M. Synaptic modifications in cultured hippocampal neurons: dependence on spike timing, synaptic strength, and postsynaptic cell type[J]. Journal of neuroscience, 1998, 18(24): 10464-10472. 

[15]Peng Yao, Xueyao Huang, Wenqiang Zhang,Qingtian Zhang.Face classification using electronic synapses.2017.5.12.DOI: 10.1038 

[16]Peter U. Diehl, Matthew Cook.Unsupervised learning of digit recognition using spike-timing-dependent plasticity.Front. Comput. Neurosci., 03 August 2015 | DOI:10.3389 

[17]Qingzhou Wan, Mohammad T. Sharbati, John R. Erickson, Yanhao Du, and Feng Xiong.Emerging Artificial Synaptic Devices for Neuromorphic Computing 

[18]陳瓊. 鄭啟倫.人工神經(jīng)網(wǎng)絡(luò)系統(tǒng)硬件實現(xiàn)的研究進展.[J].電路與系統(tǒng)學(xué)報.2000 年 3 月 

[19]Cowan J D . Discussion:McCulloch-Pitts and related neural nets from 1943 to 1989[J]. Bulletin of Mathematical Biology, 1990, 52(1-2):73-97. 

[20]Mcclelland J . Reflections on Cognition and Parallel Distributed Processing[J]. 1986. 

[21]Xing Lin, Yair Rivenson, Nezih T. Yardimci, Muhammed Veli, Yi Luo, Mona Jarrahi and Aydogan Ozcan.All-optical machine learning using diffractive deep neural networks[J].Science.DOI:10.1126.July 26.2018 

附  錄代碼具體說明請參考github.com/zhenghaobaby/graduated_design

作者簡歷姓名:鄭浩  性別:男  民族:漢族  出生年月:1997-04-11  籍貫:四川成都

教育背景:

2012.09-2015.07  成都七中

2015.09-2019.07  浙江大學(xué)攻讀材料科學(xué)工程學(xué)士學(xué)位

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文與取得的其他研究成果已:

[1]XXXXXXX 

[2]XXXX 

待:

[1]XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX 

[2]XXXX 

已授權(quán)專利:

[1]XXXXXX