前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇神經(jīng)網(wǎng)絡(luò)實(shí)驗(yàn)總結(jié)范文,相信會(huì)為您的寫作帶來幫助,發(fā)現(xiàn)更多的寫作思路和靈感。
關(guān)鍵詞 :GA-RBF神經(jīng)網(wǎng)絡(luò) 預(yù)測(cè)模型 仿真
泵的性能預(yù)測(cè)研究就是根據(jù)泵的葉輪、蝸殼、導(dǎo)葉等過流部件的幾何參數(shù),分析內(nèi)部流動(dòng)特征,以此預(yù)測(cè)泵的性能,是在泵產(chǎn)品設(shè)計(jì)中必不可少的重要環(huán)節(jié),具有縮短研發(fā)周期、降低開發(fā)成本和提高產(chǎn)品設(shè)計(jì)質(zhì)量等優(yōu)點(diǎn)。針對(duì)離心泵的性能研究不但具有重要的學(xué)術(shù)價(jià)值和社會(huì)效益,而且對(duì)研究其他泵的性能提供了可資借鑒的依據(jù)。
一、GA-RBF神經(jīng)網(wǎng)絡(luò)簡(jiǎn)介
GA-RBF神經(jīng)網(wǎng)絡(luò)是將遺傳算法引入到前饋式神經(jīng)網(wǎng)絡(luò)(RBF)發(fā)展起來的一種神經(jīng)網(wǎng)絡(luò)。作為三層前向網(wǎng)路的RBF神經(jīng)網(wǎng)絡(luò),由輸入層、徑向基層(RBF層)和輸出層構(gòu)成,它利用RBF作為隱含單元的“基”構(gòu)成隱含空間,輸入矢量不需要通過權(quán)連接直接進(jìn)入隱含層,只要能夠確定RBF的中心點(diǎn),就能夠確定其相應(yīng)的映射關(guān)系,具有突出的最佳逼近性能和全局最有特性且構(gòu)造簡(jiǎn)單、訓(xùn)練速度快,在非線性函數(shù)逼近及模式識(shí)別領(lǐng)域取得了很好的效果。
二、構(gòu)建基于GA-RBF神經(jīng)網(wǎng)絡(luò)性能預(yù)測(cè)模型
在利用GA-RBF神經(jīng)網(wǎng)絡(luò)算法來實(shí)現(xiàn)對(duì)離心泵性能預(yù)測(cè)時(shí)可根據(jù)如圖1所示的流程圖進(jìn)行。
因?yàn)樵贕A-RBF神經(jīng)網(wǎng)絡(luò)中,輸入模式對(duì)于離心泵性能預(yù)測(cè)預(yù)測(cè)結(jié)果有比較大影響,因此我們選取對(duì)離心泵能量性能影響較大的離心泵幾何參數(shù)和設(shè)計(jì)流量()作為GA-RBF神經(jīng)網(wǎng)絡(luò)的輸入變量。其中,主要的離心泵幾何參數(shù)包括:葉輪出口直徑()、葉片出口寬度()、葉片出口安放角()、渦殼的基圓直徑()、渦殼進(jìn)口寬度()、蝸殼第八斷面面積()、葉片包角()以及葉片數(shù)()。根據(jù)輸入模式可以確定輸入層神經(jīng)元數(shù)目為9。考慮到RBF神經(jīng)網(wǎng)絡(luò)的隱含層神經(jīng)元是徑向基函數(shù),該特性使RBF神經(jīng)網(wǎng)絡(luò)的擬合特性為局部性,于是本文將泵的揚(yáng)程和效率預(yù)測(cè)設(shè)計(jì)為2個(gè)相類似結(jié)構(gòu)的GA-RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,即為離心泵揚(yáng)程GA-RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型和離心泵效率GA-RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,如圖2所示。
三、仿真實(shí)驗(yàn)
為了考察建立的離心泵揚(yáng)程GA-RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型和離心泵效率GA-RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的有效性,我們選取沈陽(yáng)水泵研究所編撰的《全國(guó)優(yōu)秀水力模型匯編》和江蘇大學(xué)關(guān)醒凡教授編撰的《現(xiàn)代泵技術(shù)手冊(cè)》選取57組單級(jí)單吸離心泵的設(shè)計(jì)參數(shù)和試驗(yàn)參數(shù)作為訓(xùn)練樣本數(shù)據(jù)和目標(biāo)數(shù)據(jù)。
根據(jù)訓(xùn)練樣本數(shù)據(jù)和目標(biāo)數(shù)據(jù)輸入離心泵揚(yáng)程GA-RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型和離心泵效率GA-RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型進(jìn)行訓(xùn)練,其訓(xùn)練學(xué)習(xí)效果分別如圖3、圖4所示。
為了考察建立的離心泵揚(yáng)程GA-RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型和離心泵效率GA-RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的效果,本文也從沈陽(yáng)水泵研究所編撰的《全國(guó)優(yōu)秀水力模型匯編》和江蘇大學(xué)關(guān)醒凡教授編撰的《現(xiàn)代泵技術(shù)手冊(cè)》選取6組單級(jí)單吸離心泵的設(shè)計(jì)參數(shù)和試驗(yàn)參數(shù)數(shù)據(jù)作為檢驗(yàn)樣本,其具體數(shù)據(jù)如表1所示。
采用表1的數(shù)據(jù)和利用已經(jīng)建立的離心泵揚(yáng)程GA-RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型和離心泵效率GA-RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型分別進(jìn)行預(yù)測(cè)離心泵的揚(yáng)程、效率等性能指標(biāo),與談明高等人所做實(shí)驗(yàn)和撰寫的文獻(xiàn)參數(shù)進(jìn)行對(duì)比,其結(jié)果如表2所示。
分析表2的離心泵性能的GA-RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型檢驗(yàn)樣本預(yù)測(cè)結(jié)果發(fā)現(xiàn):GA-RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的揚(yáng)程最大相對(duì)誤差的絕對(duì)值為12.06% 、最小相對(duì)誤差的絕對(duì)值為2.34%、均方根相對(duì)誤差為6.56%;效率誤差最大相對(duì)誤差的絕對(duì)值為6.99% 、最小相對(duì)誤差的絕對(duì)值為0.67% 、均方根誤差為3.99%。RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的揚(yáng)程最大相對(duì)誤差的絕對(duì)值為13.86% 、最小相對(duì)誤差的絕對(duì)值為2.29%、均方根相對(duì)誤差為7.56%;效率誤差最大相對(duì)誤差的絕對(duì)值為6.00% 、最小相對(duì)誤差的絕對(duì)值為1.78% 、均方根誤差為3.70%。
由圖3和圖4我們可以看到,RBF神經(jīng)網(wǎng)絡(luò)及其改進(jìn)的GA-RBF神經(jīng)網(wǎng)絡(luò)在離心泵揚(yáng)程預(yù)測(cè)精度方面都低于效率預(yù)測(cè)精度;雖然GA-RBF神經(jīng)網(wǎng)絡(luò)在預(yù)測(cè)離心泵效率的精度雖然比RBF神經(jīng)網(wǎng)絡(luò)略低,但在預(yù)測(cè)離心泵揚(yáng)程的精度明顯要好得多。
四、總結(jié)
我們采用GA-RBF神經(jīng)網(wǎng)絡(luò)算法建立離心泵性能GA-RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,在沈陽(yáng)水泵研究所編撰的《全國(guó)優(yōu)秀水力模型匯編》和江蘇大學(xué)關(guān)醒凡教授編撰的《現(xiàn)代泵技術(shù)手冊(cè)》選取57組單級(jí)單吸離心泵的設(shè)計(jì)參數(shù)和試驗(yàn)參數(shù)進(jìn)行建模和驗(yàn)證,并通過闡述性能預(yù)測(cè)的實(shí)現(xiàn)過程,結(jié)果表明離心泵性能GA-RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型與原有的離心泵性能RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型通一樣有效,并且設(shè)置參數(shù)更簡(jiǎn)單、更方便。
參考文獻(xiàn):
[1]關(guān)醒凡.現(xiàn)代泵技術(shù)手冊(cè)[M].宇航出版社,1995.
[2]張頂學(xué),劉新芝,關(guān)治洪.RBF神經(jīng)網(wǎng)絡(luò)算法及其應(yīng)用[J].石油化工高等學(xué)校學(xué)報(bào),2007,(03).
摘要:本文利用神經(jīng)網(wǎng)絡(luò)的強(qiáng)大的自學(xué)習(xí)能力和自適應(yīng)性來提高安全審計(jì)系統(tǒng)的性能。在眾多神經(jīng)網(wǎng)絡(luò)中,PNN概率神經(jīng)網(wǎng)絡(luò)尤為適合運(yùn)用到入侵行為模式的誤用檢測(cè)方面。因此本文將PNN概率神經(jīng)網(wǎng)絡(luò)和入侵檢測(cè)技術(shù)結(jié)合起來,研究保護(hù)企業(yè)數(shù)據(jù)庫(kù)的安全技術(shù),并構(gòu)造出一套企業(yè)數(shù)據(jù)庫(kù)入侵誤用檢測(cè)模型。該模型主要用于檢測(cè)已知的入侵行為模式,并給系統(tǒng)及時(shí)處理入侵行為提供依據(jù)。
關(guān)鍵詞:數(shù)據(jù)庫(kù)安全 PNN概率神經(jīng)網(wǎng)絡(luò) 入侵檢測(cè)
Abstract:The thesis uses the neural network's powerful self-learning and self-adaptive to improve the performance of the security audit system. In many neural networks, the Probabilistic Neural Network is particularly suitable for the misuse detection of intrusion mode. The thesis combines the method of the Probabilistic Neural Network with the technique of intrusion detection, and constructs a model of intrusion detection system applied to the corporation database. The mode can detect the known intrusion modes, in the same time, provides the basis for system to deal with the intrusions in time.
Key words: Database security Probabilistic Neural Network Intrusion detection
數(shù)據(jù)庫(kù)作為企業(yè)和部門信息系統(tǒng)的重要組成部分,存儲(chǔ)著大量的數(shù)據(jù),其中某些數(shù)據(jù)可能是機(jī)密的重要數(shù)據(jù),這些數(shù)據(jù)一旦遭到破壞,會(huì)給企業(yè)和部門造成不可挽回的損失,所以,這些數(shù)據(jù)的安全性在信息系統(tǒng)的安全中起著至關(guān)重要的作用。當(dāng)前,數(shù)據(jù)庫(kù)安全技術(shù)的研究已經(jīng)成為信息安全的重要課題,入侵檢測(cè)技術(shù)是新一代的動(dòng)態(tài)安全保障技術(shù),它用來檢測(cè)內(nèi)部用戶的不合法操作和外部非法入侵者的惡意攻擊。檢測(cè)系統(tǒng)在檢測(cè)到攻擊的同時(shí),還會(huì)采取適當(dāng)?shù)奶幚砼c保護(hù)措施,對(duì)有效保護(hù)數(shù)據(jù)庫(kù)安全提供了一種很好的解決思路,被稱為防火墻之后的第二道安全閘門。其本身也成為當(dāng)今信息安全領(lǐng)域的一個(gè)研究熱點(diǎn)。
入侵檢測(cè)ID(Intrusion Detection)是近十年發(fā)展起來的一種預(yù)防、動(dòng)態(tài)監(jiān)測(cè)和抵御系統(tǒng)入侵行為的安全機(jī)制,彌補(bǔ)了傳統(tǒng)安全技術(shù)的不足。入侵檢測(cè)系統(tǒng)IDS(Intrusion Detection System)可以實(shí)時(shí)監(jiān)控網(wǎng)絡(luò)和計(jì)算機(jī)主機(jī),發(fā)現(xiàn)可疑事件,入侵行為一旦被檢測(cè)出來,系統(tǒng)就會(huì)采取報(bào)警、記錄和切斷連接等措施,在對(duì)系統(tǒng)安全產(chǎn)生的危害之前及時(shí)消除風(fēng)險(xiǎn)。
神經(jīng)網(wǎng)絡(luò)技術(shù)具有自適應(yīng)和自學(xué)習(xí)的能力,只要給系統(tǒng)提供所需的網(wǎng)絡(luò)數(shù)據(jù)包和審計(jì)數(shù)據(jù),它就可以通過自學(xué)習(xí)構(gòu)造出相對(duì)正常的用戶或系統(tǒng)活動(dòng)模型,從而檢測(cè)出異?;顒?dòng)的攻擊模式,因此在檢測(cè)方法上,將神經(jīng)網(wǎng)絡(luò)引入到入侵檢測(cè)的研究中,使得入侵檢測(cè)的智能性研究逐漸成為熱點(diǎn)。
PNN概率神經(jīng)網(wǎng)絡(luò)在數(shù)據(jù)庫(kù)入侵的誤用檢測(cè)中,能夠?qū)θ肭中袨槟J竭M(jìn)行快速準(zhǔn)確的檢測(cè)及判斷,為系統(tǒng)及時(shí)采取相應(yīng)的措施提供依據(jù)。誤用檢測(cè)是指運(yùn)用已知的攻擊方法,根據(jù)定義好的異常模式,通過判斷這些異常模式是否出現(xiàn)來檢測(cè)。本文圍繞PNN神經(jīng)網(wǎng)絡(luò)的運(yùn)用,對(duì)整個(gè)數(shù)據(jù)處理過程進(jìn)行了介紹,從數(shù)據(jù)采集,到網(wǎng)絡(luò)訓(xùn)練,以及測(cè)試網(wǎng)絡(luò)性能,提出利用PNN概率神經(jīng)網(wǎng)絡(luò)進(jìn)行入侵行為模式判斷的優(yōu)勢(shì),進(jìn)而總結(jié)出一種新型的企業(yè)數(shù)據(jù)庫(kù)入侵的誤用檢測(cè)模型。
一、PNN神經(jīng)網(wǎng)絡(luò)算法模型
概率神經(jīng)網(wǎng)絡(luò)PNN(Probabilistic Neural Network)是根據(jù)徑向基函數(shù)網(wǎng)絡(luò)發(fā)展而來的一種前饋型神經(jīng)網(wǎng)絡(luò),是徑向基網(wǎng)絡(luò)的一種變化形式,其理論依據(jù)是貝葉斯最小風(fēng)險(xiǎn)準(zhǔn)則。PNN具有結(jié)構(gòu)簡(jiǎn)單、訓(xùn)練快捷等優(yōu)點(diǎn),在分類問題中,它的優(yōu)勢(shì)在于可以利用線性學(xué)習(xí)算法來完成非線性算法所做的工作,同時(shí)又可以保持非線性算法高精度的特點(diǎn)。其結(jié)構(gòu)如圖1所示。
輸入層測(cè)試向量X(X1…Xn)通過傳遞機(jī)制傳遞到模式層,經(jīng)過模式層的相應(yīng)處理產(chǎn)生新的信息量依次經(jīng)過該網(wǎng)絡(luò)的所有層,其神經(jīng)元的數(shù)目由訓(xùn)練數(shù)據(jù)的維數(shù)決定。模式層中各個(gè)類別組的輸出為:
其中Wi表示連接輸入層與模式層的權(quán)值,δ表示平滑因子。
求和層具有線性求和的功能,估計(jì)分類模式的各個(gè)類別的累計(jì)概率。概率密度函數(shù)為:
其中m為屬于類別A的訓(xùn)練樣本數(shù),XAi為樣本中屬于類別A的第i個(gè)訓(xùn)練樣本,σ為平滑因子。訓(xùn)練過程可以表示如下:首先通過輸入層輸入訓(xùn)練樣本向量,然后在模式層中分別計(jì)算該向量與代表不同類別組的神經(jīng)元之間的距離,再在求和層中求出每個(gè)類別模式的概率,最后在輸出層計(jì)算各個(gè)類別的概率估計(jì),由閾值辨別器從中選擇并傳遞出后驗(yàn)概率密度最大的神經(jīng)元的輸出即1,而其他的輸出0。
二、數(shù)據(jù)采集
入侵檢測(cè)的數(shù)據(jù)采集可以收集系統(tǒng)、網(wǎng)絡(luò)、數(shù)據(jù)及用戶活動(dòng)的狀態(tài)和行為,一般可以利用的信息主要來自以下三個(gè)方面。
1、系統(tǒng)和網(wǎng)絡(luò)日志文件
2、非正常的程序執(zhí)行
3、非正常的目錄和文件改變
入侵檢測(cè)的準(zhǔn)確性很大程度上依賴于收集信息的可靠性和正確性,因此很有必要只利用精確的軟件來報(bào)告這些信息。本文利用SQL Server的事件探查器(SQL Server Profiler)跟蹤各客戶端的數(shù)據(jù)庫(kù)調(diào)用。首先建立跟蹤文件,使用SQL Profile標(biāo)準(zhǔn)模板,將跟蹤的結(jié)果存儲(chǔ)到表。表1為SQL事件探查器監(jiān)控的事件分類。
本文主要跟蹤企業(yè)數(shù)據(jù)庫(kù),相應(yīng)數(shù)據(jù)庫(kù)事件類主要為
1、TSQL分類中的SQL:BatchCompleted、SQL:StmtCompleted和SQL:StmtStarting
2、安全審核分類中的Audit Login和Audit LogOut
3、存儲(chǔ)過程中的RPC:Output Paramete、RPC:Completed、RPC:Starting、SP:CacheHit、SP:CacheInsert、SP:CacheMiss、SP:Cac-
heRemove、SP:Completed、SP:ExecContextHit和SP:Recompile
4、會(huì)話分類中的Existing Connection事件類。
相應(yīng)的事件類數(shù)據(jù)為EventClass(捕獲的事件類類型)、LoginName(客戶數(shù)據(jù)庫(kù)登錄名)、CPU(CPU占用時(shí)間)、Reads(服務(wù)器代表事件執(zhí)行的邏輯磁盤讀取數(shù))、Writes(服務(wù)器代表事件執(zhí)行的物理磁盤寫入數(shù))、ClientProcessID(客戶端進(jìn)程號(hào))、SPID(SQL Server指派的與客戶端相關(guān)的服務(wù)器進(jìn)程ID)和objectID(系統(tǒng)分配對(duì)象)。
SQL探查器將采集到的數(shù)據(jù)存儲(chǔ)在表中,為后續(xù)的神經(jīng)網(wǎng)絡(luò)訓(xùn)練與測(cè)試提供直接的數(shù)據(jù)源。
三、實(shí)驗(yàn)
(一)實(shí)驗(yàn)數(shù)據(jù)
本文選取實(shí)驗(yàn)數(shù)據(jù)為從SQL事件探查器中采集到的具有入侵行為模式分類的入侵?jǐn)?shù)據(jù),有5類入侵模式,所以用1、2、3、4、5分別代表各類入侵模式。本文所采用的入侵?jǐn)?shù)據(jù)的特征向量為上節(jié)所采集的各個(gè)數(shù)據(jù)列,在上述監(jiān)控的八個(gè)數(shù)據(jù)列里面去掉LoginName數(shù)據(jù)列,選取EventClass、LoginName、CPU、Reads、Write、ClientProcessID、SPID和objectID七個(gè)數(shù)據(jù)列作為神經(jīng)網(wǎng)絡(luò)的七個(gè)特征向量。一共有4500個(gè)入侵?jǐn)?shù)據(jù)樣本,隨機(jī)選取其中的4000個(gè)入侵?jǐn)?shù)據(jù)樣本作為PNN神經(jīng)網(wǎng)絡(luò)的訓(xùn)練集,其余的500個(gè)數(shù)據(jù)樣本作為測(cè)試集以測(cè)試PNN神經(jīng)網(wǎng)絡(luò)的性能。此入侵?jǐn)?shù)據(jù)集為4500×8維的矩陣,1到7列為七個(gè)特征向量,第8列為分類的輸出,也就是入侵類別。實(shí)驗(yàn)采用MATLAB2012B軟件及其神經(jīng)網(wǎng)絡(luò)工具箱。
(二)入侵檢測(cè)的實(shí)現(xiàn)
如圖1,在對(duì)入侵?jǐn)?shù)據(jù)進(jìn)行測(cè)試時(shí),輸入層接收具有分類號(hào)的數(shù)據(jù)樣本(訓(xùn)練樣本向量)的值,即1、2、3、4、5,將入侵?jǐn)?shù)據(jù)樣本的屬性傳遞給網(wǎng)絡(luò)。模式層計(jì)算輸入特征向量(樣本屬性)與訓(xùn)練集中各個(gè)模式的匹配關(guān)系,求和層將屬于某類的概率累計(jì),按式(1)計(jì)算,從而得到各類的估計(jì)概率密度函數(shù)。模式層由5類入侵類型的數(shù)據(jù)樣本構(gòu)成,將分類好的樣本向量填充到模式層,即可完成該P(yáng)NN的構(gòu)建。
測(cè)試時(shí),輸入層把未分類的需要測(cè)試的入侵?jǐn)?shù)據(jù)樣本向量Xn送至所有的模式層單元。每個(gè)模式層單元計(jì)算測(cè)試入侵?jǐn)?shù)據(jù)樣本向量Xn和該單元訓(xùn)練向量之間的距離,求和層各單元把模式層單元的輸出按類別號(hào)相加求和,獲得各分類對(duì)應(yīng)的分布密度。輸出層從求和層中求得輸入測(cè)試數(shù)據(jù)相對(duì)于各類別號(hào)的分布密度最大值,并將其對(duì)應(yīng)的類別號(hào)1、2、3、4、5作為PNN的輸出。
(三)PNN神經(jīng)網(wǎng)絡(luò)性能分析
選取1530到1580這50個(gè)樣本來分析,在這50個(gè)樣本中有2個(gè)樣本判斷錯(cuò)誤,如圖2所示。實(shí)際上在此次PNN網(wǎng)絡(luò)訓(xùn)練過程中,4000個(gè)樣本只有5個(gè)樣本判斷錯(cuò)誤,如圖3所示。并且,用預(yù)測(cè)樣本進(jìn)行驗(yàn)證的時(shí)候,選取150到200個(gè)這50個(gè)樣本,其中有1個(gè)樣本的入侵模式類別判斷錯(cuò)誤,如圖4所示。而實(shí)際在此次PNN網(wǎng)絡(luò)檢測(cè)過程中,500個(gè)樣本只有2個(gè)樣本的入侵模式類別判斷錯(cuò)誤,精度高達(dá)99.6%。將網(wǎng)絡(luò)重復(fù)運(yùn)行10次,其平均精度為99.64%。
(四)PNN神經(jīng)網(wǎng)絡(luò)優(yōu)勢(shì)
1、PNN過程簡(jiǎn)單,收斂速度快。PNN神經(jīng)網(wǎng)絡(luò)網(wǎng)絡(luò)結(jié)構(gòu)簡(jiǎn)單,需要調(diào)節(jié)的參數(shù)很少,其處理數(shù)據(jù)的時(shí)間與其他神經(jīng)網(wǎng)絡(luò)相比有較大優(yōu)勢(shì)。
2、PNN網(wǎng)絡(luò)基于貝葉斯最小風(fēng)險(xiǎn)分類準(zhǔn)則,能夠最大限度地考慮樣本數(shù)據(jù)的先驗(yàn)信息,即使分類問題異常復(fù)雜,只要用于學(xué)習(xí)的樣本向量足夠多,就能夠得到Bayes判別準(zhǔn)則下的最優(yōu)解。
3、樣本的追加能力強(qiáng),且可以容忍個(gè)別錯(cuò)誤樣本,即使訓(xùn)練樣本改變也不需要花費(fèi)較多時(shí)間重新訓(xùn)練網(wǎng)絡(luò)。由于PNN神經(jīng)網(wǎng)絡(luò)考慮的是訓(xùn)練樣本屬于各個(gè)類別的概率,在估計(jì)出各個(gè)類別的概率密度函數(shù)(PDF, Probability Density Function)之后,即使根據(jù)實(shí)際問題有新的入侵行為模式的加入,只需要相應(yīng)改變模式層神經(jīng)元數(shù)目,而無需重新訓(xùn)練網(wǎng)絡(luò)。
4、PNN在異常與否分類問題應(yīng)用中,通過線性學(xué)習(xí)算法來完成非線性學(xué)習(xí)算法所做的工作,同時(shí)能保持非線性算法的高精度等特性。
5、PNN網(wǎng)絡(luò)不需要訓(xùn)練,因而能夠滿足數(shù)據(jù)庫(kù)入侵檢測(cè)實(shí)時(shí)處理的要求。
四、企業(yè)數(shù)據(jù)庫(kù)入侵檢測(cè)的系統(tǒng)模型
該模型主要由以下三個(gè)模塊組成:
1、數(shù)據(jù)采集模塊。該模塊主要利用SQL Server事件探查器采集相關(guān)數(shù)據(jù)。
2、特征數(shù)據(jù)庫(kù)模塊。該模塊為訓(xùn)練好的PNN神經(jīng)網(wǎng)絡(luò),相當(dāng)于事件數(shù)據(jù)庫(kù),其征數(shù)據(jù)庫(kù)與被監(jiān)控?cái)?shù)據(jù)庫(kù)分離存儲(chǔ)。
3、報(bào)警單元模塊。該模塊對(duì)檢測(cè)到的異常事件進(jìn)行處理,將數(shù)據(jù)損失降低到最小,提供報(bào)警的可視化界面,將報(bào)警信息反饋給系統(tǒng)管理員并記錄到相關(guān)文件,以便及時(shí)處理或進(jìn)行事后分析。
該模型主要流程為:利用事件探查器實(shí)時(shí)跟蹤各客戶端調(diào)用,采集相關(guān)數(shù)據(jù)并進(jìn)行處理,將數(shù)據(jù)直接導(dǎo)入特征數(shù)據(jù)庫(kù),利用PNN神經(jīng)網(wǎng)絡(luò)對(duì)誤用檢測(cè)的優(yōu)勢(shì),實(shí)現(xiàn)快速檢測(cè)及判斷各種數(shù)據(jù)是否為已知的異常調(diào)用,如有匹配則為某種入侵行為模式,將數(shù)據(jù)送入報(bào)警單元,不匹配的數(shù)據(jù)則為正常行為,不作處理。
總結(jié):
隨著互聯(lián)網(wǎng)迅猛發(fā)展,企業(yè)數(shù)據(jù)庫(kù)的安全顯得非常重要。入侵檢測(cè)作為一種重要的安全保障手段,涉及到廣泛的技術(shù)領(lǐng)域。本文提出一種基于PNN概率神經(jīng)網(wǎng)絡(luò)的算法,實(shí)驗(yàn)結(jié)果表明將PNN概率神經(jīng)網(wǎng)絡(luò)引入到入侵檢測(cè)中的具有快速、精準(zhǔn)的優(yōu)勢(shì),由此結(jié)合PNN概率神經(jīng)網(wǎng)絡(luò)與入侵檢測(cè)技術(shù)研究了一類企業(yè)數(shù)據(jù)庫(kù)的安全保護(hù)技術(shù),實(shí)現(xiàn)了企業(yè)數(shù)據(jù)庫(kù)入侵檢測(cè)的系統(tǒng)模型,并詳細(xì)介紹了模型各個(gè)模塊的具體實(shí)現(xiàn)方法及流程。可以有效的防范到來自內(nèi)部的越權(quán)操作、違規(guī)操作和惡意破壞等,并可以抵制外部的遠(yuǎn)程非法入侵,是運(yùn)用神經(jīng)網(wǎng)絡(luò)技術(shù)解決企業(yè)數(shù)據(jù)庫(kù)安全保障的有效嘗試?;谄髽I(yè)數(shù)據(jù)庫(kù)的數(shù)據(jù)采集方法和神經(jīng)網(wǎng)絡(luò)檢測(cè)技術(shù)為今后的工作打開了思路。
參考文獻(xiàn):
[1]王小川,史峰等。《MATLAB神經(jīng)網(wǎng)絡(luò)30個(gè)案例分析》.第一版.北京:北京航空航天大學(xué)出版社,2010:176-182.
[2]張德豐等.《MATLAB神經(jīng)網(wǎng)絡(luò)應(yīng)用設(shè)計(jì)》.第二版.北京:機(jī)械工業(yè)出版社,出版年2011:320-323.
[3]金波.入侵檢測(cè)智能方法的研究.上海:華東理工大學(xué),2000:29-131.
[4]李鋼.基于神經(jīng)網(wǎng)絡(luò)的入侵檢測(cè)研究與實(shí)現(xiàn).南京:南京師范大學(xué).2006.
[5]Sushil Jajodia.Database Security and Privacy.ACM Computing Surveys.1996.
關(guān)鍵詞:樹葉識(shí)別;支持向量機(jī);卷積神經(jīng)網(wǎng)絡(luò)
中圖分類號(hào) TP18 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2016)10-0194-03
Abstract: In this paper, the convolution neural network recognition in the leaves, and the process by convolution of image visualization. Experiments show that the neural network application identification convolution leaves a 92% recognition rate. In addition , this neural network and support vector machine comparative study can be drawn from the study , convolutional neural network in either speed or accuracy better than support vector machines, visible, convolution neural network in the leaves aspect has good application prospects.
Key words recognition leaves; SVM; convolutional neural network
1 概述
樹葉識(shí)別與分類在對(duì)于區(qū)分樹葉的種類,探索樹葉的起源,對(duì)于人類自身發(fā)展、科普具有特別重要的意義。目前的樹葉識(shí)別與分類主要由人完成,但,樹葉種類成千上萬(wàn)種,面對(duì)如此龐大的樹葉世界,任何一個(gè)植物學(xué)家都不可能知道所有,樹葉的種類,這給進(jìn)一步研究樹葉帶來了困難。為了解決這一問題,一些模式識(shí)別方法諸如支持向量機(jī)(Support Vector Machine,SVM)[1],K最近鄰(k-NearestNeighbor, KNN)[2]等被引入,然而,隨著大數(shù)據(jù)時(shí)代的到來,這些傳統(tǒng)分類算法暴露出越來越多的不足,如訓(xùn)練時(shí)間過長(zhǎng)、特征不易提取等不足。
上世紀(jì)60年代開始,學(xué)者們相繼提出了各種人工神經(jīng)網(wǎng)絡(luò)[3]模型,其中卷積神經(jīng)網(wǎng)絡(luò)由于其對(duì)幾何、形變、光照具有一定程度的不變形,因此被廣泛應(yīng)用于圖像領(lǐng)域。其主要特點(diǎn)有:1)輸入圖像不需要預(yù)處理;2)特征提取和識(shí)別可以同時(shí)進(jìn)行;3)權(quán)值共享,大大減少了需要訓(xùn)練的參數(shù)數(shù)目,是訓(xùn)練變得更快,適應(yīng)性更強(qiáng)。
卷積神經(jīng)網(wǎng)絡(luò)在國(guó)內(nèi)研究才剛剛起步。LeNet-5[4]就是一種卷積神經(jīng)網(wǎng)絡(luò),最初用于手寫數(shù)字識(shí)別,本文研究將卷積神經(jīng)網(wǎng)絡(luò)LeNet-5模型改進(jìn)并應(yīng)用于樹葉識(shí)別中。本文首先介紹一下卷積神經(jīng)網(wǎng)絡(luò)和LeNet-5的結(jié)構(gòu),進(jìn)而將其應(yīng)用于樹葉識(shí)別,設(shè)計(jì)了實(shí)驗(yàn)方案,用卷積神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)的模式識(shí)別算法支持向量機(jī)(SVM)進(jìn)行比較,得出了相關(guān)結(jié)論,并對(duì)進(jìn)一步研究工作進(jìn)行了展望。
2人工神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)方面的研究很早就已開展,現(xiàn)在的人工神經(jīng)網(wǎng)絡(luò)已經(jīng)發(fā)展成了多領(lǐng)域、多學(xué)科交叉的獨(dú)立的研究領(lǐng)域。神經(jīng)網(wǎng)絡(luò)中最基本的單元是神經(jīng)元模型。類比生物神經(jīng)元,當(dāng)它“興奮”時(shí),就會(huì)向相連的神經(jīng)元發(fā)送化學(xué)物質(zhì),從而改變這些神經(jīng)元的狀態(tài)。人工神經(jīng)元模型如圖1所示:
上述就是一個(gè)簡(jiǎn)單的神經(jīng)元模型。在這個(gè)模型中,神經(jīng)元接收來自n個(gè)其他神經(jīng)元傳遞過來的輸入信號(hào),這些信號(hào)通過帶權(quán)重的w進(jìn)行傳遞,神經(jīng)元接收到的總輸入值將與神經(jīng)元的閾值進(jìn)行比較,然后通過“激活函數(shù)”來產(chǎn)生輸出。
一般采用的激活函數(shù)是Sigmoid函數(shù),如式1所示:
[σz=11+e-z] (1)
該函數(shù)圖像圖2所示:
2.1多層神經(jīng)網(wǎng)絡(luò)
將上述的神經(jīng)元按一定的層次結(jié)構(gòu)連接起來,就得到了如圖3所示的多層神經(jīng)網(wǎng)絡(luò):
多層神經(jīng)網(wǎng)絡(luò)具有輸入層,隱藏層和輸出層。由于每一層之間都是全連接,因此每一層的權(quán)重對(duì)整個(gè)網(wǎng)絡(luò)的影響都是特別重要的。在這個(gè)網(wǎng)絡(luò)中,采用的訓(xùn)練算法是隨機(jī)梯度下降算法[5],由于每一層之間都是全連接,當(dāng)訓(xùn)練樣本特別大的時(shí)候,訓(xùn)練需要的時(shí)間就會(huì)大大增加,由此提出了另一種神經(jīng)網(wǎng)絡(luò)―卷積神經(jīng)網(wǎng)絡(luò)。
2.2卷積神經(jīng)網(wǎng)絡(luò)
卷積神經(jīng)網(wǎng)絡(luò)(CNN)由于在圖像分類任務(wù)上取得了非常好的表現(xiàn)而備受人們關(guān)注。發(fā)展到今天,CNN在深度學(xué)習(xí)領(lǐng)域已經(jīng)成為了一種非常重要的人工神經(jīng)網(wǎng)絡(luò)。卷積神經(jīng)網(wǎng)絡(luò)的核心在于通過建立很多的特征提取層一層一層地從圖片像素中找出關(guān)系并抽象出來,從而達(dá)到分類的目的,CNN方面比較成熟的是LeNet-5模型,如圖4所示:
在該LeNet-5模型中,一共有6層。如上圖所示,網(wǎng)絡(luò)輸入是一個(gè)28x28的圖像,輸出的是其識(shí)別的結(jié)果。卷積神經(jīng)網(wǎng)絡(luò)通過多個(gè)“卷積層”和“采樣層”對(duì)輸入信號(hào)進(jìn)行處理,然后在連接層中實(shí)現(xiàn)與輸出目標(biāo)之間的映射,通過每一層卷積濾波器提取輸入的特征。例如,LeNet-5中第一個(gè)卷積層由4個(gè)特征映射構(gòu)成,每個(gè)特征映射是一個(gè)24x24的神經(jīng)元陣列。采樣層是基于對(duì)卷積后的“平面”進(jìn)行采樣,如圖所示,在第一個(gè)采樣層中又4的12x12的特征映射,其中每個(gè)神經(jīng)元與上一層中對(duì)應(yīng)的特征映射的2x2鄰域相連接,并計(jì)算輸出??梢?,這種局部相關(guān)性的特征提取,由于都是連接著相同的連接權(quán),從而大幅度減少了需要訓(xùn)練的參數(shù)數(shù)目[6]。
3實(shí)驗(yàn)研究
為了將LeNet-5卷積網(wǎng)絡(luò)用于樹葉識(shí)別并檢驗(yàn)其性能,本文收集了8類樹葉的圖片,每一類有40張照片,如圖5所示的一張樹葉樣本:
本文在此基礎(chǔ)上改進(jìn)了模型,使用了如圖6卷積神經(jīng)網(wǎng)絡(luò)模型:
在此模型中,第一個(gè)卷積層是由6個(gè)特征映射構(gòu)成,每個(gè)特征映射是一個(gè)28*28的神經(jīng)元陣列,其中每個(gè)神經(jīng)元負(fù)責(zé)從5*5的區(qū)域通過卷積濾波器提取局部特征,在這里我們進(jìn)行了可視化分析,如圖7所示:
從圖中可以明顯地看出,卷積網(wǎng)絡(luò)可以很好地提取樹葉的特征。為了驗(yàn)證卷積神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)分類算法之間的性能,本文基于Python語(yǔ)言,CUDA并行計(jì)算平臺(tái),訓(xùn)練同樣大小8類,一共320張的一批訓(xùn)練樣本,采用交叉驗(yàn)證的方法,得到了如表1所示的結(jié)論。
可見,無論是識(shí)別率上,還是訓(xùn)練時(shí)間上,卷積網(wǎng)絡(luò)較傳統(tǒng)的支持向量機(jī)算法體現(xiàn)出更好地分類性能。
4 總結(jié)
本文從人工神經(jīng)網(wǎng)絡(luò)出發(fā),重點(diǎn)介紹了卷積神經(jīng)網(wǎng)絡(luò)模型LeNet-5在樹葉識(shí)別上的各種研究并提取了特征且進(jìn)行了可視化,并與傳統(tǒng)分類算法SVM進(jìn)行比較。研究表明,該模型應(yīng)用在樹葉識(shí)別上較傳統(tǒng)分類算法取得了較好的結(jié)果,對(duì)收集的樹葉達(dá)到了92%的準(zhǔn)確率,并大大減少了訓(xùn)練所需要的時(shí)間。由于卷積神經(jīng)網(wǎng)絡(luò)有如此的優(yōu)點(diǎn),因此在人臉識(shí)別、語(yǔ)音識(shí)別、醫(yī)療識(shí)別、犯罪識(shí)別方面具有很廣泛的應(yīng)用前景。
本文的研究可以歸納為探討了卷積神經(jīng)網(wǎng)絡(luò)在樹葉識(shí)別上的效果,并對(duì)比了傳統(tǒng)經(jīng)典圖像分類算法,取得了較好的分類精度。
然而,本文進(jìn)行實(shí)驗(yàn)的樣本過少,當(dāng)數(shù)據(jù)集過多的時(shí)候,這個(gè)卷積神經(jīng)網(wǎng)絡(luò)算法的可行性有待我們進(jìn)一步的研究;另外,最近這幾年,又有很多不同的卷積神經(jīng)網(wǎng)絡(luò)模型出現(xiàn),我們會(huì)繼續(xù)試驗(yàn)其他的神經(jīng)網(wǎng)絡(luò)模型,力求找到更好的分類算法來解決樹葉識(shí)別的問題。
參考文獻(xiàn):
[1]Bell A, Sejnowski T. An Information-Maximization Approach to Blind Separation and Blind Deconvolution[J]. Neural Computation, 1995, 7(6):1129-59.
[2]Altman N S. An Introduction to Kernel and Nearest-Neighbor Nonparametric Regression[J]. American Statistician, 1992, 46(3):175-185.
[3]Ripley B D, Hjort N L. Pattern Recognition and Neural Networks[M]. Pattern recognition and neural networks. Cambridge University Press,, 1996:233-234.
[4]Lécun Y, Bottou L, Bengio Y, et al. Gradient-based learning applied to document recognition[J]. Proceedings of the IEEE, 1998, 86(11):2278-2324.
【關(guān)鍵詞】模糊神經(jīng)網(wǎng)絡(luò);模糊控制;模糊辨識(shí);規(guī)則抽?。粚W(xué)習(xí)算法
1 問題的提出
模糊邏輯和神經(jīng)網(wǎng)絡(luò)都適于處理那些被控對(duì)象模型難以建立或存在大的不確定性和強(qiáng)非線性的系統(tǒng). 由于神經(jīng)網(wǎng)絡(luò)在分布式處理,學(xué)習(xí)能力,魯棒性,泛化能力方面具有明顯的優(yōu)勢(shì),而模糊系統(tǒng)的優(yōu)勢(shì)在于良好的可讀性和可分析性,因此,將神經(jīng)網(wǎng)絡(luò)的思想融合到模糊辨識(shí)和模糊控制模型中就可以實(shí)現(xiàn)兩者的優(yōu)勢(shì)互補(bǔ).模糊神經(jīng)網(wǎng)絡(luò)控制針對(duì)雙方的特點(diǎn)相互借鑒和利用,比單獨(dú)的神經(jīng)網(wǎng)絡(luò)控制或單獨(dú)的模糊控制具有更好的控制性能. 隨著智能控制理論的發(fā)展,模糊神經(jīng)網(wǎng)絡(luò)控,難以實(shí)現(xiàn)系統(tǒng)的實(shí)時(shí)控制制受到控制界的廣泛關(guān)注,相繼提出了許多控制和辨識(shí)的方法.
本文總結(jié)了近期我國(guó)學(xué)者提出的幾種新的基于模糊神經(jīng)網(wǎng)絡(luò)的系統(tǒng)辨識(shí)與控制方法,并通過仿真進(jìn)行了各自特點(diǎn)的比較,希望可以通過這些比較,對(duì)這些研究加以改進(jìn)和應(yīng)用.
2 模糊神經(jīng)網(wǎng)絡(luò)
2.1 仿射非線性系統(tǒng)
為了實(shí)現(xiàn)非線性系統(tǒng)的實(shí)時(shí)控制,基于徑向基函數(shù)網(wǎng)絡(luò)與TSK 型模糊推理系統(tǒng)的函數(shù)等價(jià)的特點(diǎn),有學(xué)者提出了一種動(dòng)態(tài)模糊神經(jīng)網(wǎng)絡(luò)的在線自組織線性算法,從而實(shí)現(xiàn)了系統(tǒng)的結(jié)構(gòu)和參數(shù)的同時(shí)在線自適應(yīng). 學(xué)習(xí)速度快是這種模糊神經(jīng)網(wǎng)絡(luò)的突出特點(diǎn).在此基礎(chǔ)上,針對(duì)未知仿射非線性SISO 系統(tǒng)提出了一種在線自適應(yīng)模糊神經(jīng)網(wǎng)絡(luò)辨識(shí)與控制方法. 該方法首先采用G2FNN 學(xué)習(xí)算法實(shí)時(shí)建模系統(tǒng)的逆動(dòng)態(tài),實(shí)現(xiàn)模糊神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和參數(shù)的同時(shí)在線學(xué)習(xí). 然后,設(shè)計(jì)一個(gè)魯棒補(bǔ)償器與辨識(shí)好的模糊神經(jīng)網(wǎng)絡(luò)組成復(fù)合控制器,并基于Lyapunov 穩(wěn)定性理論設(shè)計(jì)自適應(yīng)控制律進(jìn)一步在線調(diào)整網(wǎng)絡(luò)的權(quán)值,實(shí)現(xiàn)系統(tǒng)的跟蹤控制.
控制目標(biāo)是設(shè)計(jì)一個(gè)由G2FNN 控制器和魯棒控制器構(gòu)成的模糊神經(jīng)網(wǎng)絡(luò)自適應(yīng)魯棒控制器, 使得系統(tǒng)的輸出y 跟蹤給定的參考輸入信號(hào)ym ,對(duì)于一個(gè)給定的干擾衰減水平常數(shù)ρ>0 ,獲得良好的H ∞跟蹤性能指標(biāo).
廣義模糊神經(jīng)網(wǎng)絡(luò)G2FNN 由四層網(wǎng)絡(luò)結(jié)構(gòu)組成,分別實(shí)現(xiàn)模糊邏輯的模糊化、模糊推理和解模糊化過程. 圖1 所示為單個(gè)輸出結(jié)點(diǎn)G2FNN 的結(jié)構(gòu).
圖1 G2FNN 的結(jié)構(gòu)
G2FNN 中有兩類學(xué)習(xí)算法,即結(jié)構(gòu)學(xué)習(xí)和參數(shù)學(xué)習(xí). 結(jié)構(gòu)學(xué)習(xí)是通過對(duì)每個(gè)新的訓(xùn)練數(shù)據(jù)計(jì)算出G2FNN 的輸出與期望輸出之間的偏差來決定是否產(chǎn)生新的模糊規(guī)則或刪除多余的規(guī)則; 參數(shù)學(xué)習(xí)有兩個(gè)方面,一是當(dāng)系統(tǒng)產(chǎn)生第N r+1條新的模糊規(guī)則時(shí)確定新規(guī)則前提參數(shù)ci ( N r+1) ,σi(N r+1),另一個(gè)是當(dāng)不需要進(jìn)行結(jié)構(gòu)學(xué)習(xí)時(shí)對(duì)第三層與第四層網(wǎng)絡(luò)之間的權(quán)值向量W 的調(diào)節(jié).
第一層直接將輸入語(yǔ)言變量xi(i =1,2,…Ni) 傳遞到下一層.
第二層計(jì)算輸入分量隸屬于各語(yǔ)言變量值模糊集合的隸屬度,隸屬度函數(shù)為高斯函數(shù):
式中: cij ,σij (i =1 ,2 , …, N r) 分別是第i 個(gè)輸入語(yǔ)言變量xi的第j 條隸屬度函數(shù)的中心和寬度;N r 為系統(tǒng)產(chǎn)生的規(guī)則數(shù).
第三層是規(guī)則層, 這一層的每個(gè)結(jié)點(diǎn)代表一條模糊規(guī)則,它的作用是用來匹配模糊規(guī)則的前提,每個(gè)結(jié)點(diǎn)的輸出可以表示為:
第四層是結(jié)點(diǎn)定義語(yǔ)言變量的輸出, 它的作用是用來匹配模糊規(guī)則的結(jié)論,實(shí)現(xiàn)TSK型模糊推理系統(tǒng)的解模糊化過程. 其輸出為:
這里, Wj 為第三層與第四層之間的權(quán)值.
使用倒立擺系統(tǒng)方程進(jìn)行仿真研究, 倒立擺的動(dòng)態(tài)方程為:
系統(tǒng)仿真結(jié)果如圖(圖2):
圖2 自適應(yīng)模糊神經(jīng)網(wǎng)絡(luò)控制系統(tǒng)跟蹤軌跡
由圖可知,所設(shè)計(jì)的控制器實(shí)現(xiàn)了模糊神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和參數(shù)的在線自適應(yīng),輸出跟蹤參考輸入信號(hào),系統(tǒng)的誤差收斂速度快,魯棒性好.
由仿真可見,該方法不僅實(shí)現(xiàn)了模糊控制規(guī)則的自動(dòng)產(chǎn)生和刪除,還保證了閉環(huán)系統(tǒng)的全局穩(wěn)定,并使外部干擾和模糊神經(jīng)網(wǎng)絡(luò)逼近誤差對(duì)系統(tǒng)跟蹤誤差的影響衰減到一個(gè)指定的水平.本方法不需要知道系統(tǒng)的控制增益,設(shè)計(jì)了一個(gè)魯棒補(bǔ)償器來抑制模糊神經(jīng)網(wǎng)絡(luò)逼近誤差和外部干擾的影響. 系統(tǒng)魯棒性好,抗干擾能力強(qiáng),所設(shè)計(jì)的控制器可用于系統(tǒng)的實(shí)時(shí)控制.
2.2 網(wǎng)絡(luò)參數(shù)自學(xué)習(xí)模糊控制
在模糊系統(tǒng)的許多應(yīng)用中, 如模糊推理、模糊邏輯控制器、模糊分類器等, 提取模糊規(guī)則是一個(gè)重要步驟。在新興的研究領(lǐng)域――數(shù)據(jù)挖掘中, 提取模糊規(guī)則也起著重要作用。然而模糊控制規(guī)則的獲得通過由專家經(jīng)驗(yàn)給出, 這就存在諸如控制規(guī)則不夠客觀、專家經(jīng)驗(yàn)難以獲得等問題。因此研究模糊規(guī)則的自動(dòng)生成有著重要的理論和應(yīng)用價(jià)值。在許多問題中, 希望提取出來的模糊規(guī)則能夠用語(yǔ)言變量表示, 以便揭示模糊系統(tǒng)內(nèi)部的規(guī)律, 同時(shí)這也是模糊系統(tǒng)的一個(gè)特色。為了提高抽取復(fù)雜系統(tǒng)模糊if- then 規(guī)則的質(zhì)量, 將具有極好學(xué)習(xí)能力的神經(jīng)網(wǎng)絡(luò)與模糊推理系統(tǒng)相結(jié)合, 產(chǎn)生了神經(jīng)- 模糊建模方法, 這種方法綜合了兩種形式的特點(diǎn), 提供了一種從數(shù)值數(shù)據(jù)集抽取模糊規(guī)則的有效框架。有關(guān)領(lǐng)域的研究者們提出了多種模糊邏輯與神經(jīng)網(wǎng)絡(luò)結(jié)合的方法, 給出了各種用于提取模糊if- then 規(guī)則的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)框架。
由于徑向基函數(shù)網(wǎng)絡(luò)(RBFN)以其結(jié)構(gòu)簡(jiǎn)單、良好的逼近能力、獨(dú)特點(diǎn)可分解性以及和模糊推理系統(tǒng)的函數(shù)等價(jià)性, 因此可應(yīng)用于模糊系統(tǒng)。然而, 當(dāng)一個(gè)模糊系統(tǒng)使用學(xué)習(xí)算法被訓(xùn)練之后可能會(huì)影響其可解釋性, 也就是使得模糊系統(tǒng)的可理解性下降, 而可解釋性是模糊系統(tǒng)的一個(gè)突出特點(diǎn)。為了讓模糊系統(tǒng)在具有自學(xué)習(xí)和自組織性的同時(shí)也具有可解釋性這一突出特點(diǎn), 以下提出了一種能夠有效表達(dá)模糊系統(tǒng)可解釋性RBF 網(wǎng)絡(luò)結(jié)構(gòu), 并進(jìn)行了仿真實(shí)驗(yàn), 取得較好的仿真結(jié)果。
根據(jù)測(cè)量數(shù)據(jù)采用各種神經(jīng)網(wǎng)絡(luò)自動(dòng)提取模糊規(guī)則的方法, 在輸入輸出空間劃分部分運(yùn)用的是聚類的思想, 而大多數(shù)其輸入輸出空間劃分?jǐn)?shù)( 聚類數(shù)) 是預(yù)先給定, 這不免帶有一定的盲目性, 直接影響規(guī)則的提取質(zhì)量。為此, 本文關(guān)于初始聚類中心及聚類中心個(gè)數(shù)的確定方法采用文獻(xiàn)7 提出的一種聚類神經(jīng)網(wǎng)絡(luò)初始聚類中心的確定方法。利用這種基于密度和基于網(wǎng)格的聚類方法, 能自動(dòng)地進(jìn)行樣本空間的劃分, 針對(duì)樣本空間劃分過程中不同階段的特點(diǎn), 采用了不同的處理手段, 使得該方法在樣本空間劃分?jǐn)?shù)、聚類學(xué)習(xí)時(shí)間等方面都具有比較明顯的優(yōu)越性(圖3)。
圖3 仿真實(shí)驗(yàn)結(jié)果
下面針對(duì)每個(gè)仿真曲面分別給出一組訓(xùn)練樣本點(diǎn)為500 個(gè), 評(píng)價(jià)樣本點(diǎn)為100 個(gè)的仿真結(jié)果圖, 如圖4所示:
圖4
從圖中, 可見各樣本數(shù)據(jù)的預(yù)測(cè)值與實(shí)際值吻合的比較好, 只有個(gè)別的點(diǎn)誤差較大, 這與訓(xùn)練樣本點(diǎn)的選取有關(guān)。另外, 在系統(tǒng)模型建立好后, 為了檢驗(yàn)?zāi)P偷男Ч?筆者另外又抽取幾組數(shù)據(jù)樣本作為評(píng)價(jià)樣本, 結(jié)果發(fā)現(xiàn)預(yù)測(cè)值與實(shí)際值相比, 誤差也在允許范圍內(nèi), 效果比較令人滿意。
本方法的創(chuàng)新點(diǎn)是提出了一種能夠有效表達(dá)模糊系統(tǒng)可解釋性RBF 網(wǎng)絡(luò)結(jié)構(gòu), 并給出了一種有效的提取模糊規(guī)則的算法, 這就使模糊系統(tǒng)在具有自學(xué)習(xí)和自組織性的同時(shí)也具有可解釋性這一突出特點(diǎn)。利用這種網(wǎng)絡(luò)結(jié)構(gòu)和算法進(jìn)行控制器設(shè)計(jì), 至少有以下的優(yōu)點(diǎn):
(1)模糊系統(tǒng)具有很好的可解釋性。
(2)該算法克服了RBF 中心個(gè)數(shù)選擇的隨機(jī)性,較好地解決了樣本聚類。
(3)提出的增量數(shù)據(jù)處理方法保證了網(wǎng)絡(luò)結(jié)構(gòu)能適應(yīng)不斷擴(kuò)大的數(shù)據(jù)集。
綜上所述, 這種RBF 模糊神經(jīng)網(wǎng)絡(luò)控制算法,對(duì)于研究非線性, 時(shí)變的多變量系統(tǒng), 提供了一種新的思路, 具有一定的理論意義和工程應(yīng)用價(jià)值。
2.3 其他一些方法
其他的一些最近被提出的,如基于神經(jīng)模糊網(wǎng)絡(luò)的方法,基于模糊推理網(wǎng)絡(luò)的方法(見圖5), 基于非線性自回歸滑動(dòng)平均模型等,都取得了很好的控制和辨識(shí)效果,具有有良好的發(fā)展和應(yīng)用前景.
圖5 6層神經(jīng)模糊推理網(wǎng)絡(luò)
3 總結(jié)
本文系統(tǒng)地?cái)⑹隽四壳把芯勘容^熱門的近期我國(guó)學(xué)者提出的幾種新的基于模糊神經(jīng)網(wǎng)絡(luò)的系統(tǒng)辨識(shí)與控制方法的研究成果,并簡(jiǎn)要分析了各種方法的優(yōu)缺點(diǎn). 限于篇幅,除本文介紹的幾種方法外, 還有一些研究成果沒有列出. 本文的目的是為在這方面進(jìn)行研究的學(xué)者提供一個(gè)系統(tǒng)的參考和建議.
【參考文獻(xiàn)】
[1]李佳寧,易建強(qiáng),等.一種新的基于神經(jīng)模糊推理網(wǎng)絡(luò)的復(fù)雜系統(tǒng)模糊辨識(shí)方法[J].自動(dòng)化學(xué)報(bào),2006,Vol.32,No.5.
[2]王鍇,王占林,付永領(lǐng),祁曉野. 基于PNN與FNN模型神經(jīng)網(wǎng)絡(luò)控制器設(shè)計(jì)與分析[J].北京航空航天大學(xué)學(xué)報(bào),Vol.32, No.9,2006.
[3]李曉秀,劉國(guó)榮,沈細(xì)群.仿射非線性系統(tǒng)的在線自適應(yīng)模糊神經(jīng)網(wǎng)絡(luò)辨識(shí)與控制[J].湖南大學(xué)學(xué)報(bào)(自然科學(xué)版),2006,8,33(4).
[4]李延新,李光宇,孫輝,李文.基于RBF 網(wǎng)絡(luò)的參數(shù)自學(xué)習(xí)模糊控制的研究[J].微計(jì)算機(jī)信息,2006,8,22(8).
[關(guān)鍵詞] 藥品;神經(jīng)網(wǎng)絡(luò);組合預(yù)測(cè);需求預(yù)測(cè)
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2014 . 08. 051
[中圖分類號(hào)] TP183 [文獻(xiàn)標(biāo)識(shí)碼] A [文章編號(hào)] 1673 - 0194(2014)08- 0084- 05
0 引 言
隨著人工智能技術(shù)的發(fā)展,人工神經(jīng)網(wǎng)絡(luò)得到了廣泛研究和應(yīng)用。由于神經(jīng)網(wǎng)絡(luò)具有良好的學(xué)習(xí)能力和較強(qiáng)的非線性處理能力、不依賴于特定數(shù)學(xué)模型等優(yōu)勢(shì),其作為一種預(yù)測(cè)方法已被廣泛應(yīng)用于許多領(lǐng)域。
在醫(yī)藥企業(yè)、醫(yī)藥衛(wèi)生管理領(lǐng)域,藥品需求預(yù)測(cè)一直是管理部門關(guān)心的熱點(diǎn)問題。藥品需求除了受由藥品自身屬性影響外,還受國(guó)家政策或醫(yī)藥行業(yè)規(guī)定等因素的影響,如藥品在某地區(qū)是否中標(biāo)、是否為處方藥等;同時(shí),制藥企業(yè)自身制定的定價(jià)、渠道以及促銷等營(yíng)銷策略和銷售團(tuán)隊(duì)的組建制度也對(duì)藥品需求產(chǎn)生不同程度的影響。藥品需求特征的多樣性,決定了藥品需求預(yù)測(cè)本質(zhì)上是一個(gè)復(fù)雜的非線性系統(tǒng)建模問題。
國(guó)內(nèi)外眾多學(xué)者對(duì)藥品需求預(yù)測(cè)進(jìn)行了深入的研究,產(chǎn)生了一批有價(jià)值的研究成果。目前,藥品需求預(yù)測(cè)的主要方法包括:回歸分析法、時(shí)間序列分析法、神經(jīng)網(wǎng)絡(luò)、遺傳算法等。這些方法從不同角度出發(fā)建模,均取得一定效果,尤其是BP神經(jīng)網(wǎng)絡(luò),已經(jīng)在藥品預(yù)測(cè)研究中取得了眾多應(yīng)用。盡管相關(guān)討論和研究不斷增多,但是目前常用的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)方法普遍存在以下問題:由于藥品需求特征頗為復(fù)雜的特殊性,運(yùn)用單項(xiàng)預(yù)測(cè)方法對(duì)其進(jìn)行預(yù)測(cè)無法涵蓋其較多的特征信息,通常表現(xiàn)為對(duì)某類特定的藥品預(yù)測(cè)效果良好,而對(duì)其他藥品則預(yù)測(cè)性能較差,從一定程度上限制了預(yù)測(cè)模型的適用范圍。
本文采用基于神經(jīng)網(wǎng)絡(luò)的組合預(yù)測(cè)模型來解決上述問題。組合預(yù)測(cè)方法(combined forecasting)是指通過一定數(shù)學(xué)方法將不同的單項(xiàng)預(yù)測(cè)模型組合起來,綜合利用各種單項(xiàng)預(yù)測(cè)方法所提供的信息,從而達(dá)到提高預(yù)測(cè)精度的目的。組合預(yù)測(cè)方法最早由Bates和Granger[1]于1969年提出,他們認(rèn)為對(duì)于一個(gè)包含系統(tǒng)獨(dú)立信息的單項(xiàng)預(yù)測(cè)方法,與預(yù)測(cè)精度較小的預(yù)測(cè)方法進(jìn)行組合預(yù)測(cè)完全可以增強(qiáng)系統(tǒng)的預(yù)測(cè)性能。
考慮到各種神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)方法的特點(diǎn)及其適用范圍,本文選擇BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)方法、RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)方法和基于廣義回歸神經(jīng)網(wǎng)絡(luò)(GRNN)3種常用的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)方法作為組合預(yù)測(cè)模型中的單項(xiàng)預(yù)測(cè)方法。在此基礎(chǔ)上,用平均絕對(duì)相對(duì)誤差(MAPE)和方差為衡量標(biāo)準(zhǔn),并根據(jù)設(shè)置的閾值對(duì)單項(xiàng)預(yù)測(cè)方法進(jìn)行篩選,最后選取了MAPE作為最優(yōu)準(zhǔn)則計(jì)算得到權(quán)重,從而建立組合預(yù)測(cè)模型,在提高組合預(yù)測(cè)模型精度的同時(shí),使得組合預(yù)測(cè)模型具有現(xiàn)實(shí)意義。實(shí)驗(yàn)結(jié)果表明,本文提出的模型的預(yù)測(cè)精度高于傳統(tǒng)的線性組合模型的預(yù)測(cè)精度。
1 相關(guān)工作
基于神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)方法具有很多其他預(yù)測(cè)方法所不具備的優(yōu)點(diǎn),近年來越來越被人們所關(guān)注。吳正佳 等(2010)[2]針對(duì)某備貨型企業(yè)的產(chǎn)品需求量,建立了基于良好學(xué)習(xí)能力的BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,并通過實(shí)證分析與簡(jiǎn)單移動(dòng)平滑法和加權(quán)移動(dòng)平滑法的預(yù)測(cè)結(jié)果相比較,結(jié)果表明BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果比其他兩種更為有效果。童明榮 等(2007)[3]提出一種季節(jié)性RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,對(duì)具有季節(jié)性的產(chǎn)品月度市場(chǎng)需求進(jìn)行預(yù)測(cè),最后利用構(gòu)建好的RBF神經(jīng)網(wǎng)絡(luò)模型進(jìn)行仿真實(shí)驗(yàn),并與ARIMA模型、分組回歸模型等常用季節(jié)預(yù)測(cè)模型做對(duì)比分析,結(jié)果表明前者的預(yù)測(cè)誤差均方差最小,預(yù)測(cè)精度較高。Maria Cleofé(2005)[4]利用人工神經(jīng)網(wǎng)絡(luò)(ANN)對(duì)圣保羅地區(qū)的降雨量進(jìn)行預(yù)測(cè),并通過實(shí)證分析與其他線性回歸模型作對(duì)比評(píng)價(jià),實(shí)驗(yàn)結(jié)果表明人工神經(jīng)網(wǎng)絡(luò)有著更好地預(yù)測(cè)效果。此外還有其他很多學(xué)者在交通、航運(yùn)、氣候等多個(gè)領(lǐng)域運(yùn)用神經(jīng)網(wǎng)絡(luò)進(jìn)行了預(yù)測(cè)[5-7],不在此贅述。
針對(duì)藥品銷量預(yù)測(cè)這一特定問題,國(guó)內(nèi)外部分學(xué)者也做了一定的研究工作,試圖尋找合適的預(yù)測(cè)方法對(duì)藥品需求做出較為準(zhǔn)確的預(yù)測(cè)。馬新強(qiáng) 等(2008)[8]提出了一種基于BP神經(jīng)網(wǎng)絡(luò)的藥品需求預(yù)測(cè)模型,該文先利用數(shù)據(jù)倉(cāng)庫(kù)及數(shù)據(jù)挖掘技術(shù)分析提取了相關(guān)有效的藥品銷售信息作為研究對(duì)象,在此基礎(chǔ)上利用BP神經(jīng)網(wǎng)絡(luò)對(duì)其進(jìn)行預(yù)測(cè),最后在較為精確銷售量的基礎(chǔ)上提出了一種優(yōu)化的生產(chǎn)決策系統(tǒng)方法。王憲慶 等(2009)[9]利用BP神經(jīng)網(wǎng)絡(luò)模型對(duì)藥品超市的藥品銷售情況進(jìn)行預(yù)測(cè)并做了相關(guān)實(shí)證分析,該文通過觀察藥品預(yù)測(cè)的顯著性差異評(píng)價(jià)模型的性能,最終取得了良好的效果,支持了其BP神經(jīng)網(wǎng)絡(luò)非常適用于資金有限、倉(cāng)儲(chǔ)量不大的藥品超市的結(jié)論。劉德玲(2012)[10]提出了一種針對(duì)大范圍內(nèi)的藥品銷售的預(yù)測(cè)方法。該文利用遺產(chǎn)算法優(yōu)化支持向量機(jī)藥品銷售預(yù)測(cè)方式進(jìn)行預(yù)測(cè),提高了藥品銷售預(yù)測(cè)的精確度,得到了較為滿意的結(jié)果。
盡管有關(guān)研究不斷增多,但由于藥品需求特征頗為復(fù)雜的特殊性,運(yùn)用單項(xiàng)預(yù)測(cè)方法對(duì)其進(jìn)行預(yù)測(cè)無法涵蓋其較多的特征信息,從一定程度上限制了預(yù)測(cè)模型的適用范圍。本文根據(jù)藥品需求高度非線性的特點(diǎn)選取了3種不同特性神經(jīng)網(wǎng)絡(luò)模型作為單項(xiàng)預(yù)測(cè)方法,每種神經(jīng)網(wǎng)絡(luò)都有其所針對(duì)的藥品需求特征,并在此基礎(chǔ)上建立組合預(yù)測(cè)模型,擴(kuò)大了藥品預(yù)測(cè)模型的適應(yīng)范圍,對(duì)于提高藥品預(yù)測(cè)精度和預(yù)測(cè)穩(wěn)定性具有重要意義。
2 基于神經(jīng)網(wǎng)絡(luò)的藥品需求組合預(yù)測(cè)模型的建立
基于神經(jīng)網(wǎng)絡(luò)的藥品需求組合預(yù)測(cè)模型的具體步驟如下:
(1)數(shù)據(jù)異常點(diǎn)預(yù)處理。為提高組合預(yù)測(cè)模型的適用范圍和預(yù)測(cè)精度,本文運(yùn)用基于距離的異常點(diǎn)檢測(cè)方法對(duì)存在異常點(diǎn)的藥品需求數(shù)據(jù)進(jìn)行異常點(diǎn)修復(fù),得到正常的需求數(shù)據(jù)。
(2)單項(xiàng)預(yù)測(cè)方法的選取。針對(duì)藥品需求的不同特征,選取3種不同特性的神經(jīng)網(wǎng)絡(luò)模型作為單項(xiàng)預(yù)測(cè)方法,以此作為組合預(yù)測(cè)模型單項(xiàng)預(yù)測(cè)方法的篩選基礎(chǔ)。
(3)單項(xiàng)預(yù)測(cè)方法的篩選與變權(quán)重的計(jì)算。因?yàn)椴煌幤肪邆洳煌枨筇卣?,在進(jìn)行組合預(yù)測(cè)時(shí)仍需要在已選取單項(xiàng)預(yù)測(cè)方法的基礎(chǔ)上再次篩選合適的單項(xiàng)預(yù)測(cè)方法進(jìn)行組合,以相對(duì)誤差為最優(yōu)準(zhǔn)則,通過求解二次規(guī)劃問題得到權(quán)重并按照一定的變權(quán)規(guī)則進(jìn)行變權(quán)。
(4)根據(jù)權(quán)重建立組合模型進(jìn)行預(yù)測(cè)。
2.1 藥品數(shù)據(jù)異常點(diǎn)預(yù)處理
在藥品銷售數(shù)據(jù)中,由于特殊事件(如鋪貨)等原因,個(gè)別數(shù)據(jù)會(huì)表現(xiàn)出明顯突變,導(dǎo)致藥品歷史數(shù)據(jù)存在異常點(diǎn),掩蓋了數(shù)據(jù)本身的規(guī)律。本文通過基于距離的異常點(diǎn)檢測(cè)方法和多項(xiàng)式擬合方法對(duì)藥品數(shù)據(jù)做預(yù)處理,具體處理步驟如下:
首先,選擇一個(gè)較大的數(shù)(如1010)將缺失數(shù)據(jù)補(bǔ)足,然后運(yùn)用基于距離的異常點(diǎn)檢測(cè)方法進(jìn)行檢測(cè)。第一步,對(duì)藥品需求數(shù)據(jù)進(jìn)行歸一化處理并計(jì)算出各個(gè)數(shù)據(jù)之間的距離,得到距離矩陣P。計(jì)算公式如下:
Pij=|xi-xj|,i,j=1,…,n(1)
式中,xi表示時(shí)間序列中第i期的數(shù)據(jù),Pij表示時(shí)間序列中i期數(shù)據(jù)與j期數(shù)據(jù)之差的絕對(duì)值。距離矩陣P的第i列表示時(shí)間序列第i期數(shù)據(jù)與長(zhǎng)度為n的時(shí)間序列中所有數(shù)據(jù)(包括第i期數(shù)據(jù)本身)的距離。
P=p11,p12,…,p1np21,p22,…,p2n… … … …pn1,pn2,…,pnn(2)
通過設(shè)置距離閾值d,計(jì)算出所有滿足Pij>d的距離個(gè)數(shù),記di,得到判別矩陣D。
D=[d1,d2,d3,…,dn](3)
將di與閾值f進(jìn)行比較,若大于f,則識(shí)別該點(diǎn)為異常點(diǎn),否則為正常值。最后利用多項(xiàng)式擬合方法,將檢測(cè)出來的異常點(diǎn)作擬合處理,得到建模需要的正常數(shù)據(jù)。
2.2 單項(xiàng)預(yù)測(cè)方法的選取
藥品需求預(yù)測(cè)是一個(gè)復(fù)雜的非線性系統(tǒng)建模問題,相對(duì)于傳統(tǒng)分析方法(如指數(shù)平滑方法、ARMA模型、MTV模型),神經(jīng)網(wǎng)絡(luò)依據(jù)數(shù)據(jù)本身的內(nèi)在聯(lián)系建模,具有良好的自組織、自適應(yīng)性,以及抗干擾能力以及非線性映射能力,能夠較好地解決非線性數(shù)據(jù)擬合問題。
本文選取3種具有不同特征的神經(jīng)網(wǎng)絡(luò)模型,即BP神經(jīng)網(wǎng)絡(luò)、RBF神經(jīng)網(wǎng)絡(luò)和GRNN廣義回歸神經(jīng)網(wǎng)絡(luò),綜合其各自優(yōu)勢(shì)建立組合預(yù)測(cè)模型,提升整個(gè)預(yù)測(cè)模型的泛化能力,提高預(yù)測(cè)精度與預(yù)測(cè)穩(wěn)定性。
2.2.1 基于BP神經(jīng)網(wǎng)絡(luò)的藥品需求預(yù)測(cè)方法
BP神經(jīng)網(wǎng)絡(luò)由Rumelhard和McClelland于1986年提出,它是一種典型的多層前向型神經(jīng)網(wǎng)絡(luò)。藥品銷售記錄作為BP神經(jīng)網(wǎng)絡(luò)輸入值,藥品需求預(yù)測(cè)即為BP神經(jīng)網(wǎng)絡(luò)輸出值。當(dāng)輸入節(jié)點(diǎn)數(shù)為m,輸出節(jié)點(diǎn)數(shù)為n時(shí),BP神經(jīng)網(wǎng)絡(luò)就表達(dá)了從m個(gè)自變量到n個(gè)因變量的非線性函數(shù)映射關(guān)系。
BP神經(jīng)網(wǎng)絡(luò)側(cè)重對(duì)全樣本的學(xué)習(xí),因此適合對(duì)樣本整體特征相近的時(shí)間序列進(jìn)行預(yù)測(cè),即適應(yīng)受某一特定因素影響顯著,且該影響因素相對(duì)穩(wěn)定的藥品預(yù)測(cè)。
2.2.2 基于RBF神經(jīng)網(wǎng)絡(luò)的藥品需求預(yù)測(cè)方法
徑向基函數(shù)(RBF,Radical Basis Function)由Powell于1985年首次提出,它是一種三層前饋網(wǎng)絡(luò),即輸入層、隱含層和輸出層。從輸入層到隱含層是一個(gè)非線性到線性的變換過程,從隱含層到輸出層是一個(gè)線性處理過程。RBF神經(jīng)網(wǎng)絡(luò)在處理非線性問題時(shí),引入RBF核函數(shù)將非線性空間映射到線性空間,極大地提高了非線性處理能力,且RBF神經(jīng)網(wǎng)絡(luò)采用自組織有監(jiān)督的學(xué)習(xí)算法進(jìn)行訓(xùn)練,其訓(xùn)練收斂速度具有顯著的優(yōu)勢(shì)。
RBF神經(jīng)網(wǎng)絡(luò)具有很好的非線性處理能力,其學(xué)習(xí)算法屬于局部激活性較高的高斯函數(shù),對(duì)于相似的樣本有著較高的逼近能力,因此適用于受會(huì)隨時(shí)間變化而較為顯著變化的因素影響的藥品需求預(yù)測(cè)。
2.2.3 基于GRNN的藥品需求預(yù)測(cè)方法
廣義回歸神經(jīng)網(wǎng)絡(luò)(GRNN,Generalized Regression Neural Network)由美國(guó)學(xué)者Donald F. Specht在1991年提出,它是徑向基神經(jīng)網(wǎng)絡(luò)的一種。GRNN具有很強(qiáng)的非線性映射能力和柔性網(wǎng)絡(luò)結(jié)構(gòu)以及高度的容錯(cuò)性和魯棒性,適用于解決非線性問題。
GRNN在逼近能力和學(xué)習(xí)速度上較RBF網(wǎng)絡(luò)有更強(qiáng)的優(yōu)勢(shì),網(wǎng)絡(luò)最后收斂于樣本量積聚較多的優(yōu)化回歸面,并且在樣本數(shù)據(jù)較少時(shí),預(yù)測(cè)效果也較好。此外,網(wǎng)絡(luò)還可以處理不穩(wěn)定數(shù)據(jù)。因此GRNN適用于數(shù)據(jù)不全、異常點(diǎn)較多的藥品。
綜上所述,3種神經(jīng)網(wǎng)絡(luò)都具有良好的非線性處理及預(yù)測(cè)能力,因?yàn)閷W(xué)習(xí)算法的不同有著各自側(cè)重的學(xué)習(xí)方向,皆為應(yīng)用廣泛的預(yù)測(cè)方法,且對(duì)各自適應(yīng)范圍內(nèi)有著較好的預(yù)測(cè)效果。因此本文選擇BP神經(jīng)網(wǎng)絡(luò)、RBF神經(jīng)網(wǎng)絡(luò)以及廣義回歸神經(jīng)網(wǎng)絡(luò)作為單項(xiàng)預(yù)測(cè)方法,并在此基礎(chǔ)上建立組合預(yù)測(cè)模型。
2.3 單項(xiàng)預(yù)測(cè)方法的篩選與變權(quán)系數(shù)的計(jì)算
本文在已選取3種單項(xiàng)預(yù)測(cè)方法的基礎(chǔ)上,再根據(jù)合適的MAPE和誤差方差篩選出組合模型中的單項(xiàng)預(yù)測(cè)方法,計(jì)算出變權(quán)系數(shù)。假設(shè)藥品需求的實(shí)際時(shí)間序列為y(t),t=1,2,…,N,N+1,…,N+T,其中t表示預(yù)測(cè)區(qū)間,T表示預(yù)測(cè)步長(zhǎng)。
(1)單項(xiàng)方法篩選
單項(xiàng)方法進(jìn)一步篩選的具體步驟為:
①預(yù)先設(shè)置選擇單項(xiàng)方法MAPE閾值m 和誤差方差閥值ε
②進(jìn)行逐期單步預(yù)測(cè),預(yù)測(cè)序列為:
{i(t),i=1,2,…,n;t=N+1,…,N+T}
③計(jì)算n種單項(xiàng)方法的相對(duì)誤差ei(t)、誤差方差εi(t)和MAPE。其中,單項(xiàng)預(yù)測(cè)方法的相對(duì)誤差序列為:
ei(t)=i=1,2,…,n;t=N+1,…,N+T(4)
單項(xiàng)預(yù)測(cè)方法的誤差方差為:
εi(t)=(5)
單項(xiàng)預(yù)測(cè)方法的MAPE為:
MAPEi(t)=ei(j),(i=1,2,…,n;t=N+1,…,N+T)(6)
④若MAPEi(t)
(2)變權(quán)系數(shù)的計(jì)算
本文考慮預(yù)測(cè)效果,選用基于相對(duì)誤差為最優(yōu)準(zhǔn)則的最優(yōu)加權(quán)法進(jìn)行計(jì)算。
假設(shè)從n中方法中篩選出p(p≤n)種單項(xiàng)預(yù)測(cè)方法,則組合模型第t+1期的權(quán)系數(shù)w(t+1)由相對(duì)誤差ei(1),…,ei(t)決定,其中i=1,…,p。變權(quán)規(guī)則如表1所示。
權(quán)系數(shù)具體計(jì)算過程如下:
①設(shè)組合權(quán)重wi為方法mi在組合預(yù)測(cè)方法中權(quán)重,則組合預(yù)測(cè)方法第t期相對(duì)誤差為:
e(t)=wi*ei(t),i=1,2,…,p(7)
②組合模型前t期的相對(duì)誤差平方和為:
e2=e(1)2+e(2)2+…+e(t)2(8)
令w=[w1,w2,…,wP]T,
E=e1(1),e2(1),…,ep(1)e1(2),e2(2),…,ep(2) … … … …e1(t),e2(t),…,ep(t)
建立如下目標(biāo)規(guī)劃:
min P=e2=wT*ET*E*w
s.t. wi=1(9)
③求解該目標(biāo)規(guī)劃得到變權(quán)系數(shù)w。
2.4 建立組合模型進(jìn)行預(yù)測(cè)
組合預(yù)測(cè)模型可表示為:
式中, wi(t)表示第t期單項(xiàng)方法mi的變權(quán)系數(shù),(t)表示第t期組合預(yù)測(cè)方法的預(yù)測(cè)值。根據(jù)該模型對(duì)藥品進(jìn)行預(yù)測(cè)。
3 實(shí)驗(yàn)與分析
本文以上海市某制藥企業(yè)月度銷售額為藥品需求預(yù)測(cè)的實(shí)證數(shù)據(jù),根據(jù)銷售地區(qū)的不同抽取有代表性的藥品銷售數(shù)據(jù),其中選取上海地區(qū)10種藥品,北京地區(qū)4種藥品及全區(qū)域銷售數(shù)據(jù)12種藥品,數(shù)據(jù)長(zhǎng)度皆為30(2009-1至2011-6)。
數(shù)據(jù)選擇依據(jù)如下:①藥品銷售有一定的連續(xù)性,為公司主推或在某地區(qū)主推藥品,具有代表性及預(yù)測(cè)意義;②在考慮異常點(diǎn)和數(shù)據(jù)缺失時(shí),選取異常點(diǎn)和缺失數(shù)據(jù)較少的藥品。
3.1 單項(xiàng)方法篩選和變權(quán)系數(shù)計(jì)算
根據(jù)不同銷售區(qū)域藥品需求的具體情況,設(shè)定單一省市藥品的MAPE閾值和方差閾值分別為20%和0.1;設(shè)定公司的MAPE閾值和方差閾值分別為30%和0.1。shy03和all03的單項(xiàng)預(yù)測(cè)方法選取結(jié)果如表2 所示。
利用單項(xiàng)預(yù)測(cè)方法的6期預(yù)測(cè)結(jié)果計(jì)算組合預(yù)測(cè)模型的3期權(quán)重,選相對(duì)誤差最優(yōu)準(zhǔn)則進(jìn)行權(quán)重計(jì)算,運(yùn)用MATLAB的二次規(guī)劃函數(shù)quadprog求解。變權(quán)規(guī)則及權(quán)重計(jì)算結(jié)果如表3所示。
3.2 預(yù)測(cè)模型的精度比較
本文選取平均絕對(duì)相對(duì)誤差(MAPE)和預(yù)測(cè)有效度兩個(gè)指標(biāo)來綜合評(píng)價(jià)模型的預(yù)測(cè)精度。當(dāng)MAPE越小時(shí),說明預(yù)測(cè)精度越高。然而當(dāng)實(shí)際值非常小時(shí),即使是預(yù)測(cè)值與真實(shí)值之差較小,其平均絕對(duì)相對(duì)誤差也會(huì)很大,而預(yù)測(cè)有效度能很好地避免此類問題,故我們引入預(yù)測(cè)有效度來綜合評(píng)價(jià)預(yù)測(cè)精度,預(yù)測(cè)有效度越大,預(yù)測(cè)精度越高。
用單項(xiàng)預(yù)測(cè)方法BP、RBF、GRNN與組合預(yù)測(cè)方法單一省市和全區(qū)域藥品銷售預(yù)測(cè)值的MAPE和有效度,對(duì)MAPE和有效度的情況進(jìn)行統(tǒng)計(jì)并且計(jì)算MAPE和有效度的平均值,比較結(jié)果如表4所示。
可以看出,運(yùn)用組合預(yù)測(cè)方法對(duì)單一省市的14種藥品進(jìn)行需求預(yù)測(cè)時(shí),MAPE小于標(biāo)準(zhǔn)值20%的有8個(gè),占藥品總數(shù)的57.14%,優(yōu)于BP(7)、RBF(4)、GRNN(6)方法;14種藥品的MAPE平均值為19.81%,優(yōu)于BP(26.71%)、RBF(28.45%)、GRNN(40.59%)方法。預(yù)測(cè)有效度大于標(biāo)準(zhǔn)值0.5的有11個(gè),占藥品總數(shù)的78.57%,優(yōu)于BP(8)、RBF(10)、GRNN(8)方法;14種藥品的預(yù)測(cè)有效度平均值為0.62,優(yōu)于BP(0.57)、RBF(0.61)、GRNN(0.57)方法。
此外,運(yùn)用組合預(yù)測(cè)方法對(duì)全區(qū)域銷售的12種藥品進(jìn)行需求預(yù)測(cè)時(shí),MAPE小于標(biāo)準(zhǔn)值30%的有7個(gè),占藥品總數(shù)的58.33%,優(yōu)于BP(4)、RBF(6)、GRNN(3)方法;12種藥品的MAPE平均值為25.22%,優(yōu)于BP(35.90%)、RBF(32.07%)、GRNN(70.59%)方法。預(yù)測(cè)有效度大于標(biāo)準(zhǔn)值0.45的有10個(gè),占藥品總數(shù)的83.33%,優(yōu)于BP(7)、RBF(9)、GRNN(5)方法;12種藥品的預(yù)測(cè)有效度平均值為0.58,優(yōu)于BP(0.46)、RBF(0.56)、GRNN(0.49)方法。
通過上述實(shí)證結(jié)果,從整體上看,組合預(yù)測(cè)方法的預(yù)測(cè)精度優(yōu)于單項(xiàng)預(yù)測(cè)方法,而且模型的適用范圍較廣。
3.3 預(yù)測(cè)模型的穩(wěn)定性比較
本文選擇預(yù)測(cè)誤差的方差作為評(píng)價(jià)模型穩(wěn)定性的指標(biāo)。將單項(xiàng)預(yù)測(cè)方法BP、RBF、GRNN與組合預(yù)測(cè)方法的誤差方差進(jìn)行比較,單一省市和全區(qū)域的比較結(jié)果如表5所示。
可以看出,運(yùn)用組合預(yù)測(cè)方法對(duì)單一省市的14種藥品進(jìn)行需求預(yù)測(cè)時(shí),誤差方差小于標(biāo)準(zhǔn)值0.1的有12種,占藥品總數(shù)的85.71%,優(yōu)于BP(10)、RBF(11)、GRNN(10)方法;此外,14種藥品誤差方差平均值為0.0263,優(yōu)于BP(0.0613)、RBF(0.0361)、GRNN(0.0522)方法。運(yùn)用組合預(yù)測(cè)方法對(duì)全區(qū)域銷售的12種藥品進(jìn)行需求預(yù)測(cè)時(shí),誤差方差小于標(biāo)準(zhǔn)值0.1的有11個(gè),占總數(shù)的91.67%,優(yōu)于BP(9)、RBF(10)、GRNN(8)方法,此外,14種藥品的誤差方差平均值為0.031 0,優(yōu)于BP(0.092 7)、RBF(0.033 5)、GRNN(0.065 0)方法。因此從整體上看,組合預(yù)測(cè)方法的預(yù)測(cè)穩(wěn)定性優(yōu)于單項(xiàng)預(yù)測(cè)方法。
4 總結(jié)及展望
本文選擇3種具有不同適應(yīng)特征的神經(jīng)網(wǎng)絡(luò)模型作為單項(xiàng)預(yù)測(cè)方法,建立了基于神經(jīng)網(wǎng)絡(luò)的藥品需求組合預(yù)測(cè)模型,以上海市某藥企的實(shí)際銷售數(shù)據(jù)作為實(shí)證對(duì)象,驗(yàn)證了該模型在預(yù)測(cè)精度和預(yù)測(cè)穩(wěn)定性上均優(yōu)于單項(xiàng)預(yù)測(cè)方法。當(dāng)然,雖然建立的神經(jīng)網(wǎng)絡(luò)組合模型在一定程度上彌補(bǔ)了現(xiàn)有方法的不足,擴(kuò)大了預(yù)測(cè)方法的適用范圍,但在研究過程中依然存在亟待解決的問題:
(1)單項(xiàng)預(yù)測(cè)方法的參數(shù)優(yōu)化有待進(jìn)一步研究。本文在參數(shù)優(yōu)化時(shí),大部分采用遍歷法和經(jīng)驗(yàn)法進(jìn)行設(shè)置,缺乏相應(yīng)理論依據(jù)和方法指導(dǎo)。如何采用合適參數(shù)尋優(yōu)方法進(jìn)行參數(shù)確定是下一步亟待解決的問題。
(2)進(jìn)行組合預(yù)測(cè)時(shí),選擇合適的最優(yōu)準(zhǔn)則有待于進(jìn)一步研究。本文選取相對(duì)誤差作為最優(yōu)準(zhǔn)則進(jìn)行需求預(yù)測(cè),該準(zhǔn)則的選取忽視了量綱統(tǒng)一性,未來的研究應(yīng)該綜合考慮量綱統(tǒng)一、預(yù)測(cè)誤差和預(yù)測(cè)穩(wěn)定性,使組合預(yù)測(cè)方法更科學(xué)、更合理。
主要參考文獻(xiàn)
[1]J M Bates,C W J Granger.The Combination of Forecasts[J]. Operations Research Quarterly,1969,20(4):451-468.
[2]吳正佳,王文,周進(jìn).BP神經(jīng)網(wǎng)絡(luò)在備貨型企業(yè)銷售預(yù)測(cè)中的應(yīng)用[J].工業(yè)工程,2010(1):105-108.
[3]童明榮,薛恒新,劉路冰.基于季節(jié)性RBF神經(jīng)網(wǎng)絡(luò)的月度市場(chǎng)需求預(yù)測(cè)研究[J].運(yùn)籌與管理,2007(3),146-150.
[4]Maria Cleofé,R Valverde.Artificial Neural Network Technique for Rainfall Forecasting Applied to the S?觔o Paulo Region[J].Journal of Hydrology,2005,1(20):146-162.
[5]A A Khan,K E Marion,C Bil. The Prediction of Ship Motions and Attitudes Using Artificial Neural Networks[C].19th National Conference of the Australian Society for Operations Research, Melbourne, Victoria, 2007.
[6]D C Park,El-Sharkawi.Electric Load Forecasting Using an Artificial Neural Network[J].IEEE Transaction on Power Systems, 1991, 6(2):442-449.
[7]Maria Cleofé, Valverde Ramírez.Artificial Neural Network Technique for Rainfall Forecasting Applied to the S?觔o Paulo Region[J]. Journal of Hydrology , 2005, 301(20):146-162.
[8]馬新強(qiáng),黃羿.基于BP神經(jīng)網(wǎng)絡(luò)的藥品銷售預(yù)測(cè)模型設(shè)計(jì)[J].重慶文理學(xué)院學(xué)報(bào),2008(2):64-66.
神經(jīng)科研究 神經(jīng)內(nèi)科論文 神經(jīng)網(wǎng)絡(luò)論文 神經(jīng)外科論文 神經(jīng)網(wǎng)絡(luò)技術(shù) 紀(jì)律教育問題 新時(shí)代教育價(jià)值觀
部級(jí)期刊 審核時(shí)間1-3個(gè)月
中山大學(xué)腫瘤防治中心;中國(guó)抗癌協(xié)會(huì)神經(jīng)腫瘤專業(yè)委員會(huì)