在线观看av毛片亚洲_伊人久久大香线蕉成人综合网_一级片黄色视频播放_日韩免费86av网址_亚洲av理论在线电影网_一区二区国产免费高清在线观看视频_亚洲国产精品久久99人人更爽_精品少妇人妻久久免费

首頁 > 文章中心 > 卷積神經(jīng)網(wǎng)絡(luò)實現(xiàn)過程

卷積神經(jīng)網(wǎng)絡(luò)實現(xiàn)過程

前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇卷積神經(jīng)網(wǎng)絡(luò)實現(xiàn)過程范文,相信會為您的寫作帶來幫助,發(fā)現(xiàn)更多的寫作思路和靈感。

卷積神經(jīng)網(wǎng)絡(luò)實現(xiàn)過程

卷積神經(jīng)網(wǎng)絡(luò)實現(xiàn)過程范文第1篇

關(guān)鍵詞:手寫數(shù)字識別;卷積神經(jīng)網(wǎng)絡(luò);應(yīng)用

手寫體數(shù)字識別在郵政、金融等領(lǐng)域應(yīng)用廣泛。對于數(shù)字識別,人們往往要求識別器有很高的識別可靠性,數(shù)字識別的錯誤所帶來的影響比文字識別等其他識別所帶來的影響更大,特別是有關(guān)金融方面的數(shù)字識別錯誤所帶來的后果是無法想象的,識別錯一個數(shù)字,這其中的差距可能是幾的差距,也可能是幾十、幾百的差距,這些都還是小問題;但更有可能這一個數(shù)字代表的差距是幾萬、幾千萬甚至幾億乃至更多,那么這個錯誤造成的損失就無法估量了。因此,O計出有著高可靠性與高識別率的數(shù)字識別系統(tǒng)已經(jīng)成為了字符識別領(lǐng)域一個非常重要的環(huán)節(jié)。

1 網(wǎng)絡(luò)模型和數(shù)據(jù)庫及學(xué)習(xí)算法的選擇

1.1 關(guān)于Mnist數(shù)據(jù)庫的介紹

首先,Mnist是NIST數(shù)據(jù)庫的一個優(yōu)化子集。它是一個有著60000個訓(xùn)練樣本集與10000個測試樣本集的手寫體數(shù)字數(shù)據(jù)庫。此數(shù)字庫一共有4個文件。

此數(shù)字庫的所有樣本集都有圖像文件以及標簽文件。標簽文件的作用是用來儲存樣本集中的每個樣本的數(shù)值標簽,而每一個樣本的圖像數(shù)據(jù)信息則是由圖像文件存儲著。此數(shù)據(jù)庫的圖像數(shù)據(jù)均保存在二進制文件之中,且每個樣本圖像的大小均為28*28。

1.2 數(shù)字識別的模型選擇

手寫體數(shù)字雖然只有0~9十個數(shù)字,但由于寫法因人而異,不同地域同樣一個數(shù)字有多種不同的寫法,每個人都有自己的書寫習(xí)慣。且一些紙質(zhì)差異、筆畫粗細、光線問題、位置、尺度大小等等多種因素都能對輸入產(chǎn)生影響??紤]到這些因素,為讓網(wǎng)絡(luò)有良好的識別能力,我們這里采用在圖像識別領(lǐng)域有著優(yōu)秀表現(xiàn)的卷積神經(jīng)網(wǎng)絡(luò)作為此數(shù)字識別系統(tǒng)的訓(xùn)練模型。

1.3 學(xué)習(xí)算法的選擇

一個優(yōu)秀的網(wǎng)絡(luò)模型必須具備良好的學(xué)習(xí)算法,每個學(xué)習(xí)網(wǎng)絡(luò)都有著相對來說較為合適自己的學(xué)習(xí)算法,而并不是說越高端的算法就越好。在此文中,我選擇的學(xué)習(xí)算法是較為成熟的BP算法。此算法在文字前面有些許介紹,此處不再多做說明。

2 基于卷積神經(jīng)網(wǎng)絡(luò)的數(shù)字識別系統(tǒng)的設(shè)計

2.1 輸入層以及輸出層設(shè)定

根據(jù)樣本的特征與此網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu),可以大概判斷出輸入層與輸出層該如何設(shè)置。隱含層的個數(shù)可以是一個,也可以是多個,這與要分類的問題有關(guān)。

前文提及到在mnist數(shù)據(jù)庫中,所有的圖像都是28*28大小的,且以整個圖片的像素形式存儲在數(shù)據(jù)文件之中。每張圖像大小為28*28,故一個圖片像素點個數(shù)為784個。這里,卷積神經(jīng)網(wǎng)絡(luò)的輸入即為這784個像素點。

因為數(shù)字識別需要識別的是0~9這十個數(shù)字,即需要識別十種字符類別,所以將這個神經(jīng)網(wǎng)絡(luò)輸出層的神經(jīng)元節(jié)點數(shù)設(shè)置為10。

2.2 網(wǎng)絡(luò)的中間層設(shè)置

卷積神經(jīng)網(wǎng)絡(luò)的中間層有兩個部分,即卷積層(特征提取層)與下采樣層(特征映射層),由第二章中圖2-1所示,C1、C3為卷積層,S2、S4為降采樣層。

1)激活函數(shù)選擇

激活函數(shù)選擇sigmoid函數(shù)。同樣,在第二章有所提及。Sigmoid函數(shù)是嚴格遞增函數(shù),能較好的平衡線性與非線性之間的行為,比較貼近生物神經(jīng)元的工作。相比于其他函數(shù),sigmoid函數(shù)還存在著許多優(yōu)勢,比如光滑性、魯棒性以及它的導(dǎo)數(shù)可以用它自身來表示。

sigmoid函數(shù)為:

(1)

其中,x為神經(jīng)元凈輸入。

激活函數(shù)導(dǎo)數(shù)為:

(2)

2)卷積層設(shè)計

圖像經(jīng)過卷積核對特征圖進行卷積,之后再經(jīng)過sigmoid函數(shù)處理在卷積層得到特征映射圖。特征映射圖相比于原圖像,其特征更為明顯突出。

卷積運算其實就是一個加權(quán)求和的過程。離散卷積是本文所選取的方法,規(guī)定卷積核在水平和豎直兩個方向每次都是移動一個像素,即卷積的步長為1。

3)下采樣層的設(shè)計

根據(jù)圖像局部相關(guān)性這一原理,為了降低網(wǎng)絡(luò)的學(xué)習(xí)維度、減少需要處理的數(shù)據(jù)量且保留圖像的有用信息,可以對卷積后的圖像進行下采樣。這里,我們采取的是取卷積層4個像素點平均值為下采樣層的一個像素點的方法。這樣可以降低網(wǎng)絡(luò)規(guī)模。

2.3 網(wǎng)絡(luò)總體結(jié)構(gòu)CNN-0

根據(jù)LeNet-5結(jié)構(gòu),再結(jié)合上文中的對輸入層、輸出層、中間層的設(shè)計,完成了如圖3-1所示的基本網(wǎng)絡(luò)結(jié)構(gòu):

相比于LeNet-5,CNN-0做了一些修改,并非完全按照LeNet-5網(wǎng)絡(luò)結(jié)構(gòu)模型。Sigmoid函數(shù)是本網(wǎng)絡(luò)中的激活函數(shù),選擇這個函數(shù)的好處在于可以讓所有層得到的輸出都在區(qū)間[-1,1]之內(nèi)。網(wǎng)絡(luò)訓(xùn)練的學(xué)習(xí)率固定值為1或者是衰減的學(xué)習(xí)速率。經(jīng)過卷積后的一維向量與輸出層沒有沿用LeNet-5的徑向基函數(shù)網(wǎng)絡(luò),而是采取全連接方式,省去了F6層。

3.3 卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程

在模式識別中,學(xué)習(xí)網(wǎng)絡(luò)有無指導(dǎo)學(xué)習(xí)網(wǎng)絡(luò)與有指導(dǎo)學(xué)習(xí)網(wǎng)絡(luò)兩個類別。無指導(dǎo)學(xué)習(xí)網(wǎng)絡(luò)一般是用來進行聚類分析,本文采取的是有指導(dǎo)學(xué)習(xí)網(wǎng)絡(luò)。

卷積神經(jīng)網(wǎng)絡(luò)其實就是從輸入到輸出的一種映射,它可以學(xué)量的映射關(guān)系,只需要用現(xiàn)有的模式對網(wǎng)絡(luò)進行訓(xùn)練,網(wǎng)絡(luò)就能具備映射能力。而不需要輸入與輸出之間的精確的關(guān)系。

訓(xùn)練算法與傳統(tǒng)的BP算法相差無幾(BP算法在第二章有做概述),主要可分為四個步驟,而這四個步驟可以歸為向前傳播階段與向后傳播階段:相前傳播:

1)隨機的從樣本集中獲取一個樣本(A, ),然后將A輸入至網(wǎng)絡(luò)中;

2)根據(jù)公式(3)計算出實際輸出:

(3)

向后傳播:

1)計算和理想輸出之間的差;

2)根據(jù)極小化誤差方法調(diào)整權(quán)值矩陣。

結(jié)語

在手寫數(shù)字識別這一塊,相對來說比較有難度的應(yīng)該就是脫機自由手寫字符識別了,不過本文所研究的并不是這一系統(tǒng),本設(shè)計是一個基于卷積神經(jīng)網(wǎng)絡(luò)的手寫數(shù)字識別系統(tǒng),因卷積神經(jīng)網(wǎng)絡(luò)的局部感受野和降采樣以及權(quán)值共享、隱性特征提取等優(yōu)點,它在圖像識別領(lǐng)域得到了非常廣泛的應(yīng)用。此程序是在Caffe這個框架上進行運行的,操作系統(tǒng)為Linux系統(tǒng)ubuntu14.04版本。Caffe是一個開源的深度學(xué)習(xí)框架,也可以說是一個編程框架或者模板框架,它提供一套編程機制。因此,本文所需要實際的卷積神經(jīng)網(wǎng)絡(luò)就可以根據(jù)這個框架來進行構(gòu)建。

參考文獻:

[1]張偉,王克儉,秦臻.基于神經(jīng)網(wǎng)絡(luò)的數(shù)字識別的研究[J].微電子學(xué)與計算,2006年第23卷第8期.

卷積神經(jīng)網(wǎng)絡(luò)實現(xiàn)過程范文第2篇

【關(guān)鍵詞】視頻 行為識別 檢測

近年來,各種視頻監(jiān)控越來越深入我們的生活中。因其實時性、直觀性以及設(shè)備成本日益降低在各行各業(yè)中而倍受青睞。但視頻監(jiān)控系統(tǒng)還是依靠人工來控制,沒有進入數(shù)字化的全天實時監(jiān)測、智能分析圖像數(shù)據(jù)。要實現(xiàn)完全數(shù)字化的監(jiān)控的關(guān)鍵在于人體行為的智能識別。

早些時候有人提出并且應(yīng)用了智能圖像識別的卷積神經(jīng)網(wǎng)絡(luò),它是在原始的輸入中應(yīng)用可訓(xùn)練的濾波器和局部鄰域池化操作,來得到一個分級的且逐漸復(fù)雜的特征表示。實踐表示,采用合適的規(guī)則化項來訓(xùn)練,它可以達到非常好的效果。比較好的地方是對姿勢、光照和復(fù)雜背景存在不變性,單只受限在2D輸入的舞臺。本文文章提出了一個新的3D卷積神經(jīng)網(wǎng)絡(luò)模型,用于運動識別。該模型可以從空間和時間的維度提取特征,然后進行3D卷積,以捕捉從多個連續(xù)幀得到的運動信息。為了有效的綜合運動信息,文中通過在卷積神經(jīng)網(wǎng)絡(luò)的卷積層進行3D卷積,以捕捉空間上、時間上的維度,讓其都具有區(qū)分性的特征。

3D卷積是通過堆疊多個連續(xù)的幀組成一個立方體,然后在立方體中運用3D卷積核。在其中,卷積層中每一個特征map都會與上一層中多個鄰近的連續(xù)幀相連,以捕捉運動信息。一個卷積map的某一位置的值是通過卷積上一層的三個連續(xù)的幀的同一個位置的局部感受得到的。要強調(diào)的是:3D卷積核只能從cube中提取一種類型的特征,因為在整個cube中卷積核的權(quán)值都是一樣的,也就是共享權(quán)值,都是同一個卷積核??梢圆捎枚喾N卷積核,以提取多種特征。有一個通用的設(shè)計規(guī)則就是:在后面的層(離輸出層近的)特征map的個數(shù)應(yīng)該增加,這樣就可以從低級的特征maps組合產(chǎn)生更多類型的特征。本文中的3D 卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)包含一個硬連線hardwired層、3個卷積層、2個下采樣層和一個全連接層。每個3D卷積核卷積的立方體是連續(xù)7幀,每幀patch大小是60x40。

在第一層,應(yīng)用了一個固定的hardwired的核去對原始的幀進行處理,產(chǎn)生多個通道的信息,然后對多個通道分別處理。最后再將所有通道的信息組合起來得到最終的特征描述。這個實線層實際上是編碼對特征的先驗知識,這比隨機初始化性能要好。

每幀提取五個通道的信息,分別是:灰度、x和y方向的梯度,x和y方向的光流。其中,前面三個都可以每幀都計算。然后水平和垂直方向的光流場需要兩個連續(xù)幀才確定。所以是7x3 + (7-1)x2=33個特征maps。然后用一個7x7x3的3D卷積核(7x7在空間,3是時間維)在五個通道的每一個通道分別進行卷積。為了增加特征map的個數(shù)(實際上就是提取不同的特征),在每一個位置都采用兩個不同的卷積核,這樣在C2層的兩個特征maps組中,每組都包含23個特征maps。23是(7-3+1)x3+(6-3+1)x2前面那個是:七個連續(xù)幀,其灰度、x和y方向的梯度這三個通道都分別有7幀,然后水平和垂直方向的光流場都只有6幀。54x34是(60-7+1)x(40-7+1)。

在緊接著的下采樣層S3層max pooling,在C2層的特征maps中用2x2窗口進行下采樣,這樣就會得到相同數(shù)目但是空間分辨率降低的特征maps。下采樣后,就是27x17=(52/2)*(34/2)。 C4是在5個通道中分別采用7x6x3的3D卷積核。為了增加特征maps個數(shù),在每個位置都采用3個不同的卷積核,這樣就可以得到6組不同的特征maps,每組有13個特征maps。13是((7-3+1)-3+1)x3+((6-3+1)-3+1)x2前面那個是:七個連續(xù)幀,其灰度、x和y方向的梯度這三個通道都分別有7幀,然后水平和垂直方向的光流場都只有6幀。21x12是(27-7+1)x(17-6+1)。

S5層用的是3x3的下采樣窗口,所以得到7x4. 到這個階段,時間維上幀的個數(shù)已經(jīng)很小了。在這一層,只在空間維度上面卷積,這時候使用的核是7x4,然后輸出的特征maps就被減小到1x1的大小。而C6層就包含有128個特征map,每個特征map與S5層中所有78(13x6)個特征maps全連接,這樣每個特征map就是1x1,也就是一個值了,而這個就是最終的特征向量了。

經(jīng)過多層的卷積和下采樣后,每連續(xù)7幀的輸入圖像都被轉(zhuǎn)化為一個128維的特征向量,這個特征向量捕捉了輸入幀的運動信息。輸出層的節(jié)點數(shù)與行為的類型數(shù)目一致,而且每個節(jié)點與C6中這128個節(jié)點是全連接的。采用一個線性分類器來對這128維的特征向量進行分類,實現(xiàn)行為識別。模型中所有可訓(xùn)練的參數(shù)都是隨機初始化的,然后通過在線BP算法進行訓(xùn)練。

3D 卷積神經(jīng)網(wǎng)絡(luò)模型的輸入被限制為一個少的連續(xù)視頻幀,因為隨著輸入窗口大小的增加,模型需要訓(xùn)練的參數(shù)也會增加。當然有些人的行為是跨越很多幀的,所以在3D 卷積神經(jīng)網(wǎng)絡(luò)模型中,有必要捕捉這種高層的運動信息。需要用大量的幀來計算運動特征,然后把這些運動特征作為輔助輸出去規(guī)則化3D 卷積神經(jīng)網(wǎng)絡(luò)模型。

對于每一個需要訓(xùn)練的行為,提取其長時間的行為信息,作為其高級行為特征。這個運動信息因為時間夠長,所以要比卷積神經(jīng)網(wǎng)絡(luò)的輸入幀的立方體包含的信息要豐富很多。然后我們就迫使卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)一個非常接近這個特征的特征向量。這可以通過在卷積神經(jīng)網(wǎng)絡(luò)的最后一個隱層再連接一系列的輔助輸出節(jié)點,然后訓(xùn)練過程中,使提取的特征更好的逼近這個計算好的高層的行為運動特征向量。

試驗中,在原始的灰度圖像中計算稠密sift描述子,然后通過這些sift描述子和運動邊緣歷史圖像(MEHI)組合構(gòu)造bag-of-words特征作為輔助特征。 因為灰度圖保留了外觀信息,運動邊緣歷史圖像只關(guān)心形狀和運動模式,所以可以提取這兩個互補的信息作為兩個連續(xù)幀的局部特征bag。先簡單的計算兩幀間的差分,這樣就可以保留運動信息,然后對其執(zhí)行一次Canny邊緣檢測,這樣可以使得觀測圖像更加清楚簡潔。最總的運動邊緣圖像就是將歷史的這些圖像乘以一個遺忘因子再累加起來得到。

本文中,構(gòu)造不同的3D 卷積神經(jīng)網(wǎng)絡(luò)模型,它可以從輸入捕捉潛在的互補信息,然后在預(yù)測階段,每個模型都針對一個輸入得到對應(yīng)的輸出,然后再組合這些輸出得到最終的結(jié)果。

作者簡介:

卷積神經(jīng)網(wǎng)絡(luò)實現(xiàn)過程范文第3篇

關(guān)鍵詞:卷積神經(jīng)網(wǎng)絡(luò);反向傳播算法;仿射變換;sloth;python;theano

中圖分類號:TP391.41 文獻標識碼:A 文章編號:1007-9416(2017)04-0096-02

隨著環(huán)保壓力的增大,各國已經(jīng)開始利用攝像頭來監(jiān)控漁船的捕撈活動,并運用機器學(xué)習(xí)技術(shù)來對漁船捕獲的魚類圖像進行自動的識別與分類從而扼制非法的捕撈。

目前計算機性能的飛速發(fā)展、圖像數(shù)據(jù)采集設(shè)備的廉價與普及促進了機器學(xué)習(xí)理論與方法的發(fā)展,數(shù)據(jù)科學(xué)家已經(jīng)可以構(gòu)建復(fù)雜的機器學(xué)習(xí)模型并利用從廉價的數(shù)碼攝像頭設(shè)備采集到大量的數(shù)據(jù)快速的訓(xùn)練模型。吳一全等[1]采用了手動選擇特征的方法, 基于支持向量機對5種魚進行識別,各類魚的識別精度平均為83.33%。萬鵬等[2]計算魚的長軸方向各段的平均寬度與長度的比值并將其作為特征參數(shù),利用3層BP(back propagation)神經(jīng)網(wǎng)絡(luò)對鯽魚和鯉魚進行識別,識別精度為92.50%。但是這些方法都是基于手動選擇特征的機器學(xué)習(xí)方法,手動選擇特征的方法基于人的經(jīng)驗選擇特征, 會導(dǎo)致遺漏重要的特征, 導(dǎo)致分類準確率低。深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)能在訓(xùn)練過程中自動學(xué)到“好”特征,避免了手動選擇特征。本次研究采用了基于VGG16的卷積神經(jīng)網(wǎng)絡(luò)(CNN)來進行魚類分類,并運用了數(shù)據(jù)集擴增方法,dropout方法, batch normalization方法來降低模型的過擬合。但是原始數(shù)據(jù)集背景干擾很大,船上的人、物體和甲板上捕獲的魚類糅合在一起,直接采用原始數(shù)據(jù)集訓(xùn)練會導(dǎo)致訓(xùn)練出的模型穩(wěn)定性不好。

基于上述分析,本文從原始數(shù)據(jù)出發(fā),設(shè)計了一種目標檢測方法,即在原始訓(xùn)練數(shù)據(jù)已經(jīng)有魚類類別標簽的基礎(chǔ)上,再標注上一層表示魚類在圖片中坐標位置的標簽,然后利用這些二次標注過的數(shù)據(jù)訓(xùn)練模型,就可得到一個既能預(yù)測魚在圖片中的坐標位置又能預(yù)測魚的分類的糅合模型。因為這兩種預(yù)測網(wǎng)絡(luò)在卷積層共同訓(xùn)練一套濾波器,所以在訓(xùn)練濾波器預(yù)測魚的坐標位置時,訓(xùn)練完成的濾波器便能在另一方面輔助預(yù)測魚的分類,使特征提取只專注于魚的坐標區(qū)域,這樣就有效的排除了背景干擾。實驗結(jié)果顯示此模型具有很高的識別精度和魯棒性,能在背景干擾很強的圖片數(shù)據(jù)集上準確的完成魚類的識別和分類。

1 模型構(gòu)建

實驗數(shù)據(jù)來源于某組織舉辦的圖像識別競賽。數(shù)據(jù)通過固定在漁船某個位置的攝像頭采集,通過采集甲板上捕獲的魚類照片,共采集到3777張共8個分類的照片作為訓(xùn)練樣本,分別為長鰭金槍魚、大眼金槍魚、黃鰭金槍魚、鰍魚、月魚、鯊魚、其他、無魚類(表示沒有魚出現(xiàn)在照片里)。按一定比例做分層采樣,其中2984張用作訓(xùn)練集,394張用作驗證集,399張用作測試集。訓(xùn)練集用經(jīng)過錯切幅度值為0.15的仿射變換作數(shù)據(jù)集擴增來降低過擬合,因為在從原始數(shù)據(jù)集上分層采樣得來的小樣本數(shù)據(jù)集上驗證顯示當錯切幅度值等于0.15時,模型在測試集上的分類精度最高。

在訓(xùn)練集上采用sloth@款圖片標注工具手動標注魚類在圖片中的位置,并把這些標注結(jié)果和已有的魚類分類標注結(jié)果當做輸入數(shù)據(jù)和圖片數(shù)據(jù)一起傳給模型訓(xùn)練。

本次研究的神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)如圖1所示。卷積層采用了被廣泛使用在圖像分類任務(wù)中的VGG模型的卷積濾波器的權(quán)重[3],并在其模型上作微調(diào)來實現(xiàn)本次研究的目標。

輸入層將不同尺寸的圖片統(tǒng)一轉(zhuǎn)換成244*244大小。

匯合層(max pooling)是指取一小塊像素區(qū)域的像素最大值,作用是可減少數(shù)據(jù)量,控制過擬合。

全連接層的權(quán)重采用反向傳播算法(back propagation)訓(xùn)練,參數(shù)尋優(yōu)采用隨機梯度下降方法。動態(tài)學(xué)習(xí)率設(shè)定方法采用了 Adam方法,可根據(jù)損失函數(shù)在迭代訓(xùn)練中產(chǎn)生的信息自動調(diào)整學(xué)習(xí)率。

激活層函數(shù)采用RELU方法,公式為。最后一層預(yù)測魚類分類的激活曾需要把對應(yīng)于各個分類的分數(shù)值轉(zhuǎn)換成總和為1的對應(yīng)于各個分類的概率值,所以激活函數(shù)采用Softmax方法,公式如下

由于卷積神經(jīng)網(wǎng)絡(luò)網(wǎng)絡(luò)強大的表示能力,為了降低模型的過擬合以及加快模型的訓(xùn)練速度,本次工作在激活曾后面再依次加入一層dropout層和batch normalization層。dropout層是指隨機的舍棄一部分激活曾神經(jīng)元的值,并將其置為0[4]。batch normalization層是指規(guī)范化每層激活層的輸出,并加入4個規(guī)范化參數(shù)來抑制模型訓(xùn)練過程中的反規(guī)范化現(xiàn)象[5]。

2 程序?qū)崿F(xiàn)

具體的軟件實現(xiàn)采用python編程語言和keras框架平臺。keras底層采用輕量易用的theano框架,并依賴計算機的顯卡來進行更快速的訓(xùn)練工作。整個圖像分類的軟件框架主要由4部分組成,分別是輸入圖像數(shù)據(jù)處理、模型各個網(wǎng)絡(luò)層的實現(xiàn)及拼接、模型編譯、模型訓(xùn)練及預(yù)測。下面按數(shù)據(jù)在模型中流動的順序具體的闡述各個部分的程序?qū)崿F(xiàn)。

2.1 輸入圖像數(shù)據(jù)處理

卷積神經(jīng)網(wǎng)絡(luò)實現(xiàn)過程范文第4篇

關(guān)鍵詞:人機大戰(zhàn);人工智能;發(fā)展前景

中圖分類號:TP391 文獻標識碼:A

0.引言

2016年3月15日,備受矚目的“人機大戰(zhàn)”終于落下帷幕,最終Google公司開發(fā)的“AlphaGo”以4∶1戰(zhàn)勝了韓國九段棋手李世h。毫無疑問,這是人工智能歷史上一個具有里程碑式的大事件。大家一致認為,人工智能已經(jīng)上升到了一個新的高度。

這次勝利與1997年IBM公司的“深藍”戰(zhàn)勝國際象棋世界冠軍卡斯帕羅不同。主要表現(xiàn)在兩個方面:

(1)AlphaGo的勝利并非僅僅依賴強悍的計算能力和龐大的棋譜數(shù)據(jù)庫取勝,而是AlphaGo已經(jīng)擁有了深度學(xué)習(xí)的能力,能夠?qū)W習(xí)已經(jīng)對弈過的棋盤,并在練習(xí)和實戰(zhàn)中不斷學(xué)習(xí)和積累經(jīng)驗。

(2)圍棋比國際象棋更加復(fù)雜,圍棋棋盤有361個點,其分支因子無窮無盡,19×19格圍棋的合法棋局數(shù)的所有可能性是冪為171的指數(shù),這樣的計算量相當巨大。英國圍棋聯(lián)盟裁判托比表示:“圍棋是世界上最為復(fù)雜的智力游戲,它簡單的規(guī)則加深了棋局的復(fù)雜性”。因此,進入圍棋領(lǐng)域一直被認為是目前人工智能的最大挑戰(zhàn)。

簡而言之,AlphaGo取得勝利的一個很重要的方面就是它擁有強大的“學(xué)習(xí)”能力。深度學(xué)習(xí)是源于人工神經(jīng)網(wǎng)絡(luò)的研究,得益于大數(shù)據(jù)和互聯(lián)網(wǎng)技術(shù)。本文就從人工智能的發(fā)展歷程與現(xiàn)狀入手,在此基礎(chǔ)上分析了人工智能的未來發(fā)展前景。

1.人工智能的發(fā)展歷程

AlphaGo的勝利表明,人工智能發(fā)展到今天,已經(jīng)取得了很多卓越的成果。但是,其發(fā)展不是一帆風(fēng)順的,人工智能是一個不斷進步,并且至今仍在取得不斷突破的學(xué)科?;仡櫲斯ぶ悄艿陌l(fā)展歷程,可大致分為孕育、形成、暗淡、知識應(yīng)用和集成發(fā)展五大時期。

孕育期:1956年以前,數(shù)學(xué)、邏輯、計算機等理論和技術(shù)方面的研究為人工智能的出現(xiàn)奠定了基礎(chǔ)。德國數(shù)學(xué)家和哲學(xué)家萊布尼茨把形式邏輯符號化,奠定了數(shù)理邏輯的基礎(chǔ)。英國數(shù)學(xué)家圖靈在1936年創(chuàng)立了自動機理論(亦稱圖靈機),1950年在其著作《計算機與智能》中首次提出“機器也能思維”,被譽為“人工智能之父”??傊?,這些人為人工智能的孕育和產(chǎn)生做出了巨大的貢獻。

形成期:1956年夏季,在美國達特茅斯大學(xué)舉辦了長達2個多月的研討會,熱烈地討論用機器模擬人類智能的問題。該次會議首次使用了“人工智能”這一術(shù)語。這是人類歷史上第一次人工智能研討會,標志著人工智能學(xué)科的誕生。其后的十幾年是人工智能的黃金時期。在接下來的幾年中,在眾多科學(xué)家的努力下,人工智能取得了矚目的突破,也在當時形成了廣泛的樂觀思潮。

暗淡期:20世紀70年代初,即使最杰出的AI程序也只能解決問題中最簡單的部分,發(fā)展遇到瓶頸也就是說所有的AI程序都只是“玩具”,無法解決更為復(fù)雜的問題。隨著AI遭遇批評,對AI提供資助的機構(gòu)也逐漸停止了部分AI的資助。資金上的困難使得AI的研究方向縮窄,缺少了以往的自由探索。

知識應(yīng)用期:在80年代,“專家系統(tǒng)”(Expect System)成為了人工智能中一個非常主流的分支?!皩<蚁到y(tǒng)”是一種程序,為計算機提供特定領(lǐng)域的專門知識和經(jīng)驗,計算機就能夠依據(jù)一組從專門知識中推演出的邏輯規(guī)則在某一特定領(lǐng)域回答或解決問題。不同領(lǐng)域的專家系統(tǒng)基本都是由知識庫、數(shù)據(jù)庫、推理機、解釋機制、知識獲取等部分組成。

集成發(fā)展期:得益于互聯(lián)網(wǎng)的蓬勃發(fā)展、計算機性能的突飛猛進、分布式系統(tǒng)的廣泛應(yīng)用以及人工智能多分支的協(xié)同發(fā)展,人工智能在這一階段飛速發(fā)展。尤其是隨著深度學(xué)習(xí)和人工神經(jīng)網(wǎng)絡(luò)研究的不斷深入,人工智能在近幾十年中取得了長足的進步,取得了令人矚目的成就。

人工智能發(fā)展到今天,出現(xiàn)了很多令人矚目的研究成果。AlphaGo的勝利就是基于這些研究成果的一個里程碑。當前人工智能的研究熱點主要集中在自然語言處理、機器學(xué)習(xí)、人工神經(jīng)網(wǎng)絡(luò)等領(lǐng)域。

2.人工智能l展現(xiàn)狀與前景

人工智能當前有很多重要的研究領(lǐng)域和分支。目前,越來越多的AI項目依賴于分布式系統(tǒng),而當前研究的普遍熱點則集中于自然語言處理、機器學(xué)習(xí)和人工神經(jīng)網(wǎng)絡(luò)等領(lǐng)域。

自然語言處理:自然語言處理(Natural Language Processing,簡稱NLP),是語言學(xué)與人工智能的交叉學(xué)科,其主要功能就是實現(xiàn)讓機器明白人類的語言,這需要將人類的自然語言轉(zhuǎn)化為計算機能夠處理的機器語言。

自然語言處理主要包括詞法分析、句法分析和語義分析三大部分。詞法分析的核心就是分詞處理,即單詞的邊界處理。句法分析就是對自然語言中句子的結(jié)構(gòu)、語法進行分析如辨別疑問句和感嘆句等。而語義分析則注重情感分析和整個段落的上下文分析,辨別一些字詞在不同的上下文定的語義和情感態(tài)度。

當前自然語言的處理主要有兩大方向。一種是基于句法-語義規(guī)則的理性主義理論,該理論認為需要為計算機制定一系列的規(guī)則,計算機在規(guī)則下進行推理與判斷。因此其技術(shù)路線是一系列的人為的語料建設(shè)與規(guī)則制定。第二種是基于統(tǒng)計學(xué)習(xí)的經(jīng)驗主義理論,這種理論在最近受到普遍推崇。該理論讓計算機自己通過學(xué)習(xí)并進行統(tǒng)計推斷的方式不停地從數(shù)據(jù)中“學(xué)習(xí)”語言,試圖刻畫真實世界的語言現(xiàn)象,從數(shù)據(jù)中統(tǒng)計語言的規(guī)律。

機器學(xué)習(xí):機器學(xué)習(xí)(Machine Learning)是近20年來興起的人工智能一大重要領(lǐng)域。其主要是指通過讓計算機在數(shù)據(jù)中自動分析獲得規(guī)律,從而獲取“自我學(xué)習(xí)”的能力,并利用規(guī)律對未知數(shù)據(jù)進行判斷和預(yù)測的方法。

機器學(xué)致可以分為有監(jiān)督的學(xué)習(xí)和無監(jiān)督的學(xué)習(xí)。有監(jiān)督的學(xué)習(xí)是從給定的訓(xùn)練數(shù)據(jù)集中練出一個函數(shù)和目標,當有新的數(shù)據(jù)到來時,可以由訓(xùn)練得到函數(shù)預(yù)測目標。有監(jiān)督的學(xué)習(xí)要求訓(xùn)練集同時有輸入和輸出,也就是所謂的特征和目標。而依據(jù)預(yù)測的結(jié)果是離散的還是連續(xù)的,將有監(jiān)督的學(xué)習(xí)分為兩大問題,即統(tǒng)計分類問題和回歸分析問題。統(tǒng)計分類的預(yù)測結(jié)果是離散的,如腫瘤是良性還是惡性等;而回歸分析問題目標是連續(xù)的,如天氣、股價等的預(yù)測。

無監(jiān)督學(xué)習(xí)的訓(xùn)練集則沒有人為標注的結(jié)果,這就需要計算機去發(fā)現(xiàn)數(shù)據(jù)間的聯(lián)系并用來分類等。一種常見的無監(jiān)督學(xué)習(xí)是聚類分析(Cluster Analysis),它是將相似的對象通過靜態(tài)分類的方法分成不同的組別或者是特定的子集,讓同一個子集中的數(shù)據(jù)對象都有一些相似的屬性,比較常用的聚類方法是簡潔并快速的“K-均值”聚類算法。它基于K個中心并對距離這些中心最近的數(shù)據(jù)對象進行分類。

機器學(xué)習(xí)還包括如半監(jiān)督學(xué)習(xí)和增強學(xué)習(xí)等類別。總而言之,機器學(xué)習(xí)是研究如何使用機器來模擬人類學(xué)習(xí)活動的一門學(xué)科,而其應(yīng)用隨著人工智能研究領(lǐng)域的深入也變得越來越廣泛,如模式識別、計算機視覺、語音識別、推薦算法等領(lǐng)域越來越廣泛地應(yīng)用到了機器學(xué)習(xí)中。

人工神經(jīng)網(wǎng)絡(luò):在腦神經(jīng)科學(xué)領(lǐng)域,人們認為人類的意識及智能行為,都是通過巨大的神經(jīng)網(wǎng)絡(luò)傳遞的,每個神經(jīng)細胞通過突出與其他神經(jīng)細胞連接,當通過突觸的信號強度超過某個閾值時,神經(jīng)細胞便會進入激活狀態(tài),向所連接的神經(jīng)細胞一層層傳遞信號。于1943年提出的基于生物神經(jīng)元的M-P模型的主要思想就是將神經(jīng)元抽象為一個多輸入單輸出的信息處理單元,并通過傳遞函數(shù)f對輸入x1,x2…,xn進行處理并模擬神經(jīng)細胞的激活模式。主要的傳遞函數(shù)有階躍型、線性型和S型。

在此基礎(chǔ)上,對神經(jīng)網(wǎng)絡(luò)算法的研究又有諸多進展。日本的福島教授于1983年基于視覺認知模型提出了卷積神經(jīng)網(wǎng)絡(luò)計算模型。通過學(xué)習(xí)訓(xùn)練獲取到卷積運算中所使用的卷積系數(shù),并通過不同層次與自由度的變化,可以得到較為優(yōu)化的計算結(jié)果。而AlphaGo也正是采用了這種深度卷積神經(jīng)網(wǎng)絡(luò)(DCNN)模型,提高了AlphaGo的視覺分類能力,也就是所謂的“棋感”,增強了其對全盤決策和把握的能力。

3.人工智能的發(fā)展前景

總體來看,人工智能的應(yīng)用經(jīng)歷了博弈、感知、決策和反饋這幾個里程碑。在以上4個領(lǐng)域中,既是縱向發(fā)展的過程,也是橫向不斷改進的過程。

人工智能在博弈階段,主要是實現(xiàn)邏輯推理等功能,隨著計算機處理能力的進步以及深度學(xué)習(xí)等算法的改進,機器擁有了越來越強的邏輯與對弈能力。在感知領(lǐng)域,隨著自然語言處理的進步,機器已經(jīng)基本能對人類的語音與語言進行感知,并且能夠已經(jīng)對現(xiàn)實世界進行視覺上的感知?;诖髷?shù)據(jù)的處理和機器學(xué)習(xí)的發(fā)展,機器已經(jīng)能夠?qū)χ車沫h(huán)境進行認知,例如微軟的Kinect就能夠準確的對人的肢體動作進行判斷。該領(lǐng)域的主要實現(xiàn)還包括蘋果的Siri,谷歌大腦以及無人駕駛汽車中的各種傳感器等。在以上兩個階段的基礎(chǔ)上,機器擁有了一定的決策和反饋的能力。無人駕駛汽車的蓬勃發(fā)展就是這兩個里程碑很好的例證。Google的無人駕駛汽車通過各種傳感器對周圍的環(huán)境進行感知并處理人類的語言等指令,利用所收集的信息進行最后的決策,比如操作方向盤、剎車等。

人工智能已經(jīng)滲透到生活中的各個領(lǐng)域。機器已經(jīng)能識別語音、人臉以及視頻內(nèi)容等,從而實現(xiàn)各種人際交互的場景。在醫(yī)學(xué)領(lǐng)域,人工智能可以實現(xiàn)自動讀片和輔助診斷以及個性化t療和基因排序等功能。在教育領(lǐng)域,機器也承擔(dān)了越來越多的輔助教育,智能交互的功能。在交通領(lǐng)域,一方面無人車的發(fā)展表明無人駕駛是一個可以期待的未來,另一方面人工智能能夠帶來更加通暢和智能的交通。另外人工智能在安防、金融等領(lǐng)域也有非常廣闊的發(fā)展前景??傊?,人工智能在一些具有重復(fù)性的和具備簡單決策的領(lǐng)域已經(jīng)是一種非常重要的工具,用來幫助人們解決問題,創(chuàng)造價值。

參考文獻

[1]阮曉東.從AlphaGo的勝利看人工智能的未來[J].新經(jīng)濟導(dǎo)刊,2016 (6):69-74.

卷積神經(jīng)網(wǎng)絡(luò)實現(xiàn)過程范文第5篇

人工智能的概念已提出60年,從原來的理論框架體系的搭建,到實驗室關(guān)鍵技術(shù)的準備,如今已開始進入全新的發(fā)展階段――產(chǎn)業(yè)化。

目前,從基本的算法到腦科學(xué)研究,人工智能都還沒有突破性進展的可能性。但是,以深度神經(jīng)網(wǎng)絡(luò)為代表的人工智能,結(jié)合日新月異的大數(shù)據(jù)、云計算和移動互聯(lián)網(wǎng),就可以在未來5到10年改變我們的世界。

人工智能+時代的兩大機遇

人工智能不僅將替代簡單重復(fù)的勞動,還將替代越來越多的復(fù)雜的高級腦力活動,創(chuàng)造一個個新的機會??梢哉f,任何一個行業(yè)、企業(yè)或今天的創(chuàng)業(yè)者,如果不用人工智能改變今天的生產(chǎn)和生活方式,5年后一定會出局。

第一個趨勢是以語音為主導(dǎo)、以鍵盤和觸摸為輔助的人機交互時代正在到來。如今越來越多的設(shè)備不再需要屏幕,越來越多的場景我們不用直接碰觸。比如,想把燈光調(diào)亮,想打開五米之外的設(shè)備,我們的手沒法直接觸碰。再如,開車時不方便用手、用眼做其他事情。這時,語音就成為最主要的一個交互方式。

第二個趨勢是人工智能正在全球范圍內(nèi)掀起一股浪潮,“人工智能+”的時代到來,而且會比我們想象的還要快。為什么呢?麥肯錫分析認為,當前45%的工作可以被技術(shù)自動化,不只是簡單重復(fù)性的工作,CEO20%的工作也可以被機器取代?!犊茖W(xué)》雜志預(yù)測,2045年人工智能會顛覆全球50%、中國77%的就業(yè)。也就是說,今天的我們3/4的工作30年后會被人工智能取代。埃森哲認為,到2035年人工智能會讓12個發(fā)達國家經(jīng)濟增長率翻一倍。我國的增長率只有比這還高,才對得起今天的時代機遇。

從科大訊飛的情況可以看出,人工智能將迎來兩大產(chǎn)業(yè)機遇。

第一,未來3到5年,萬物互聯(lián)的時代到來,以語音為主、鍵盤觸摸為輔的人機交互將廣泛應(yīng)用。第二,未來5到10年,人工智能會像水和電一樣進入各行各業(yè),深刻改變我們的生活。

認知智能是最大技術(shù)瓶頸

人工智能技術(shù)有兩種分類方法。一種分為強人工智能和弱人工智能;另一種是訊飛研究院提出的、跟技術(shù)演進路徑相關(guān)的分類,分成計算智能、感知智能和認知智能。

計算智能就是機器能存會算。就像當年IBM的深藍電腦下象棋超過卡斯帕羅夫,典型的就是因為運算能力強,提前算到了所有的結(jié)果。

感知智能,比如語音合成技術(shù),能夠讓機器開口說話。再如語音識別技術(shù),就像今天的演講,后臺系統(tǒng)把它變成文字,準確率可達95%。

認知智能是讓機器具備能理解、會思考的能力。這是最大的挑戰(zhàn),也是大家最熱切期待的技術(shù)突破。工業(yè)革命讓我們從繁重的體力勞動中解放出來,未來的認知智能會讓人從今天很多復(fù)雜的腦力勞動中解放出來。

科大訊飛選擇以語音為入口解決認知難題,進行認知革命。以人機交互為入口的目的,就是為了解決自然語言理解的技術(shù)難題。這個入口可以把人類的智慧最便捷地匯聚到后臺,供機器學(xué)習(xí)和訓(xùn)練,也可以使后臺人工智能的成果最簡單直接地輸出,從社會不斷取得它學(xué)習(xí)需要的反饋信息,在此基礎(chǔ)上實現(xiàn)知識管理和推理學(xué)習(xí)。

科大訊飛承擔(dān)的科技部第一個人工智能重大專項――高考機器人。目標是為了“考大學(xué)”,但其核心技術(shù)正是語言理解、知識表達、聯(lián)想推理和自主學(xué)習(xí)。

人工智能技術(shù)正走向產(chǎn)業(yè)化

目前,科大訊飛的人工智能研究已經(jīng)取得了階段性成果。

在教育行業(yè),科大訊飛的機器人通過構(gòu)建學(xué)生全過程的學(xué)習(xí)數(shù)據(jù)和老師上課的數(shù)據(jù),提升了課堂效率,原來45分鐘的課堂,現(xiàn)在15分鐘就搞定。因為大量的內(nèi)容學(xué)生都是知道的,老師只需向個別沒掌握的學(xué)生單獨講授。這樣,老師就有時間把課堂的重點放在大家都不了解的知識上,學(xué)生可以用大量時間進行啟發(fā)式學(xué)習(xí)。借助這些手段,學(xué)生的重復(fù)性訓(xùn)練可以降低50%以上。

在醫(yī)療行業(yè),科大訊飛利用語音解決門診電子病歷,利用人工智能輔助診療。學(xué)習(xí)最頂尖醫(yī)療專家知識后的人工智能產(chǎn)品,可以超過一線全科醫(yī)生的水平。當前,醫(yī)療行業(yè)一線最缺的是全科醫(yī)生和兒科醫(yī)生,引入人工智能技術(shù)就可以緩解醫(yī)療資源短缺壓力。

科大訊飛的人工智能技術(shù)還應(yīng)用在汽車領(lǐng)域。在寶馬汽車去年的國際測試中,科大訊飛以86%的準確率名列第一。

在客服領(lǐng)域,機器已經(jīng)替代掉了30%的人工服務(wù)。目前,安徽移動呼叫中心有75%的服務(wù)內(nèi)容已被機器替代。

機器人還將從服務(wù)后臺走向前端。今年第四季度末或明年,服務(wù)機器人將開始在銀行和電信營業(yè)廳上崗工作,它們不僅好玩、有趣,吸引人氣,還能幫客戶解決實際問題。

弥渡县| 千阳县| 化德县| 峨眉山市| 平舆县| 平度市| 喜德县| 甘谷县| 和田县| 东明县| 株洲县| 彭山县| 珠海市| 河源市| 井研县| 珠海市| 宁夏| 社旗县| 仙游县| 舟山市| 图片| 防城港市| 和平县| 教育| 嘉定区| 安阳市| 开远市| 灵宝市| 佛冈县| 和田县| 永吉县| 浙江省| 子洲县| 岳普湖县| 岳阳市| 阳高县| 明水县| 高邑县| 乌海市| 河西区| 张家口市|