前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇語(yǔ)音識(shí)別系統(tǒng)范文,相信會(huì)為您的寫作帶來(lái)幫助,發(fā)現(xiàn)更多的寫作思路和靈感。
[關(guān)鍵詞]語(yǔ)音識(shí)別系統(tǒng);差異性;指標(biāo)需求
一、引言
語(yǔ)音作為語(yǔ)言的聲學(xué)體現(xiàn),也是人類進(jìn)行信息交流最自然、和諧的手段。與機(jī)械設(shè)各進(jìn)行語(yǔ)音的溝通,讓機(jī)器可以明白人類在說(shuō)什么,并理解這是人類長(zhǎng)期的夢(mèng)想。語(yǔ)音識(shí)別技術(shù),也被稱為自動(dòng)語(yǔ)音識(shí)別Automatic Speech Recognition,(ASR),其目標(biāo)是將人類的語(yǔ)音中的詞匯內(nèi)容轉(zhuǎn)換為計(jì)算機(jī)可讀的輸入,例如按鍵、二進(jìn)制編碼或者字符序列。語(yǔ)音識(shí)別技術(shù)的應(yīng)用包括語(yǔ)音撥號(hào)、語(yǔ)音導(dǎo)航、室內(nèi)設(shè)備控制、語(yǔ)音文檔檢索、簡(jiǎn)單的聽寫數(shù)據(jù)錄入等。語(yǔ)音識(shí)別技術(shù)與其他自然語(yǔ)言處理技術(shù)如機(jī)器翻譯及語(yǔ)音合成技術(shù)相結(jié)合,可以構(gòu)建出更加復(fù)雜的應(yīng)用,語(yǔ)音識(shí)別技術(shù)所涉及的領(lǐng)域包括:信號(hào)處理、模式識(shí)別、概率論和信息論、發(fā)聲機(jī)理和聽覺(jué)機(jī)理、人工智能等等。
二、語(yǔ)音信號(hào)分析與特征提取
1.基于發(fā)音模型的語(yǔ)音特征。(1)發(fā)音系統(tǒng)及其模型表征。其發(fā)聲過(guò)程就是由肺部進(jìn)行收縮,并進(jìn)行壓縮氣流由支氣管通過(guò)聲道和聲門引起的音頻振蕩所發(fā)生的。氣流通過(guò)聲門時(shí)使得聲帶的張力剛好使聲帶發(fā)生比較低的頻率的振蕩,從而形成準(zhǔn)周期性的空氣脈沖,空氣脈沖激勵(lì)聲道便會(huì)產(chǎn)生一些濁音;聲道的某處面積比較小,氣流沖過(guò)時(shí)便會(huì)產(chǎn)生湍流,會(huì)得到一種相似噪聲的激勵(lì),對(duì)應(yīng)的則是摩擦音;聲道完全閉合并建立起相應(yīng)的氣壓,突然進(jìn)行釋放就是爆破音。(2)語(yǔ)音信號(hào)線性預(yù)測(cè)倒譜系數(shù)。被廣泛應(yīng)用的特征參數(shù)提取技術(shù)的就是線性預(yù)測(cè)分析技術(shù),很多成功的應(yīng)用系統(tǒng)都是選用基于線性預(yù)測(cè)技術(shù)進(jìn)而提取的LPC倒譜系數(shù)作為應(yīng)用系統(tǒng)的特征。LPC倒譜就是復(fù)倒譜。復(fù)倒譜就是信號(hào)通過(guò)z進(jìn)行變換以后再取其對(duì)數(shù),求反z變換所得到的譜。線性預(yù)測(cè)分析方法其實(shí)就是一種譜的估計(jì)方法,所以其聲道模型系統(tǒng)函數(shù)H(z)反映的就是聲道頻率激勵(lì)和信號(hào)的譜包絡(luò),對(duì)IHg(z)作反z變換就可以得出其復(fù)倒譜系數(shù)。改復(fù)倒譜系數(shù)是依據(jù)線性預(yù)測(cè)模型直接獲得的,而又被稱為L(zhǎng)PC倒譜系數(shù)(LPCC)。
2.基于聽覺(jué)模型的語(yǔ)音特征。(1)聽覺(jué)系統(tǒng)模型。一是人類的聽覺(jué)系統(tǒng)對(duì)于聲音頻率高低和聲波實(shí)際的頻率高低不是線性的關(guān)系,它對(duì)不同聲音頻率信號(hào)的敏感度是不一樣的,也可看成是對(duì)數(shù)關(guān)系。二是關(guān)于掩蔽效應(yīng)指的就是聲音A感知的閉值因?yàn)榱硗獾纳碛暗某霈F(xiàn)出現(xiàn)增大的現(xiàn)象。其生理依據(jù)主要是頻率群,對(duì)頻率群進(jìn)行劃分會(huì)出現(xiàn)許多的很小的部分,每一個(gè)部分都會(huì)對(duì)應(yīng)一個(gè)頻率群,掩蔽效應(yīng)就發(fā)生在這些部分過(guò)程中。所以在進(jìn)行相應(yīng)的聲學(xué)測(cè)量時(shí),頻率刻度一般取非線性刻度。語(yǔ)音識(shí)別方面,主要的非線性頻率刻度有Mel刻度、對(duì)數(shù)刻度和Kon~nig刻度。其中Mel刻度被廣泛的應(yīng)用,其是最合理的頻率刻度。(2)語(yǔ)音信號(hào)Mcl頻率倒譜系數(shù)。Mel頻率倒譜系數(shù)利用人們耳朵的聽覺(jué)特性,在頻域?qū)㈩l率軸變換為Mcl頻率刻度,再變換到倒譜域得到倒譜系數(shù)。MFCC參數(shù)的計(jì)算過(guò)程:
一是對(duì)語(yǔ)音信號(hào)進(jìn)行相應(yīng)的預(yù)加重,從而確定了每一幀的語(yǔ)音采樣的長(zhǎng)度,語(yǔ)音信號(hào)通過(guò)離散FFT變換得到其頻譜。二是求頻譜幅度的平方,得到能量譜,并選用一組三角濾波器在頻譜域?qū)δ芰窟M(jìn)行帶通濾波。帶通濾波器中心頻率一般是按照Mcl頻率刻度排列的(間隔為150Mel,帶寬為300Mel),其每個(gè)三角形濾波器的兩個(gè)底點(diǎn)頻率和相鄰的兩個(gè)濾波器的中心頻率相等,頻率響應(yīng)之和為l。濾波器的個(gè)數(shù)一般和臨界帶數(shù)比較相近,設(shè)濾波器數(shù)是M,濾波后得到的輸出為:X(k),k=1,2,…,M。
摘 要: 為了提高語(yǔ)音識(shí)別的可靠性和高效率性,設(shè)計(jì)了以“MCU+DSP”的雙CPU結(jié)構(gòu)為核心的語(yǔ)音識(shí)別系統(tǒng),其中以DSP[1]芯片作為硬件平臺(tái)的主處理器,完成語(yǔ)音識(shí)別所需的計(jì)算。MCU用以完成對(duì)DSP運(yùn)算的協(xié)助工作,控制機(jī)器人各部分動(dòng)作,其性能達(dá)到了實(shí)時(shí)處理的要求。
關(guān)鍵詞: 擬人機(jī)器人; 雙CPU; 語(yǔ)音識(shí)別系統(tǒng); 硬件設(shè)計(jì)
中圖分類號(hào):TP319 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1006-8228(2013)01-01-02
Design of hardware of speech recognition system in humanized robot
Liu Renping, Hou Ruizhen, Fang Yinglan, Han Xianfeng
(North China of Technology, Beijing 100144, China)
Abstract: In order to improve the reliability and efficiency of the speech recognition, a speech recognition system based on double CPU of the "MCU+DSP" is designed. The calculations are done by the main processor which takes the digital signal processor (DSP) as the hardware platform. DSP operation is assisted by Micro control unit(MCU), which controls all parts of the robot. Its performance can meet real-time processing's needs.
Key words: humanoid robot; double CPU; speech recognition system; hardware design
0 引言
隨著超大規(guī)模集成電路和數(shù)字信號(hào)處理器(DSP)的快速發(fā)展,DSP的應(yīng)用越來(lái)越廣泛,涉及到各個(gè)領(lǐng)域如語(yǔ)音處理,圖像處理等方面?,F(xiàn)在語(yǔ)音識(shí)別中許多復(fù)雜算法已經(jīng)能夠在硬件上實(shí)現(xiàn)。最近十多年來(lái),已研發(fā)出不少應(yīng)用于不同領(lǐng)域的便攜式語(yǔ)音識(shí)別系統(tǒng)。DSP處理速度快、靈活、精確,滿足了對(duì)信號(hào)快速、實(shí)時(shí)、精確處理的要求,所以很適用于語(yǔ)音識(shí)別。
1 擬人機(jī)器人語(yǔ)音識(shí)別方法概述
語(yǔ)音信號(hào)分析是語(yǔ)音識(shí)別的前提和基礎(chǔ),只有分析出可表示語(yǔ)音信號(hào)本質(zhì)特征的參數(shù),才可能利用這些參數(shù)進(jìn)行高效的語(yǔ)音通信,才能建立用于識(shí)別的模板或知識(shí)庫(kù)。語(yǔ)音識(shí)別率的高低取決于對(duì)語(yǔ)音信號(hào)分析的準(zhǔn)確性和精確性,雖然語(yǔ)音信號(hào)具有時(shí)變特性,但在一個(gè)短時(shí)間范圍內(nèi)其特性相對(duì)穩(wěn)定,因而可以將其看作是一個(gè)短時(shí)平穩(wěn)過(guò)程。任何對(duì)語(yǔ)音的分析和處理均建立在“短時(shí)”的基礎(chǔ)上,一般認(rèn)為語(yǔ)音信號(hào)在10-30ms的短時(shí)間內(nèi)是相對(duì)平穩(wěn)的。
擬人機(jī)器人語(yǔ)音識(shí)別方法如圖1所示,采集到的語(yǔ)音信號(hào)輸入后,首先對(duì)語(yǔ)音信號(hào)進(jìn)行預(yù)處理,預(yù)處理主要包括:語(yǔ)音信號(hào)電壓放大采樣、反混疊失真濾波、預(yù)加重、自動(dòng)增益控制、分幀、加窗、語(yǔ)音增強(qiáng)、端點(diǎn)檢測(cè)以及A/D轉(zhuǎn)換等環(huán)節(jié);然后是信號(hào)特征量的提?。ū疚膶?duì)信號(hào)的特征量進(jìn)行Mel頻率倒譜系數(shù)[2](Mel-Frequency Cestrum Coefficients)處理);最后對(duì)建立好的參數(shù)模板進(jìn)行對(duì)比,測(cè)試的依據(jù)是失真度最小準(zhǔn)則,如本文用到的動(dòng)態(tài)時(shí)間規(guī)整DTW[3](Dynamic Time Warping)。
2 系統(tǒng)硬件設(shè)計(jì)
通過(guò)針對(duì)擬人機(jī)器人的特點(diǎn),對(duì)系統(tǒng)進(jìn)行分析和方案設(shè)計(jì),最終確定本系統(tǒng)的框圖如圖2所示。本系統(tǒng)的硬件基于一個(gè)以DSP(TMS320VC5416)為主處理器的硬件平臺(tái),硬件平臺(tái)主要包括:語(yǔ)音輸入輸出模塊、主處理器DSP模塊、存儲(chǔ)器模塊、單片機(jī)MCU模塊、485串口通信模塊。其中語(yǔ)音輸入輸出模塊實(shí)現(xiàn)了語(yǔ)音信號(hào)的采集和輸出;主處理器DSP模塊(TMS320VC5416)主要完成語(yǔ)音識(shí)別所需的計(jì)算,其性能能夠達(dá)到實(shí)時(shí)處理的要求;存儲(chǔ)器模塊包括一片F(xiàn)LASH和兩片SRAM,用FLASH作為DSP的可編程存儲(chǔ)器,SRAM分別作為DSP的數(shù)據(jù)和程序存儲(chǔ)器;單片機(jī)MCU模塊完成對(duì)擬人機(jī)器人的運(yùn)動(dòng)控制;485串口通信模塊實(shí)現(xiàn)單片機(jī)MCU和PC機(jī)之間的通信。
2.1 主處理器DSP模塊介紹
TMS320VC5416(簡(jiǎn)稱VC5416)是TI公司的C54X家族的成員之一,它是基于先進(jìn)的改進(jìn)哈佛結(jié)構(gòu)的16位定點(diǎn)DSP。它具有C54X的共同特點(diǎn),高性能低功耗,具有高達(dá)160MHz的主頻,核心電壓1.5V,運(yùn)行于此頻率時(shí)功耗僅為90mW;擁有一條程序總線和三條數(shù)據(jù)總線,片內(nèi)集成有高度并行性的算術(shù)邏輯單元(ALU)、專有硬件邏輯、片內(nèi)存儲(chǔ)器和片內(nèi)外設(shè)等。
片內(nèi)可屏蔽ROM中固化有啟動(dòng)裝載程序(BOOTLOADER)和中斷向量表等。系統(tǒng)上電時(shí),BOOTLOADER自動(dòng)把用戶代碼從外部存儲(chǔ)器搬移到程序空間。復(fù)位以后,中斷向量表可被重新映射到程序空間的任何(128Word)的開始處。為了與慢速的外設(shè)通信,VC5416提供了等待狀態(tài)發(fā)生器,通過(guò)軟件設(shè)置等待周期的個(gè)數(shù),不僅降低了系統(tǒng)硬件設(shè)計(jì)的復(fù)雜性,而且為系統(tǒng)帶來(lái)了很大的靈活性。VC5416片內(nèi)集成了軟件可編程的鎖相環(huán)時(shí)鐘電路,它只需要一個(gè)參考時(shí)鐘輸入就可以得到31種不同頻率的輸出時(shí)鐘,最大的乘率因子(在寄存器CLKMD中設(shè)置)為15,最小的為0.25。這樣,一方面可利用較低頻率的外部時(shí)鐘源產(chǎn)生較高頻率的CPU時(shí)鐘,另一方面在不工作時(shí)可降低CPU時(shí)鐘頻率至外部頻率的四分之一,從而降低了CPU的功耗。 2.2 語(yǔ)音輸入輸出模塊介紹
關(guān)鍵詞:語(yǔ)音控制;語(yǔ)音識(shí)別芯片;單片機(jī);
文章編號(hào):1674-3520(2015)-09-00-03
一、課題背景
學(xué)校常會(huì)組織我們到貴陽(yáng)市盲聾啞學(xué)校送愛(ài)心,與殘障孩子親密互動(dòng),今年也不例外。那些殘章的孩子來(lái)到這個(gè)世界,只能用他們僅存的方式去感知世界萬(wàn)物,在他們的世界里只有一種顏色,那就是黑色。我不禁想,在學(xué)校還有老師的照拂,可他們總有一日要長(zhǎng)大,要開啟自己的人生旅程。要是我能為他們做哪怕一點(diǎn)點(diǎn)事,就算只是為他們的家庭生活提供一些幫助也是好的。我想,如果能利用我在機(jī)器人社中學(xué)到的傳感器、電子電路、單片機(jī)等專業(yè)知識(shí),對(duì)家庭電路進(jìn)行智能化改造,讓家庭的電路“聰明”起來(lái),使他們能夠聽得懂主人的指令而進(jìn)行相應(yīng)的操作,那就可以對(duì)有殘障的人和對(duì)一些不良于行的病人或老人的家庭生活都能提供很大的便利。于是,有了我的這個(gè)設(shè)計(jì)――基于LD3320的語(yǔ)音識(shí)別系統(tǒng)在家庭電路中的模擬應(yīng)用。
二、模型設(shè)計(jì)
(一)模塊功能
(二)模型組成
(三)主要電子元件工作原理與功能說(shuō)明
1、LD3320語(yǔ)音識(shí)別芯片
LD3320語(yǔ)音識(shí)別芯片采用的是ASR(Auto Speech Recognitio)技術(shù),是YS-LD語(yǔ)音識(shí)別模塊的核心。它是對(duì)大量的語(yǔ)音數(shù)據(jù)經(jīng)語(yǔ)言學(xué)家語(yǔ)音模型分析,建立數(shù)學(xué)模型,并經(jīng)過(guò)反復(fù)訓(xùn)練提取基元語(yǔ)音的細(xì)節(jié)特征,以及提取各基元間的特征差異,得到在統(tǒng)計(jì)概率最優(yōu)化意義上的各個(gè)基元語(yǔ)音特征,最后才由資深工程師將算法以及語(yǔ)音模型轉(zhuǎn)換成硬件芯片并應(yīng)用在嵌入式系統(tǒng)中。
LD3320有兩種使用模式,即“觸發(fā)識(shí)別模式”和“循環(huán)識(shí)別模式”??梢酝ㄟ^(guò)編程,設(shè)置兩種不同的使用模式。
觸發(fā)識(shí)別模式:系統(tǒng)的主控MCU在接收到外界一個(gè)觸發(fā)后,啟動(dòng)LD3320芯片的一個(gè)定時(shí)識(shí)別過(guò)程,在這個(gè)定時(shí)過(guò)程中說(shuō)出要識(shí)別的語(yǔ)音關(guān)鍵詞語(yǔ)。這個(gè)過(guò)程結(jié)束后,需要再次觸發(fā)才能再次啟動(dòng)一個(gè)識(shí)別過(guò)程。
循環(huán)識(shí)別模式:系統(tǒng)的主控MCU反復(fù)啟動(dòng)識(shí)別過(guò)程。如果沒(méi)有人說(shuō)話就沒(méi)有識(shí)別結(jié)果,則每次識(shí)別過(guò)程的定時(shí)到時(shí)后再啟動(dòng)一個(gè)識(shí)別過(guò)程;如果有識(shí)別結(jié)果,則根據(jù)識(shí)別作相應(yīng)處理后再啟動(dòng)一個(gè)識(shí)別過(guò)程。
根據(jù)本案模型的設(shè)計(jì)特點(diǎn),采用語(yǔ)音觸發(fā)識(shí)別模式。LD3320芯片最多支持50個(gè)識(shí)別條目,每個(gè)識(shí)別條目是標(biāo)準(zhǔn)普通話的漢語(yǔ)拼音(小寫),每2個(gè)字(漢語(yǔ)拼音)之間用1個(gè)空格間隔。例如表1,只需要把識(shí)別的關(guān)鍵詞語(yǔ)以漢語(yǔ)拼音字符串的形式傳送進(jìn)芯片,該芯片已封裝了基于標(biāo)準(zhǔn)普通話的語(yǔ)音模型數(shù)據(jù)和語(yǔ)音識(shí)別算法,無(wú)需進(jìn)行任何語(yǔ)音訓(xùn)練即可投入開發(fā)應(yīng)用。
2、STM32單片機(jī)控制單元
本案模擬系統(tǒng)主控單元采用意法半導(dǎo)體ARM-Cortex架構(gòu)的STM32F1系列超低功耗單片機(jī)作為控制核心。
該單元完成幾大功能:
向LD3320模塊提供時(shí)鐘振蕩信號(hào),以驅(qū)動(dòng)片上DSP(數(shù)字信號(hào)處理器 )工作;
通過(guò)SPI(串行外設(shè)接口)串行通信方式向LD3320模塊寫入預(yù)定義的控制命令拼音串,并讀取語(yǔ)音模塊返回的識(shí)別結(jié)果編碼;
根據(jù)識(shí)別結(jié)果驅(qū)動(dòng)負(fù)載電路(LED單元(發(fā)光二極管)、繼電器單元)的動(dòng)作。
當(dāng)LD3320模塊完成一次識(shí)別過(guò)程后,通過(guò)中斷請(qǐng)求方式通知主控單元處理,主控單元獲知中斷請(qǐng)求后會(huì)暫時(shí)中止當(dāng)前的任務(wù)執(zhí)行,轉(zhuǎn)而跳轉(zhuǎn)到中斷服務(wù)例程(ISR Route),在該例程中通過(guò)SPI總線從LD3320模塊讀取識(shí)別編碼,根據(jù)識(shí)別編碼的不同執(zhí)行對(duì)應(yīng)控制功能。通過(guò)點(diǎn)亮、熄滅指令對(duì)應(yīng)發(fā)光二極管或驅(qū)動(dòng)繼電器接通主回路得到運(yùn)行結(jié)果。
3、LED顯示單元
本案模擬系統(tǒng)用六個(gè)共陽(yáng)極發(fā)光二極管(LED)來(lái)模擬家庭中廚房、工作間、臥室、走廊、衛(wèi)生間、陽(yáng)臺(tái)的燈泡開關(guān)狀況,工作時(shí)主控單片機(jī)則根據(jù)語(yǔ)音命令,采用輸出低電平方式進(jìn)行驅(qū)動(dòng)點(diǎn)亮。
4、繼電器輸出單元
繼電器輸出單元可接收主控單片機(jī)的高低電平控制信號(hào)以接通或斷開主回路。主回路根據(jù)實(shí)際需求可以用于大電壓,交、直流供電的負(fù)載驅(qū)動(dòng)。本案模擬系統(tǒng)用繼電器單元實(shí)現(xiàn)家庭電扇的通斷控制。
(四)系統(tǒng)軟件開發(fā)環(huán)境
本案模擬系統(tǒng)的軟件開發(fā)只針對(duì)STM32F103主控單元進(jìn)行,軟件代碼完成以下功能:
LD3320底層驅(qū)動(dòng)(對(duì)其內(nèi)部寄存器的讀寫、時(shí)序的控制);
STM32F103硬件單元和用戶變量的初始化;
用戶語(yǔ)音命令拼音串的寫入;
中斷服務(wù)ISR(完成負(fù)載電路的驅(qū)動(dòng)控制)。
軟件開發(fā)基于ARM公司的Keil開發(fā)環(huán)境,完成從代碼編輯到編譯、調(diào)試、燒寫一系列過(guò)程。
(五)設(shè)備成本
三、設(shè)備實(shí)測(cè)
(一)控制命令
LD3320語(yǔ)音識(shí)別芯片中最多可以寫入50條語(yǔ)音控制指令,可以根據(jù)用戶需要定制個(gè)性化的語(yǔ)音控制功能。本案設(shè)備的設(shè)計(jì)初衷是為了探索LD3320語(yǔ)音識(shí)別芯片在家庭電路中的模擬應(yīng)用,故只寫入了比較基本的18條指令。
(二)設(shè)備測(cè)試
在寫入程序,完成硬件連線并加電復(fù)位后,系統(tǒng)即進(jìn)入運(yùn)行狀態(tài)。向系統(tǒng)說(shuō)出控制命令(盡可能用普通話, 不過(guò)實(shí)測(cè)時(shí)對(duì)貴陽(yáng)本地方言還是有較高識(shí)別率),比如說(shuō)“廚房打開”、“走廊關(guān)閉”、“電扇啟動(dòng)”、“運(yùn)行流水燈”等命令后,系統(tǒng)會(huì)根據(jù)識(shí)別結(jié)果執(zhí)行對(duì)應(yīng)動(dòng)作,點(diǎn)亮/熄滅LED或者通/斷電扇運(yùn)行。
為了更好的檢測(cè)語(yǔ)音識(shí)別效果,實(shí)驗(yàn)中選擇多個(gè)不同音色的人在家庭(比較安靜)環(huán)境下分別進(jìn)行測(cè)試,每個(gè)詞語(yǔ)測(cè)試50遍。部分非特定人的語(yǔ)音命令測(cè)試的正確識(shí)別數(shù)據(jù)比例見表4:由上表可知,在家庭(比較安靜)環(huán)境下,對(duì)于語(yǔ)音命令的平均識(shí)別率可達(dá)到90%以上。
四、設(shè)備優(yōu)勢(shì)與應(yīng)用展望
(一)設(shè)備優(yōu)勢(shì)
1、本案設(shè)備成本低、語(yǔ)音辨識(shí)率高、響應(yīng)快速,可以直接安裝于家庭電路中實(shí)現(xiàn)語(yǔ)音智能控制。
2、由于LD3320 可以動(dòng)態(tài)編輯的識(shí)別關(guān)鍵詞語(yǔ)列表,因此其可以應(yīng)用的范圍大大超過(guò)了那些不可以改變識(shí)別列表的芯片。
3、可以根據(jù)用戶的需求進(jìn)行控制命令寫入,實(shí)現(xiàn)可定制、個(gè)性化的智能控制。
(二)應(yīng)用展望
1、應(yīng)對(duì)家庭生活突發(fā)狀況
在本語(yǔ)音識(shí)別系統(tǒng)中只是初步嘗試了對(duì)用電器通、斷電控制,而在現(xiàn)在社會(huì)中有很多的空巢老人,他們獨(dú)自生活,如果在家中出現(xiàn)意外或突發(fā)疾病,隨時(shí)都有可能危及生命。如果在本案系統(tǒng)中可以添加“緊急呼叫”的語(yǔ)音控制,當(dāng)出現(xiàn)突發(fā)狀況時(shí)可以使用該功能觸發(fā)電話自動(dòng)撥打物管、救護(hù)車、親屬等重要聯(lián)系人。或者該控制與小區(qū)物管相連,每當(dāng)有人有緊急呼叫時(shí),物管的終端緊急呼叫燈亮起,并觸發(fā)揚(yáng)聲器發(fā)出警報(bào)聲,使物管人員迅速到場(chǎng)解決問(wèn)題。
2、實(shí)現(xiàn)家用電器的語(yǔ)音控制
(1)電磁爐/微波爐/智能家電操作
在現(xiàn)在的家電中,各種各樣的設(shè)置越來(lái)越繁復(fù)。用戶在使用過(guò)程中,還要不斷地對(duì)家電進(jìn)行功能切換。在引入LD3320 芯片后,可以用語(yǔ)音直接控制這些家電。比如用語(yǔ)音來(lái)控制電磁爐把火力調(diào)整到“煎炸”或者是“慢燉”。
(2)數(shù)碼像框
數(shù)碼像框中存放了許多的照片和視頻,同時(shí)又具有多種播放的方式。一般是通過(guò)按鍵或者遙控器的方式來(lái)對(duì)其進(jìn)行操作,但是這樣的操作并不方便。在引入了LD3320 提供的語(yǔ)音識(shí)別功能后,用戶可以最自然地用語(yǔ)音去點(diǎn)播想要顯示的照片,或者改變數(shù)碼像框的顯示方式。使得這樣的數(shù)碼產(chǎn)品更加具有人性化的操作界面。
3、機(jī)頂盒/彩電遙控器
隨著數(shù)字電視的普及,家庭中可以收看到的電視節(jié)目也越來(lái)越豐富。大家也就苦于在眾多的頻道中迅速選擇到自己想要看的頻道。在把LD3320 語(yǔ)音識(shí)別芯片集成進(jìn)機(jī)頂盒/彩電遙控器后,用戶只需要對(duì)著遙控器說(shuō)出想要看的電視頻道的名字,就可以快速地選擇。比如用戶可以說(shuō)出“奧運(yùn)體育”,就可以轉(zhuǎn)到體育頻道來(lái)觀看精彩的體育比賽了。
4、智能玩具/對(duì)話玩具
在電視購(gòu)物中曾經(jīng)出現(xiàn)過(guò)可以人機(jī)對(duì)話的玩具,比如金福豬,金福狗等。這些玩具采用的語(yǔ)音識(shí)別只能支持固定的10 條左右的語(yǔ)音命令,比如“你好”,“我想聽歌”等等。采用LD3320 芯片,可以利用其動(dòng)態(tài)編輯識(shí)別關(guān)鍵詞語(yǔ)列表的性能,讓玩具實(shí)現(xiàn)及其復(fù)雜的對(duì)話腳本。避免了玩具的嚴(yán)重同質(zhì)化。
(三)公共服務(wù)設(shè)施的語(yǔ)音控制
1、自動(dòng)售貨機(jī)、地鐵自動(dòng)售票機(jī)等銷售型服務(wù)設(shè)施
在自動(dòng)售貨機(jī)、地鐵自動(dòng)售票機(jī)等銷售型服務(wù)設(shè)施中安裝語(yǔ)音操作模塊。人們可以對(duì)著售貨機(jī)說(shuō)出要買的商品,比如“可口可樂(lè)”或者“面巾紙”投幣后商品就自動(dòng)售出。在北京、上海等大都市中,外地旅客較多,對(duì)地鐵線路不熟悉導(dǎo)致買票時(shí)不知道票價(jià)也不知道如何購(gòu)買。有了語(yǔ)音操作界面后,只需要對(duì)著售票機(jī)說(shuō)出要去的地方或者想要到達(dá)的站點(diǎn),根據(jù)屏幕提示放入紙幣,就可以方便地買到車票。
2、公共照明系統(tǒng)、輔助設(shè)施的語(yǔ)音控制
在公共場(chǎng)合幫助殘疾人士、行動(dòng)不便的老人或小孩非接觸地去控制公共照明系統(tǒng)或輔助設(shè)施(地下通道輪椅臺(tái)等)的運(yùn)行。
3、樓宇電視的廣告點(diǎn)播
目前分眾傳媒等公司的樓宇廣告設(shè)施,遍布幾乎所有的寫字樓,也在廣告投放上取得了良好的效果。但是目前用戶在接受廣告時(shí),都是被動(dòng)地去接受信息。對(duì)于其中感興趣的廣告,只能是等待下次再看到時(shí)進(jìn)行仔細(xì)地了解,沒(méi)有辦法進(jìn)行主動(dòng)式地廣告查詢。
引入LD3320 語(yǔ)音識(shí)別芯片后,用戶可以用語(yǔ)音去方便地查詢想要了解的廣告信息。比如操作樓宇廣告“重新播放”“上一條”來(lái)重新觀看一條廣告。或者“汽車”來(lái)點(diǎn)播想要看的汽車廣告。
這樣的語(yǔ)音操作,不需要增加額外的鍵盤輸入和觸摸屏輸入,又可以讓用戶與廣告充分互動(dòng),取得更佳的效果。
五、結(jié)語(yǔ)
使用LD3320 芯片可以在一定程度上完成這樣的語(yǔ)音控制系統(tǒng),給人們的生活帶來(lái)更便利的語(yǔ)音交互界面。作為一種新的人機(jī)交互界面,會(huì)逐步地走入人們的日常生活,在適合用語(yǔ)音控制的地方給人們提供更多的便利。
參考文獻(xiàn):
[1]陳喜春.基于LD3320語(yǔ)音識(shí)別專用芯片實(shí)現(xiàn)的語(yǔ)音控制,[J]. 電子技術(shù)設(shè)計(jì)與應(yīng)用. 2011年11月
語(yǔ)音識(shí)別ASR(Automatic Speech Recognition)系統(tǒng)的實(shí)用化研究是近十年語(yǔ)音識(shí)別研究的一個(gè)主要方向。近年來(lái),消費(fèi)類電子產(chǎn)品對(duì)低成本、高穩(wěn)健性的語(yǔ)音識(shí)別片上系統(tǒng)的需求快速增加,語(yǔ)音識(shí)別系統(tǒng)大量地從實(shí)驗(yàn)室的PC平臺(tái)轉(zhuǎn)移到嵌入式設(shè)備中。
語(yǔ)音識(shí)別技術(shù)目前在嵌入式系統(tǒng)中的應(yīng)用主要為語(yǔ)音命令控制,它使得原本需要手工操作的工作用語(yǔ)音就可以方便地完成。語(yǔ)音命令控制可廣泛用于家電語(yǔ)音遙控、玩具、智能儀器及移動(dòng)電話等便攜設(shè)備中。使用語(yǔ)音作為人機(jī)交互的途徑對(duì)于使用者來(lái)說(shuō)是最自然的一種方式,同時(shí)設(shè)備的小型化也要求省略鍵盤以節(jié)省體積。
嵌入式設(shè)備通常針對(duì)特定應(yīng)用而設(shè)計(jì),只需要對(duì)幾十個(gè)詞的命令進(jìn)行識(shí)別,屬于小詞匯量語(yǔ)音識(shí)別系統(tǒng)。因此在語(yǔ)音識(shí)別技術(shù)的要求不在于大詞匯量和連續(xù)語(yǔ)音識(shí)別,而在于識(shí)別的準(zhǔn)確性與穩(wěn)健性。
對(duì)于嵌入式系統(tǒng)而言,還有許多其它因素需要考慮。首先是成本,由于成本的限制,一般使用定點(diǎn)DSP,有時(shí)甚至只能考慮使用MPU,這意味著算法的復(fù)雜度受到限制;其次,嵌入式系統(tǒng)對(duì)體積有嚴(yán)格的限制,這就需要一個(gè)高度集成的硬件平臺(tái),因此,SoC(System on Chip)開始在語(yǔ)音識(shí)別領(lǐng)域嶄露頭角。SoC結(jié)構(gòu)的嵌入式系統(tǒng)大大減少了芯片數(shù)量,能夠提供高集成度和相對(duì)低成本的解決方案,同時(shí)也使得系統(tǒng)的可靠性大為提高。
語(yǔ)音識(shí)別片上系統(tǒng)是系統(tǒng)級(jí)的集成芯片。它不只是把功能復(fù)雜的若干個(gè)數(shù)字邏輯電路放入同一個(gè)芯片,做成一個(gè)完整的單片數(shù)字系統(tǒng),而且在芯片中還應(yīng)包括其它類型的電子功能器件,如模擬器件(如ADC/DAC)和存儲(chǔ)器。
筆者使用SoC芯片實(shí)現(xiàn)了一個(gè)穩(wěn)定、可靠、高性能的嵌入式語(yǔ)音識(shí)別系統(tǒng)。包括一套全定點(diǎn)的DHMM和CHMM嵌入式語(yǔ)音識(shí)別算法和硬件系統(tǒng)。
1 硬件平臺(tái)
本識(shí)別系統(tǒng)是在與Infineon公司合作開發(fā)的芯片UniSpeech上實(shí)現(xiàn)的。UniSpeech芯片是為語(yǔ)音信號(hào)處理開發(fā)的專用芯片,采用0.18μm工藝生產(chǎn)。它將雙核(DSP+MCU)、存儲(chǔ)器、模擬處理單元(ADC與DAC)集成在一個(gè)芯片中,構(gòu)成了一種語(yǔ)音處理SoC芯片。這種芯片的設(shè)計(jì)思想主要是為語(yǔ)音識(shí)別和語(yǔ)音壓縮編碼領(lǐng)域提供一個(gè)低成本、高可靠性的硬件平臺(tái)。
該芯片為語(yǔ)音識(shí)別算法提供了相應(yīng)的存儲(chǔ)量和運(yùn)算能力。包括一個(gè)內(nèi)存控制單元MMU(Memory Management Unit)和104KB的片上RAM。其DSP核為16位定點(diǎn)DSP,運(yùn)算速度可達(dá)到約100MIPS.MCU核是8位增強(qiáng)型8051,每?jī)蓚€(gè)時(shí)鐘周期為一個(gè)指令周期,其時(shí)鐘頻率可達(dá)到50MHz。
UniSpeech芯片集成了2路8kHz采樣12bit精度的ADC和2路8kHz采樣11bit的DAC,采樣后的數(shù)據(jù)在芯片內(nèi)部均按16bit格式保存和處理。對(duì)于語(yǔ)音識(shí)別領(lǐng)域,這樣精度的ADC/DAC已經(jīng)可以滿足應(yīng)用。ADC/DAC既可以由MCU核控制,也可以由DSP核控制。
2 嵌入式語(yǔ)音識(shí)別系統(tǒng)比較
以下就目前基于整詞模型的語(yǔ)音識(shí)別的主要技術(shù)作一比較。
(1)基于DTW(Dynamic Time Warping)和模擬匹配技術(shù)的語(yǔ)音識(shí)別系統(tǒng)。目前,許多移動(dòng)電話可以提供簡(jiǎn)單的語(yǔ)音識(shí)別功能,幾乎都是甚至DTM和模板匹配技術(shù)。
DTW和模板匹配技術(shù)直接利用提取的語(yǔ)音特征作為模板,能較好地實(shí)現(xiàn)孤立詞識(shí)別。由于DTW模版匹配的運(yùn)算量不大,并且限于小詞表,一般的應(yīng)用領(lǐng)域孤立數(shù)碼、簡(jiǎn)單命令集、地名或人名集的語(yǔ)音識(shí)別。為減少運(yùn)算量大多數(shù)使用的特征是LPCC(Linear Predictive Cepstrum Coefficient)運(yùn)算。
DTW和模板匹配技術(shù)的缺點(diǎn)是只對(duì)特定人語(yǔ)音識(shí)別有較好的識(shí)別性能,并且在使用前需要對(duì)所有詞條進(jìn)行訓(xùn)練。這一應(yīng)用從20世紀(jì)90年代就進(jìn)入成熟期。目前的努力方向是進(jìn)一步降低成本、提高穩(wěn)健性(采用雙模板)和抗噪性能。
(2)基于隱含馬爾科夫模型HMM(Hidden Markov Model)的識(shí)別算法。這是Rabiner等人在20世紀(jì)80年代引入語(yǔ)音識(shí)別領(lǐng)域的一種語(yǔ)音識(shí)別算法。該算法通過(guò)對(duì)大量語(yǔ)音數(shù)據(jù)進(jìn)行數(shù)據(jù)統(tǒng)計(jì),建立識(shí)別條的統(tǒng)計(jì)模型,然后從待識(shí)別語(yǔ)音中提取特征,與這些模型匹配,通過(guò)比較匹配分?jǐn)?shù)以獲得識(shí)別結(jié)果。通過(guò)大量的語(yǔ)音,就能夠獲得一個(gè)穩(wěn)健的統(tǒng)計(jì)模型,能夠適應(yīng)實(shí)際語(yǔ)音中的各種突況。因此,HMM算法具有良好的識(shí)別性能和抗噪性能。
基于HMM技術(shù)的識(shí)別系統(tǒng)可用于非特定人,不需要用戶事先訓(xùn)練。它的缺點(diǎn)在于統(tǒng)計(jì)模型的建立需要依賴一個(gè)較大的語(yǔ)音庫(kù)。這在實(shí)際工作中占有很大的工作量。且模型所需要的存儲(chǔ)量和匹配計(jì)算(包括特征矢量的輸出概率計(jì)算)的運(yùn)算量相對(duì)較大,通常需要具有一定容量SRAM的DSP才能完成。
在嵌入式語(yǔ)音識(shí)別系統(tǒng)中,由于成本和算法復(fù)雜度的限制,HMM算法特別CHMM(Continuous density HMM)算法尚未得到廣泛的應(yīng)用。
(3)人工神經(jīng)網(wǎng)絡(luò)ANN(Artificial Neural Network)。ANN在語(yǔ)音識(shí)別領(lǐng)域的應(yīng)用是在20世紀(jì)80年代中后期發(fā)展起來(lái)的。其思想是用大量簡(jiǎn)單的處理單元并行連接構(gòu)成一種信息處理系統(tǒng)。這種系統(tǒng)可以進(jìn)行自我更新,且有高度的并行處理及容錯(cuò)能力,因而在認(rèn)知任務(wù)中非常吸引人。但是ANN相對(duì)于模式匹配而言,在反映語(yǔ)音的動(dòng)態(tài)特性上存在重大缺陷。單獨(dú)使用ANN的系統(tǒng)識(shí)別性能不高,所以目前ANN通常在多階段識(shí)別中與HMM算法配合使用。
3 基于HMM的語(yǔ)音識(shí)別系統(tǒng)
下面詳細(xì)介紹基于HMM的語(yǔ)音識(shí)別系統(tǒng)。首先在UniSpeech芯片上實(shí)現(xiàn)了基于DHMM的識(shí)別系統(tǒng),然后又在同一平臺(tái)上實(shí)現(xiàn)了基于CHMM的識(shí)別系統(tǒng)。
3.1 前端處理
語(yǔ)音的前端處理主要包括對(duì)語(yǔ)音的采樣、A/D變換、分幀、特片提取和端點(diǎn)檢測(cè)。
模擬語(yǔ)音信號(hào)的數(shù)字化由A/D變換器實(shí)現(xiàn)。ADC集成在片內(nèi),它的采樣頻率固定為8kHz。
特征提取基于語(yǔ)音幀,即將語(yǔ)音信號(hào)分為有重疊的若干幀,對(duì)每一幀提取一次語(yǔ)音特片。由于語(yǔ)音特征的短時(shí)平穩(wěn)性,幀長(zhǎng)一般選取20ms左右。在分幀時(shí),前一幀和后一幀的一部分是重疊的,用來(lái)體現(xiàn)相鄰兩幀數(shù)據(jù)之間的相關(guān)性,通常幀移為幀長(zhǎng)的1/2。對(duì)于本片上系統(tǒng),為了方便做FFT,采用的幀長(zhǎng)為256點(diǎn)(32ms),幀移為128點(diǎn)(16ms)。
特征的選擇需要綜合考慮存儲(chǔ)量的限制和識(shí)別性能的要求。在DHMM系統(tǒng)中,使用24維特征矢量,包括12維MFCC(Mel Frequency Cepstrum Coefficient)和12維一階差分MFCC;在CHMM系統(tǒng)中,在DHMM系統(tǒng)的基礎(chǔ)上增加了歸一化能量、一階差分能量和二階差分能量3維特征,構(gòu)成27維特征矢量。對(duì)MFCC和能量分別使用了倒譜均值減CMS(Cepstrum Mean Subtraction)和能量歸一化ENM(Energy Normalization)的處理方法提高特征的穩(wěn)健性。
3.2 聲學(xué)模型
在HMM模型中,首先定義了一系列有限的狀態(tài)S1…SN,系統(tǒng)在每一個(gè)離散時(shí)刻n只能處在這些狀態(tài)當(dāng)中的某一個(gè)Xn。在時(shí)間起點(diǎn)n=0時(shí)刻,系統(tǒng)依初始概率矢量π處在某一個(gè)狀態(tài)中,即:
πi=P{X0=Si},i=1..N
以后的每一個(gè)時(shí)刻n,系統(tǒng)所處的狀態(tài)Xn僅與前一時(shí)刻系統(tǒng)的狀態(tài)有關(guān),并且依轉(zhuǎn)移概率矩陣A跳轉(zhuǎn),即:
系統(tǒng)在任何時(shí)刻n所處的狀態(tài)Xn隱藏在系統(tǒng)內(nèi)部,并不為外界所見,外界只能得到系統(tǒng)在該狀態(tài)下提供的一個(gè)Rq空間隨機(jī)觀察矢量On。On的分布B稱為輸出概率矩陣,只取決于Xn所處狀態(tài):
Pxn=Si{On}=P{On|Si}
因?yàn)樵撓到y(tǒng)的狀態(tài)不為外界所見,因此稱之為“穩(wěn)含馬爾科夫模型”,簡(jiǎn)稱HMM。
在識(shí)別中使用的隨機(jī)觀察矢量就是從信號(hào)中提取的特征矢量。按照隨機(jī)矢量Qn的概率分布形時(shí),其概率密度函數(shù)一般使用混合高斯分布擬合。
其中,M為使用的混合高斯分布的階數(shù),Cm為各階高期分布的加權(quán)系數(shù)。此時(shí)的HMM模型為連續(xù)HMM模型(Continuous density HMM),簡(jiǎn)稱CHMM模型。在本識(shí)別系統(tǒng)中,采用整詞模型,每個(gè)詞條7個(gè)狀態(tài)同,包括首尾各一個(gè)靜音狀態(tài);每個(gè)狀態(tài)使用7階混合高斯分布擬合。CHMM識(shí)別流程如圖1所示。
由于CHMM模型的復(fù)雜性,也可以假定On的分布是離散的。通常采用分裂式K-Mean算法得到碼本,然后對(duì)提取的特征矢量根據(jù)碼本做一次矢量量化VQ(Vector Quantization)。這樣特征矢量的概率分布上就簡(jiǎn)化為一個(gè)離散的概率分布矩陣,此時(shí)的HMM模型稱為離散HMM模型(Discrete density HMM),簡(jiǎn)稱DHMM模型。本DHMM識(shí)別系統(tǒng)使用的碼本大小為128。DHMM識(shí)別流程如圖2所示。
DHMM雖然增加了矢量量化這一步驟,但是由于簡(jiǎn)化了模型的復(fù)雜度,從而減少了占用計(jì)算量最大的匹配計(jì)算。當(dāng)然,這是以犧牲一定的識(shí)別性能為代價(jià)。
筆者先后自己的硬件平臺(tái)上完成了基于DHMM和CHMM的識(shí)別系統(tǒng)。通過(guò)比較發(fā)現(xiàn),對(duì)于嵌入式平臺(tái)而言,實(shí)現(xiàn)CHMM識(shí)別系統(tǒng)的關(guān)鍵在于芯片有足夠運(yùn)算太多的增加。因?yàn)樵~條模型存儲(chǔ)在ROM中,在匹配計(jì)算時(shí)是按條讀取的。
3.3 識(shí)別性能
筆者使用自己的識(shí)別算法分別對(duì)11詞的漢語(yǔ)數(shù)碼和一個(gè)59詞的命令詞集作了實(shí)際識(shí)別測(cè)試,識(shí)別率非常令人滿意,如表1所示。
表1 漢語(yǔ)數(shù)碼識(shí)別率
DHMMCHMM特征矢量維數(shù)2427識(shí)別率93.40%98.28%識(shí)別速度(11詞)10ms50ms模型大?。?個(gè)詞條)1.5KB<5.5KB碼本6KB無(wú)對(duì)于59詞命令詞集的識(shí)別,還增加了靜音模型。由于基線的識(shí)別率已經(jīng)很高,所以靜音模型的加入對(duì)于識(shí)別率的進(jìn)一步提高作用不大,如表2所示。但靜音模型的加入可以降低對(duì)端點(diǎn)判斷的依賴。這在實(shí)際使用中對(duì)系統(tǒng)的穩(wěn)健性有很大的提高。
表2 59詞命令詞集識(shí)別率
浮 點(diǎn)定 點(diǎn)無(wú)靜音模型98.59%98.28%有靜音模型98.83%98.55%可以看到,在硬件能夠支持的情況下,CHMM的識(shí)別率比DHMM有很大的提高,同時(shí)識(shí)別速度也完全可以滿足使用要求。
關(guān)鍵詞:銀行;系統(tǒng)內(nèi);差別利率體系;利與弊
銀行實(shí)行系統(tǒng)內(nèi)部的差別利率是有其合理性和重要性的,通過(guò)疏通內(nèi)部的血液循環(huán),才能形成健康的運(yùn)營(yíng)機(jī)制,從而更好地適應(yīng)環(huán)境,獲得更大的總體效益。
一、銀行實(shí)行系統(tǒng)內(nèi)差別利率的合理性
銀行實(shí)行系統(tǒng)內(nèi)差別利率的必要性體現(xiàn)在以下三個(gè)方面:1.大型國(guó)有商業(yè)銀行擁有的機(jī)構(gòu)是很龐大的,其遍布全國(guó)各地,而地區(qū)經(jīng)濟(jì)發(fā)展是不平衡的,這使得分行或支行之間的存貸情況不平衡。2.各個(gè)分行、支行的經(jīng)營(yíng)目標(biāo)和經(jīng)營(yíng)裝是不一致的。有的行以經(jīng)營(yíng)負(fù)債業(yè)務(wù)為主,有的行以經(jīng)營(yíng)資產(chǎn)業(yè)務(wù)為主,這就需要有一個(gè)調(diào)節(jié)內(nèi)部資金流動(dòng)的機(jī)制,以滿足各地存款或貸款額度的需求,從而是各行的目標(biāo)順利達(dá)成。3.大型銀行內(nèi)部各個(gè)分行、支行有"貧富差距"的現(xiàn)象,而馬太效應(yīng)會(huì)使經(jīng)營(yíng)資金良好的分、支行經(jīng)營(yíng)的越來(lái)越好,而經(jīng)營(yíng)不佳的分、支行會(huì)越來(lái)越差,這就會(huì)形成惡性循環(huán),使大型銀行內(nèi)部出現(xiàn)嚴(yán)重的兩極分化。4.由于信息常常不對(duì)稱,總行往往會(huì)錯(cuò)誤地估計(jì)銀行總體的資金贏缺情況,從而盲目地在銀行同業(yè)拆借市場(chǎng)上進(jìn)行資金操作,造成資金使用不夠合理,銀行總體效益下降。
二、銀行實(shí)行系統(tǒng)內(nèi)差別利率的基本構(gòu)成體系
銀行實(shí)行系統(tǒng)內(nèi)差別利率需要各方面的通力配合,形成能夠一個(gè)完整的運(yùn)行體系。
(一)構(gòu)建網(wǎng)絡(luò)基礎(chǔ)平臺(tái)
現(xiàn)代化的信息通訊技術(shù)可以使得整個(gè)銀行系統(tǒng)連成一體,使信息得以及時(shí)傳遞、決策者得以有效的決策,大大提高了工作效率。具體而言,即將從總行至支行的一切資金盈余及短缺的情況在銀行內(nèi)部的網(wǎng)絡(luò)中進(jìn)行和共享,并且隨著各行資金情況的變動(dòng)隨時(shí)變化,使各行可以及時(shí)地了解信息,進(jìn)行資金的調(diào)配。同時(shí),也使總行可以通過(guò)系統(tǒng)進(jìn)行調(diào)控和監(jiān)督。
(二)構(gòu)建銀行內(nèi)部的拆借市場(chǎng)
在網(wǎng)絡(luò)基礎(chǔ)平臺(tái)上,各個(gè)分、支行可以根據(jù)外部資金供求狀況進(jìn)行內(nèi)部市場(chǎng)的資金借貸。當(dāng)分、支行的外部信貸旺盛而內(nèi)部存款相對(duì)不足時(shí),就形成了內(nèi)部拆借市場(chǎng)的資金短缺方;同理,分、支行的外部信貸不佳而內(nèi)部存款較多時(shí),就形成了拆借市場(chǎng)的資金盈余方。雙方的資金贏缺情況(包括資金的需求或供給量,相應(yīng)的貸出利率或可以接受的借入利率區(qū)間)在網(wǎng)絡(luò)上,雙方可以根據(jù)自身情況自行選擇交易對(duì)象,并進(jìn)行磋商,自行確定雙方都滿意的利率(借貸資金價(jià)格),完成交易后,實(shí)現(xiàn)交割。如果有些分支行還不太了解拆借市場(chǎng)的情況,或是自己的決策能力有限,可以向總行所設(shè)立的咨詢建議機(jī)構(gòu)(下面會(huì)給出介紹)尋求幫助。該機(jī)構(gòu)會(huì)協(xié)助相應(yīng)分、支行提供適合其交易的對(duì)象,并一定程度上充當(dāng)中間人進(jìn)行幫助磋商。
在市場(chǎng)機(jī)制的調(diào)節(jié)下,資金會(huì)自然形成不同的價(jià)格,一定程度上形成較為合理的利率。
(三)發(fā)揮總行在拆借市場(chǎng)中的參與者和監(jiān)督者的作用
在市場(chǎng)機(jī)制調(diào)節(jié)為基礎(chǔ)的情況下,還應(yīng)發(fā)揮總行在內(nèi)部拆借市場(chǎng)中的最大參與者與監(jiān)督管理者的作用,使市場(chǎng)得以穩(wěn)定和有序地發(fā)展??傂行韪鶕?jù)內(nèi)外部市場(chǎng)的資金供求狀況以及人民銀行的宏觀調(diào)控政策,制定內(nèi)部利率的變動(dòng)范圍,在靈活的基礎(chǔ)上加以控制。如當(dāng)國(guó)家宏觀經(jīng)濟(jì)政策緊縮時(shí),經(jīng)營(yíng)行資金需求不旺,系統(tǒng)內(nèi)資金市場(chǎng)供大于求,將會(huì)導(dǎo)致系統(tǒng)內(nèi)資金利率水平下降,總行可在市場(chǎng)上大量吸收資金,這樣及抑制了經(jīng)營(yíng)行的貸款投放,有一較低的成本充實(shí)了總行的資金實(shí)力,從而控制信貸風(fēng)險(xiǎn)。反之,當(dāng)國(guó)家采取擴(kuò)張的經(jīng)濟(jì)政策時(shí),總行可以通過(guò)放寬系統(tǒng)內(nèi)資金拆借權(quán)限、增加系統(tǒng)內(nèi)資金拆借主體、向市場(chǎng)注入資金等手段為資金需求行提供資金,引導(dǎo)資金向高收益領(lǐng)域流動(dòng)。
(四)構(gòu)建風(fēng)險(xiǎn)監(jiān)測(cè)系統(tǒng)
通過(guò)制定適合自身情況的資金運(yùn)營(yíng)指標(biāo)來(lái)對(duì)個(gè)分、支行以及銀行總體的情況進(jìn)行監(jiān)測(cè),并形成一套對(duì)于風(fēng)險(xiǎn)指標(biāo)的客觀的科學(xué)的合理的評(píng)價(jià)體系,使總行和各分、支行應(yīng)通過(guò)指標(biāo)評(píng)價(jià)分析及時(shí)發(fā)現(xiàn)問(wèn)題并作出反應(yīng)。
三、銀行系統(tǒng)內(nèi)差別利率體系的利與弊
實(shí)行銀行系統(tǒng)內(nèi)的差別利率體系有其合理性同時(shí)也存在一些弊端。
(一)合理性及其重要意義
1.增強(qiáng)了銀行系統(tǒng)內(nèi)資金的有效轉(zhuǎn)移,使資金達(dá)到較為合理的利用,同時(shí)避免總行盲目向同業(yè)拆借市場(chǎng)借款的弊端。
2.使系統(tǒng)內(nèi)利益分配更加合理,既可以激勵(lì)和支持信貸旺盛行的放款業(yè)務(wù),也可以使信貸不佳的分、支行優(yōu)化經(jīng)營(yíng)結(jié)構(gòu),從而使內(nèi)部貧富差距減小,銀行整體效益提高。
3.此方式增加了總行調(diào)控資金的手段,增強(qiáng)了各行適應(yīng)國(guó)家的宏觀調(diào)控政策的主動(dòng)性,從而有利于配合國(guó)家的宏觀調(diào)控政策的實(shí)施。
4.順應(yīng)市場(chǎng)化的趨勢(shì),內(nèi)外部機(jī)制協(xié)調(diào)一致,使銀行這類特殊的企業(yè)更能適應(yīng)環(huán)境而得以長(zhǎng)足有效地發(fā)展。
(二)系統(tǒng)內(nèi)差別利率的弊端
1.資金供給方借此可以得到比單純上存更高的利益,存、借之間的利差減小,這樣會(huì)使信貸資源不豐富地區(qū)的分、支行更偏重于吸收存款,而信貸資源豐富地區(qū)更傾向于放款,使微觀尸體資產(chǎn)負(fù)債比例失調(diào),造成業(yè)務(wù)發(fā)展片面。
2.差別利率的可觀收益使得各分、支行更多地從自身利益出發(fā)而不及銀行整體的利益。
四、結(jié)束語(yǔ)
綜上所述,銀行實(shí)行系統(tǒng)內(nèi)差別利率是有其合理性何必要性的,只有建立系統(tǒng)內(nèi)差別利率體系才可以疏通內(nèi)部資金運(yùn)營(yíng),使銀行以一個(gè)健康的機(jī)體,更加適應(yīng)環(huán)境,從而得以有效地發(fā)展。當(dāng)然,在實(shí)踐過(guò)程中還會(huì)遇到諸多問(wèn)題,系統(tǒng)內(nèi)差別利率體系還需要在實(shí)踐中逐步地完善。
參考文獻(xiàn):
[1]戴國(guó)強(qiáng).商業(yè)銀行經(jīng)營(yíng)學(xué)[M],北京:高等教育出版社,1999.
語(yǔ)音實(shí)訓(xùn)總結(jié) 語(yǔ)音識(shí)別技術(shù) 語(yǔ)音教學(xué)論文 紀(jì)律教育問(wèn)題 新時(shí)代教育價(jià)值觀