隨著物聯(lián)網(wǎng)的發(fā)展,對家庭電器的控制將會有更多的發(fā)展,而語音作為一種自然簡單的方法將是一種有效便捷的控制方式。聲音不僅可以傳達(dá)指令,還能與聲紋識別的安全系統(tǒng)結(jié)合,如果可以把語音控制與安全控制結(jié)合起來,系統(tǒng)就變得更自然直接更人性化了。
在本設(shè)計就是希望通過設(shè)計出一個通用的系統(tǒng)為將來的這些應(yīng)用實(shí)現(xiàn)基本的框架。
定義
GVCS:GeneralVoiceControlSystem,即通用語音控制系統(tǒng)。
SI:Speaker-Independent,與說話者無關(guān)的語音識別技術(shù);
SD:Speaker-Dependent,與說話者有關(guān)的語音識別技術(shù);
SV:SpeakerVerification,語音確認(rèn);
項(xiàng)目目標(biāo):符合SMART原則
Specific明確的陳述:整個通用語音管理系統(tǒng)的實(shí)現(xiàn)。
Measurable可以衡量的結(jié)果:通用語音控制系統(tǒng)對機(jī)器的控制結(jié)果。
Attainable可以達(dá)成的目標(biāo):對機(jī)器設(shè)備控制的智能化。
Relevant任務(wù)相關(guān)性:只完成語音控制所需要的實(shí)現(xiàn)
Time-based時限性:在規(guī)定的時間內(nèi)成項(xiàng)目計劃
遵循質(zhì)量控制管理
項(xiàng)目將嚴(yán)格進(jìn)行質(zhì)量管理控制,對每一個步驟都建立相對完善的文檔,嚴(yán)格按照流程進(jìn)行,完成系統(tǒng)功能的同時提高系統(tǒng)性能,增強(qiáng)系統(tǒng)的可維護(hù)性。
產(chǎn)品目標(biāo)與范圍:本項(xiàng)目主要是為了實(shí)現(xiàn)對機(jī)器設(shè)備控制的智能化,從而選擇使用DigilentCerebot™32MX4開發(fā)板設(shè)計一套通用語音控制系統(tǒng),該系統(tǒng)主要應(yīng)用在家庭電器設(shè)備和工業(yè)控制等領(lǐng)域。
可行性分析
◎?qū)嵱每尚行?br />
本設(shè)計的主要目的是能建立一個通用的語音控制系統(tǒng),只要對系統(tǒng)進(jìn)行相關(guān)的配置和擴(kuò)展之后就能夠應(yīng)用到各種應(yīng)用中。通過這一個系統(tǒng)可以實(shí)現(xiàn)對電器、軟件等的語音控制。
這一系統(tǒng)的應(yīng)用可以使對機(jī)器的操作方便,,同時也可以完善用的操作體驗(yàn)。
◎技術(shù)可行性
在這個系統(tǒng)中需要實(shí)現(xiàn)的有:控制語音的采集、控制語音的識別、將識別后的控制語音轉(zhuǎn)換成控制指令、將控制指令轉(zhuǎn)換成相應(yīng)機(jī)器可以識別的指令,需要的硬件有:
控制語音的采集:直接用模數(shù)轉(zhuǎn)換器收集模擬的語音,用編程的方法把數(shù)字語音轉(zhuǎn)換成合適的格式。
控制語音的識別:用編程的方法將采集到的語音與控制語音庫的數(shù)據(jù)進(jìn)行匹配,得到匹配結(jié)果。
將識別后的控制語音轉(zhuǎn)換成控制指令:把匹配的結(jié)果映射成相應(yīng)的控制指令輸出。
將控制指令轉(zhuǎn)換成相應(yīng)應(yīng)用可以識別的控制指令:為了使系統(tǒng)有更好的通用性,需要根據(jù)實(shí)際的應(yīng)用把輸出的控制指令轉(zhuǎn)換成相應(yīng)應(yīng)用可識別的控制指令,從而實(shí)現(xiàn)控制機(jī)器。這些實(shí)現(xiàn)可以直接用編程的方法實(shí)現(xiàn)
◎經(jīng)濟(jì)可行性
本系統(tǒng)采用高度可定制的思想實(shí)現(xiàn)。系統(tǒng)可以根據(jù)需要,自行對各個功能實(shí)現(xiàn)進(jìn)行選擇或替換,通過這種實(shí)現(xiàn)方案可以定制出能達(dá)到的經(jīng)濟(jì)效益的組合。如替換更合適的語音采集方法、語音識別方法,定制語音與控制指令的映射關(guān)系等。
本系統(tǒng)的性能主要由硬件處理速度、控制語音庫的大小和語音匹配算法決定。在實(shí)際中可以根據(jù)需要選擇硬件和語音庫,同時也可以不斷改進(jìn)算法。
需求分析
◎系統(tǒng)應(yīng)該實(shí)現(xiàn)以下功能:
把說出的控制語音轉(zhuǎn)換成相應(yīng)的控制操作。
能夠配置語音與指令的對應(yīng)關(guān)系。
可以根據(jù)需要替換相關(guān)功能實(shí)現(xiàn)。
在無法識別控制語音時不執(zhí)行操作并給出提示。
◎通用語音控制系統(tǒng)
◎用中文數(shù)字聲音執(zhí)行Linux命令
控制語音采集:使用模數(shù)轉(zhuǎn)換芯片,將模擬的語音轉(zhuǎn)換成數(shù)字語音數(shù)據(jù)。
編碼轉(zhuǎn)換:將采集到的語音加工成可以進(jìn)行語音識別的格式,這種格式應(yīng)該文件較小、利于語音識別。
控制語音識別:通過搜索比較,得到識別結(jié)果,并把識別結(jié)果映射到定義的識別碼(用整數(shù)表示),識別碼包括無法識別項(xiàng)。
應(yīng)用可識別的指令轉(zhuǎn)換:把識別碼轉(zhuǎn)換成執(zhí)行指令,在這里就是相應(yīng)的Linux指令。
執(zhí)行操作:直接調(diào)用指令,執(zhí)行選定指令。
◎硬件需求
1、DigilentCerebot32MX4開發(fā)板
2、PmodNIC——網(wǎng)絡(luò)接口控制器
3、PmodMIC——麥克風(fēng)/數(shù)字接口
◎項(xiàng)目開發(fā)環(huán)境
軟件環(huán)境:
在Linux操作系統(tǒng);MPLABIDE
硬件環(huán)境:
PC機(jī);DigilentCerebot32MX4開發(fā)板;PmodNIC——網(wǎng)絡(luò)接口控制器;PmodMIC——麥克風(fēng)/數(shù)字接口
結(jié)語
進(jìn)入21世紀(jì)以來,隨著科學(xué)技術(shù)的突飛進(jìn)展,語音識別與確認(rèn)技術(shù)也逐漸的走向成熟,基于語音識別技術(shù)的對話控制系統(tǒng)受到了越來越多的關(guān)注。直接用聲音來發(fā)出控制指令,讓機(jī)器能“聽懂”你的話,執(zhí)行相應(yīng)的命令。本設(shè)計目的在于能夠?qū)崿F(xiàn)一個比較通用的語音控制系統(tǒng),為了能更好地示例,在本文的設(shè)計中選擇使用數(shù)字0-9(中文發(fā)音)十個控制語音來控制Linux系統(tǒng)下的ls等5個命令,通過說出命令對應(yīng)的數(shù)字來選擇相應(yīng)命令操作,從而達(dá)到執(zhí)行命令程序的目的。語音識別識別系統(tǒng)可以使人機(jī)交互更為方便,更加智能。
版權(quán)與免責(zé)聲明:
凡本網(wǎng)注明“來源:智慧城市網(wǎng)”的所有作品,均為浙江興旺寶明通網(wǎng)絡(luò)有限公司-智慧城市網(wǎng)合法擁有版權(quán)或有權(quán)使用的作品,未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明“來源:智慧城市網(wǎng)m.aiynx.com”。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責(zé)任。
本網(wǎng)轉(zhuǎn)載并注明自其它來源(非智慧城市網(wǎng)m.aiynx.com)的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)或和對其真實(shí)性負(fù)責(zé),不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。其他媒體、網(wǎng)站或個人從本網(wǎng)轉(zhuǎn)載時,必須保留本網(wǎng)注明的作品第一來源,并自負(fù)版權(quán)等法律責(zé)任。
-
免費(fèi)注冊后,你可以
了解安防行業(yè)更多資訊查看安防行業(yè)供求信息凸顯安防行業(yè)自身價值
馬上注冊會員
-
想快速被買家找到嗎
只需要發(fā)布一條商機(jī),被買家找到的機(jī)會高達(dá)90%!還等什么?
馬上發(fā)布信息