您的(de)位置: 主頁 > 新聞中心 > 行(xíng)業(yè)資訊
智能(néng)詞典筆(bǐ)語音(yīn)識别技(jì)術(s♥₽hù)原理(lǐ)概述
行(xíng)業(yè)資訊 / 2023-03-22 1↓₽1:00
語音(yīn)識别技(jì)術(shù)早期的(de)應用→← (yòng)主要(yào)是(shì)語音(yīn)聽(t®₹§¶īng)寫,用(yòng)戶說(shuō)一(☆Ωyī)句,機(jī)器(qì)識别一(yī)句。後來(lái×↕)發展成語音(yīn)轉寫,随著(zhe)AI的(d↓✘<e)發展,語音(yīn)識别開(kāi)始作(zuò ±)為(wèi)智能(néng)交互應用(yòng)中的(de)一(yī)環。
下(xià)面我們就(jiù)來(lái)一(yī)一(₹$yī)介紹這(zhè)些(xiē)應用(yòng♥δ):
語音(yīn)識别的(de)基本原理(lǐ)
所謂語音(yīn)識别,就(jiù)是(shì)将一(yī)段語音(±®↕≠yīn)信号轉換成相(xiàng)對(duì)應的(de)文(wén)∞π本信息,系統主要(yào)包含特征提取、聲學模型,語言模♣"☆型以及字典與解碼四大(dà)部分(fēn),其中為(wèi)了(le)更←"有(yǒu)效地(dì)提取特征往往還(hái)§♥需要(yào)對(duì)所采集到(dào)的(de)聲音(yīn)信号ε♦β↑進行(xíng)濾波、分(fēn)幀等預處理(lǐ)工(gōn•€g)作(zuò),把要(yào)分(fēn)析的(de)信号從( λ€cóng)原始信号中提取出來(lái);之後,特征提取工(gōng)作(¶✔¶zuò)将聲音(yīn)信号從(cóng)時(shí)域轉換到(dào)頻(p$₩£ín)域,為(wèi)聲學模型提供合适的(de)特征向量;聲學模型中再÷ ©根據聲學特性計(jì)算(suàn)每一(yī)個(gè÷λβ)特征向量在聲學特征上(shàng)的(de)得(de)分(fēn);☆ ™而語言模型則根據語言學相(xiàng)關的(de)理(lǐ₽÷↑)論,計(jì)算(suàn)該聲音(yīn)信号對(duì)應可÷↔(kě)能(néng)詞組序列的(de)概♥♦®率;最後根據已有(yǒu)的(de)字典,對(duì)詞組序列←£Ω進行(xíng)解碼,得(de)到(dào)最♠ α後可(kě)能(néng)的(de)文(wén)本表示。
語音(yīn)識别技(jì)術(shù)的(de)工(gō®←σng)作(zuò)流程
一(yī)般來(lái)說(shuō),一(yī)套完整的(de)語音(yī ↔✘☆n)識别系統其工(gōng)作(zuò)過程分(fēn)為(wèi)®&7步:
1、對(duì)語音(yīn)信号進行(xíng)分(fēn)析和(hé)處理÷• (lǐ),除去(qù)冗餘信息。
2、提取影(yǐng)響語音(yīn)識别的(de)關鍵信息和(hé)表達語言<含義的(de)特征信息。
3、緊扣特征信息,用(yòng)最小(xiǎo)單元識δ✘别字詞。
4、按照(zhào)不(bù)同語言的(de)各自(zì)語法,依照" ÷(zhào)先後次序識别字詞。
5、把前後意思當作(zuò)輔助識别條件(j☆∑↔↑iàn),有(yǒu)利于分(fēn)析和(hé)識别。
6、按照(zhào)語義分(fēn)析,給₹ ♠關鍵信息劃分(fēn)段落,提取出所識别出的(de€Ω)字詞并連接起來(lái),同時(shí)根據語句意思調✔★∞α整句子(zǐ)構成。
7、結合語義,仔細分(fēn)析上(shàng)下(xià)文(wéσ☆n)的(de)相(xiàng)互聯系,對(duì)當前≠ε≤正在處理(lǐ)的(de)語句進行(xíng)适當修正。
語音(yīn)識别原理(lǐ)有(yǒu)三點:
1、對(duì)語音(yīn)信号中的(de)語言信↕≤息編碼是(shì)按照(zhào)幅度譜的(de)時♠≠(shí)間(jiān)變化(huà)來(l☆πái)進行(xíng);
2、由于語音(yīn)是(shì)可(kě)以閱讀(dú)的(de),也(≈↑₩yě)就(jiù)是(shì)說(shuō)聲學信号可(kě)∏•以在不(bù)考慮說(shuō)話(huà)人(rén)說(shu≠σπαō)話(huà)傳達的(de)信息內(nèi)×γ ♣容的(de)前提下(xià)用(yòng•★)多(duō)個(gè)具有(yǒu)區(qū)别性的(de♣'∑)、離(lí)散的(de)符号來(lái)₹ "♦表示;
3、語音(yīn)的(de)交互是(shì)一(yī)個(gè)認知(z☆∑γhī)過程,所以絕對(duì)不(bù)能(σ>≤néng)與語法、語義和(hé)用(yòng)語規範等方面分$ (fēn)裂開(kāi)來(lái)。
預處理(lǐ),其中就(jiù)包括對(duì↓✔$)語音(yīn)信号進行(xíng)采樣、克服混疊濾✘> ≤波、去(qù)除部分(fēn)由個(gè)體(tǐ)發音(yīn"®←)的(de)差異和(hé)環境引起的(de)噪聲影(yǐng)響,此外&>'π(wài)還(hái)會(huì)考慮到(dào)語音(yīn)識✔×别基本單元的(de)選取和(hé)端點檢測問(wèn♦<βε)題。反複訓練是(shì)在識别之前通(tōng)過←π∑讓說(shuō)話(huà)人(rén)多(dφ®≠✘uō)次重複語音(yīn),從(cóng)原始語音(y≤"īn)信号樣本中去(qù)除冗餘信息,保留關鍵信息,再按照(zhào)★δ≥一(yī)定規則對(duì)數(shù)據加以₹☆₽整理(lǐ),構成模式庫。再者是(shì)模式匹配,它是(shì)整個(gè)♥✔★&語音(yīn)識别系統的(de)核心部分(fēn),是(s ÷$hì)根據一(yī)定規則以及計(jì)<•♠算(suàn)輸入特征與庫存模式之間(jiān)的(de)相(&£₩xiàng)似度,進而判斷出輸入語音(yīn)的(de)意思。'•÷
前端處理(lǐ),首先對(duì)原始語音( ✔§•yīn)信号進行(xíng)預處理(lǐ),然後對(duì)其進行(xí ∏✘✘ng)特征提取,消除噪音(yīn)以及說(shuō)話(hΩuà)人(rén)之間(jiān)的(de)發音(yīn)差異所•≈®造成的(de)影(yǐng)響,使得(de↑₽→)處理(lǐ)後的(de)信号可(kě)以更完整地(dì)♠σγ反映出語音(yīn)的(de)本質特征。