聲紋識別防偽技術有兩個關鍵問題,一是特征提取,二是模式匹配,具體分別是:
1、特征提取:提取并選擇對說話人的聲紋具有可分性強、穩定性高等特性的聲學或語言特征。這個與語音識別不同,聲紋識別的特征必須是“個性化”特征,而說話人識別的特征對說話人來講必須是“共性特征”,表征一個人特點的特征應該是多層面的,包括:
(1)與人類的發音機制的解剖學結構有關的聲學特征,如鼻音、帶深呼吸音、沙啞音、笑聲等;
(2)受社會經濟狀況、受教育水平、出生地等影響的語義、修辭、發音、言語習慣等;
(3)個人特點或受父母影響的韻律、節奏、速度、語調、音量等特征。
根據不同的任務需求,聲紋識別防偽技術還面臨一個特征選擇或特征選用的問題,例如在刑偵應用上,對“信道”信息希望弱化信道對說話人識別的影響,而在銀行交易上則希望信道對說話人識別有較大影響,從而可以剔除錄音、模仿等帶來的影響。
總之,聲紋識別防偽需要提取較好的特征,就應該能夠有效區分不同的說話人,但又能在同一說話人語音發生變化時保持相對的穩定,同時不易被他人模仿或能夠較好地解決被他人模仿問題;具有較好的抗噪性能,這樣才能實現聲紋識別防偽。
2、模式識別:模式識別有幾大類方法,分別是:
(1)模板匹配方法:利用動態時間彎折(DTW)以對準訓練和測試特征序列,主要用于固定詞組的應用(通常為文本相關任務);
(2)最近鄰方法:訓練時保留所有特征矢量,識別時對每個矢量都找到訓練矢量中最近的K個,據此進行識別,通常模型存儲和相似計算的量都很大;
(3)神經網絡方法:有很多種形式,如多層感知、徑向基函數等,可以顯式訓練以區分說話人和其背景說話人;
(4)隱式馬爾可夫模型方法:通常使用單狀態的HMM,或高斯混合模型(GMM),是比較流行的方法,且聲紋識別防偽效果比較好;
(5)VQ聚類方法:這種模式的聲紋識別防偽效果比較好,算法復雜度不高,和HMM方法配合起來更可以收到更好的效果;
(6)多項式分類器方法:有較高的精度,但模型存儲和計算量都比較大。
聲紋識別防偽技術需要解決的關鍵問題主要有以上兩個,但其實還有很多,諸如短話音問題,能否用很短的語音進行模型訓練等等,都需要技術的進一步開發和完善。
深圳市兆信防偽技術有限公司有著從業20年的防偽經驗,服務過多家知名企業,具有專利性的技術,對于防偽防竄貨有豐富的經驗,可以提供多種個性化的防竄貨解決方案,如有需要或希望得到進一步了解,可致電免費熱線電話:0755-8883 0778,將有專人為您提供詳細的咨詢和服務。