• / 17
  • 下載費用:30 金幣  

信息驗證方法和系統.pdf

摘要
申請專利號:

CN201510367441.X

申請日:

2015.06.29

公開號:

CN104992095A

公開日:

2015.10.21

當前法律狀態:

授權

有效性:

有權

法律詳情: 授權|||實質審查的生效IPC(主分類):G06F 21/32申請日:20150629|||公開
IPC分類號: G06F21/32(2013.01)I; G10L15/02 主分類號: G06F21/32
申請人: 百度在線網絡技術(北京)有限公司
發明人: 宋輝
地址: 100085北京市海淀區上地十街10號百度大廈三層
優先權:
專利代理機構: 北京清亦華知識產權代理事務所(普通合伙)11201 代理人: 宋合成
PDF完整版下載: PDF下載
法律狀態
申請(專利)號:

CN201510367441.X

授權公告號:

||||||

法律狀態公告日:

2018.07.10|||2015.11.18|||2015.10.21

法律狀態類型:

授權|||實質審查的生效|||公開

摘要

本發明提出一種信息驗證方法和系統,該信息驗證方法包括獲取待識別的音頻片斷;對所述待識別的音頻片斷進行特征提取,獲取所述待識別的音頻片斷對應的特征數據;根據所述特征數據和預先生成的數據模型,獲取驗證結果。該方法能夠提高信息驗證的安全性和使用便捷性。

權利要求書

權利要求書
1.  一種信息驗證方法,其特征在于,包括:
獲取待識別的音頻片斷;
對所述待識別的音頻片斷進行特征提取,獲取所述待識別的音頻片斷對應的特征數據;
根據所述特征數據和預先生成的數據模型,獲取驗證結果。

2.  根據權利要求1所述的方法,其特征在于,所述獲取待識別的音頻片斷,包括:
客戶端對電話信道內傳輸的音頻片斷進行錄音,得到所述待識別的音頻片斷。

3.  根據權利要求2所述的方法,其特征在于,所述客戶端對電話信道內傳輸的音頻片斷進行錄音,得到所述待識別的音頻片斷,包括:
客戶端在檢測到電話呼入后,自動接聽電話,并啟動錄音模塊;
所述客戶端在接聽電話后,在電話信道內接收音頻片斷,并采用所述錄音模塊對所述音頻片斷進行錄音。

4.  根據權利要求2或3所述的方法,其特征在于,還包括:
所述客戶端在錄音完成得到所述待識別的音頻片斷后,向服務端發送驗證請求消息,所述驗證請求消息中包含所述待識別的音頻片斷。

5.  根據權利要求1所述的方法,其特征在于,所述數據模型內存儲有:作為樣本的音頻片斷的特征數據的相關信息,所述待識別的音頻片斷是對所述樣本中的一個音頻片斷進行錄制得到的,所述根據所述特征數據和預先生成的數據模型,獲取驗證結果,包括:
根據所述特征數據和所述相關信息,確定與所述待識別的音頻片斷匹配的音頻片斷,并確定所述匹配的音頻片斷的標識信息;
比較所述匹配的音頻片斷的標識信息,與所述待識別的音頻片斷的標識信息;
如果兩者一致,確定驗證結果是驗證成功,否則,確定驗證結果是驗證失敗。

6.  根據權利要求5所述的方法,其特征在于,所述根據所述特征數據和所述相關信息,確定與所述待識別的音頻片斷匹配的音頻片斷,包括:
對所述特征數據進行時移,并由時移后的特征數據和原始的特征數據組成多個查詢段;
計算每個查詢段與每個相關信息中的特征數據之間的點積值,將點積值最大時的音頻片斷確定為匹配的音頻片斷。

7.  根據權利要求1所述的方法,其特征在于,還包括:生成數據模型,所述生成數據模型包括:
獲取預設個數的作為樣本的音頻片斷;
對每個音頻片斷,進行特征提取,得到每個音頻片斷對應的特征數據;
根據所述特征數據獲取相關信息,并存儲所述相關信息,生成數據模型。

8.  根據權利要求1或7所述的方法,其特征在于,對音頻片斷進行特征提取,獲取所述音頻片斷對應的特征數據,包括:
對音頻片斷進行短時FFT,得到頻率值,所述音頻片斷包括:待識別的音頻片斷,或者,作為樣本的每個音頻片斷;
對所述頻率值進行音色chroma特征數據提取,得到chroma特征數據;
對所述chroma特征數據進行比特圖特征提取,得到比特圖特征數據,所述比特圖特征數據包括多個幀對應的比特圖特征數據;
對預設個數的幀對應的比特圖特征數據進行級聯,得到級聯后的特征數據,將所述級聯后的特征數據作為所述音頻片斷對應的特征數據。

9.  根據權利要求5-7任一項所述的方法,其特征在于,所述特征數據的相關信息包括:
所述特征數據本身和所述特征數據對應的音頻片斷的標識信息,并在存儲時,所述特征數據與所述音頻片斷的標識信息進行對應存儲;或者,
采用倒排文檔索引方式,得到的在相同比特位置數據是1的所有音頻片斷的標識信息。

10.  一種信息驗證系統,其特征在于,包括:
獲取模塊,用于獲取待識別的音頻片斷;
提取模塊,用于對所述待識別的音頻片斷進行特征提取,獲取所述待識別的音頻片斷對應的特征數據;
驗證模塊,用于根據所述特征數據和預先生成的數據模型,獲取驗證結果。

11.  根據權利要求10所述的系統,其特征在于,所述獲取模塊位于客戶端,所述獲取模塊具體用于:
對電話信道內傳輸的音頻片斷進行錄音,得到所述待識別的音頻片斷。

12.  根據權利要求11所述的系統,其特征在于,所述獲取模塊進一步具體用于:
在檢測到電話呼入后,自動接聽電話,并啟動錄音模塊;
在接聽電話后,在電話信道內接收音頻片斷,并采用所述錄音模塊對所述音頻片斷進行錄音。

13.  根據權利要求11或12所述的系統,其特征在于,還包括:
發送模塊,位于客戶端,用于在錄音完成得到所述待識別的音頻片斷后,向服務端發送驗證請求消息,所述驗證請求消息中包含所述待識別的音頻片斷。

14.  根據權利要求10所述的系統,其特征在于,所述數據模型內存儲有:作為樣本的音頻片斷的特征數據的相關信息,所述待識別的音頻片斷是對所述樣本中的一個音頻片斷進行錄制得到的,所述驗證模塊包括:
第一單元,用于根據所述特征數據和所述相關信息,確定與所述待識別的音頻片斷匹配的音頻片斷,并確定所述匹配的音頻片斷的標識信息;
第二單元,用于比較所述匹配的音頻片斷的標識信息,與所述待識別的音頻片斷的標識信息;
第三單元,用于如果兩者一致,確定驗證結果是驗證成功,否則,確定驗證結果是驗證失敗。

15.  根據權利要求14所述的系統,其特征在于,所述第一單元用于根據所述特征數據和所述相關信息,確定與所述待識別的音頻片斷匹配的音頻片斷,包括:
對所述特征數據進行時移,并由時移后的特征數據和原始的特征數據組成多個查詢段;
計算每個查詢段與每個相關信息中的特征數據之間的點積值,將點積值最大時的音頻片斷確定為匹配的音頻片斷。

16.  根據權利要求10-12任一項所述的系統,其特征在于,還包括:用于生成數據模型的生成模塊,所述生成模塊具體用于:
獲取預設個數的作為樣本的音頻片斷;
對每個音頻片斷,進行特征提取,得到每個音頻片斷對應的特征數據;
根據所述特征數據獲取相關信息,并存儲所述相關信息,生成數據模型。

17.  根據權利要求10-12任一項所述的系統,其特征在于,所述提取模塊具體用于:
對所述待識別的音頻片斷進行短時FFT,得到頻率值;
對所述頻率值進行音色chroma特征數據提取,得到chroma特征數據;
對所述chroma特征數據進行比特圖特征提取,得到比特圖特征數據,所述比特圖特征數據包括多個幀對應的比特圖特征數據;
對預設個數的幀對應的比特圖特征數據進行級聯,得到級聯后的特征數據,將所述級聯后的特征數據作為所述待識別的音頻片斷對應的特征數據。

說明書

說明書信息驗證方法和系統
技術領域
本發明涉及信息安全處理技術領域,尤其涉及一種信息驗證方法和系統。
背景技術
為了保證用戶賬戶安全,在使用用戶賬戶時通常需要進行驗證。例如,在支付階段,支付服務器通過短信服務器向用戶預留的手機號碼下發驗證碼,用戶收到驗證碼后填寫到相應的位置,點擊確認后,該驗證碼將會上傳到支付服務器,支付服務器完成驗證碼校驗后進入下一步支付流程。
雖然這種方案在一定程度上提高了支付安全性,但是,受限于短信方式自身的一些缺陷,例如易被竊取,需要讀取輸入等,會導致短信驗證碼方式在實際使用時存在安全性不高,操作也不夠便捷等問題。
發明內容
本發明旨在至少在一定程度上解決相關技術中的技術問題之一。
為此,本發明的一個目的在于提出一種信息驗證方法,該方法可以提高信息驗證的安全性和使用便捷性。
本發明的另一個目的在于提出一種信息驗證系統。
為達到上述目的,本發明第一方面實施例提出的信息驗證方法,包括:獲取待識別的音頻片斷;對所述待識別的音頻片斷進行特征提取,獲取所述待識別的音頻片斷對應的特征數據;根據所述特征數據和預先生成的數據模型,獲取驗證結果。
本發明第一方面實施例提出的信息驗證方法,通過對待識別的音頻片斷進行特征提取,并根據提取后的特征數據進行驗證,可以實現基于音頻的驗證,從而避免短信驗證方式存在的一些問題,提高信息驗證的安全性和使用便捷性。
為達到上述目的,本發明第二方面實施例提出的信息驗證系統,包括:獲取模塊,用于獲取待識別的音頻片斷;提取模塊,用于對所述待識別的音頻片斷進行特征提取,獲取所述待識別的音頻片斷對應的特征數據;驗證模塊,用于根據所述特征數據和預先生成的數據模型,獲取驗證結果。
本發明第二方面實施例提出的信息驗證系統,通過對待識別的音頻片斷進行特征提取,并根據提取后的特征數據進行驗證,可以實現基于音頻的驗證,從而避免短信驗證方式存在的一些問題,提高信息驗證的安全性和使用便捷性。
本發明附加的方面和優點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發明的實踐了解到。
附圖說明
本發明上述的和/或附加的方面和優點從下面結合附圖對實施例的描述中將變得明顯和容易理解,其中:
圖1是本發明一實施例提出的信息驗證方法的流程示意圖;
圖2是本發明另一實施例提出的信息驗證方法的流程示意圖;
圖3是本發明另一實施例提出的信息驗證方法的流程示意圖;
圖4是本發明另一實施例提出的信息驗證系統的結構示意圖;
圖5是本發明另一實施例提出的信息驗證系統的結構示意圖。
具體實施方式
下面詳細描述本發明的實施例,所述實施例的示例在附圖中示出,其中自始至終相同或類似的標號表示相同或類似的模塊或具有相同或類似功能的模塊。下面通過參考附圖描述的實施例是示例性的,僅用于解釋本發明,而不能理解為對本發明的限制。相反,本發明的實施例包括落入所附加權利要求書的精神和內涵范圍內的所有變化、修改和等同物。
圖1是本發明一實施例提出的信息驗證方法的流程示意圖,該方法包括:
S11:獲取待識別的音頻片斷。
與現有技術采用短信發送驗證碼方式不同的是,本實施例中采用音頻方式進行驗證。
可選的,所述獲取待識別的音頻片斷,包括:
客戶端對電話信道內傳輸的音頻片斷進行錄音,得到所述待識別的音頻片斷。
客戶端可以具體位于手機內,例如,用戶使用手機進行支付之前,可以先進行基于音頻片斷的驗證。此時,可以對手機的電話信道內傳輸的音頻片斷進行錄音,得到待識別的音頻片斷。
通過對電話信道內的音頻片斷進行錄音,可以使得待識別的音頻片斷與用戶周圍的聲學環境無關,不會受到環境噪聲的影響,從而提高待識別的音頻片斷的精度,進而提高驗證準確度。
可選的,所述客戶端對電話信道內傳輸的音頻片斷進行錄音,得到所述待識別的音頻片斷,包括:
客戶端在檢測到電話呼入后,自動接聽電話,并啟動錄音模塊;
所述客戶端在接聽電話后,在電話信道內接收音頻片斷,并采用所述錄音模塊對所述音頻片斷進行錄音。
其中,自動接聽電話和啟動錄音模塊可以同步進行。
本實施例中,通過自動接聽電話及啟動錄音模塊,可以不需要人為參與,相對人為等待和輸入短信中的驗證碼的方式,可以提高效率。
本實施例中,呼入手機的電話可以是服務端發起的,以便在手機自動接聽電話后,服務端與手機建立通信連接,通過該通信連接在電話信道內傳輸音頻片斷。當用戶需要采用音頻驗證方式時,可以點擊客戶端上的音頻驗證按鈕,用戶點擊該按鈕后,客戶端可以向服務端發送獲取音頻的請求,服務端接收到該請求后,可以在獲取的10000個音頻片斷中隨機選擇一個音頻片斷,記錄該音頻片斷的SliceID,然后連通用戶預留的電話號碼一起交給呼叫中心,呼叫中心通過運營商撥打電話,將選擇的音頻片斷在電話信道上播放。客戶端在自動接聽電話后,對電話信道上播放的音頻片斷進行錄制,得到待識別的音頻片斷。
另外,客戶端在完成錄制后,可以將電話掛斷。
上述描述了客戶端如何獲取待識別的音頻片斷,由于需要對待識別的音頻片斷進行驗證,而驗證通常是在服務端進行的,因此,服務端也需要先獲取待識別的音頻片斷。具體的,服務端可以接收客戶端發送的待識別的音頻片斷。
因此,對于客戶端還可以執行如下步驟:
所述客戶端在錄音完成得到所述待識別的音頻片斷后,向服務端發送驗證請求消息,所述驗證請求消息中包含所述待識別的音頻片斷。
本實施例中,通過客戶端在錄制完成后自動發送待識別的音頻片斷給服務端,可以提高效率。
S12:對所述待識別的音頻片斷進行特征提取,獲取特征數據。
其中,對待識別的音頻片斷進行特征提取的方式,可以與后續描述的建立數據模型時對作為樣本的音頻片斷進行特征提取的方式一致,因此,具體內容可以參見后續相關描述。
S13:根據所述特征數據和預先生成的數據模型,獲取驗證結果。
其中,驗證流程可以是在線實現的,而數據模型可以是離線實現的。
參見圖2,建立數據模型的流程可以包括:
S21:獲取預設個數的作為樣本的音頻片斷。
通常的驗證信息都是由四位數字,或者數字+字母的形式構成,為了簡化問題,假設以 四位數字驗證碼為例展開描述。
四位數字的隨機組合共有10000(0000~9999)種,因此預設個數是10000。之后可以選擇10000個音頻片斷,這10000個音頻片斷可以從歌曲、音樂、伴奏等各式各樣的音頻資源中獲得。
另外,在獲取到10000個音頻片斷后,可以為每個音頻片斷生成唯一的標識信息,假設標識信息用SliceID表示,則SliceID可以表示為1~10000。
可以理解的是,由于需要在電話信道中播放音頻片段,因此每個音頻片段不宜太長,否則將會增加驗證時間,影響用戶體驗。因此,在保證識別率的前提下,可以規定每個音頻片段的長度為1s。另外,為了提高驗證準確度,可以選擇差異較大的音頻片斷。
至此,可以構造了一個由10000個1s的音頻片段組成的音頻片斷集合,該集合可以稱為驗證閉集。
S22:對每個音頻片斷,進行特征提取,得到每個音頻片斷對應的特征數據。
參見圖3,對音頻片斷進行特征提取,獲取該音頻片斷對應的特征數據,包括:
S221:對音頻片斷進行短時快速傅立葉變換(Fast Fourier Transformation,FFT),得到頻譜數據。
其中,短時FFT是指在時域的音頻片斷上乘以時間窗,得到多個時間段的音頻時域信號,并對每個時間段的音頻時域信號進行FFT。其中,時間窗可以根據實際情況設置,使得每個時間段的音頻時域信號是短時平穩信號。同語音信號相比,音樂的變化比較緩慢,因此在本實施例中,時間窗的窗口一般比語音識別中寬。
音頻數據處理的基本單位是幀,每幀長64ms,假設采樣點N=1024,則采樣率Fs=16K。另外,考慮到頻譜的對稱性,每幀可選擇513個頻率值。
其中,第i個頻率值fi為:
fi=FsN×i,i=[0,512]]]>
S222:對所述頻率值進行音色(chroma)特征數據提取,得到chroma特征數據。
音樂的演奏或歌唱家在唱歌的時候,是按照既定的頻率來呈現的,在不同的頻率之間有著既定的關系。因此,在頻譜圖中,不同的音高(pitch)不是隨機的,而是具有很大的相關性。這種相關性,使得音樂聽起來很悅耳。這也說明頻譜圖中存在很多冗余信息,為此可以對頻譜進行壓縮,減少存貯空間。
本實施例中,基于音樂中音符(midi note)的知識對頻譜圖做壓縮。在midi note中,每個音階(octave)有12個半音(semitone),相鄰的octave的比值是2。本實施例中,把FFT頻譜壓縮到一個octave中,產生12維的chroma特征。例如:把A4(440Hz),A5(880Hz), A6(1760Hz),A7(3520Hz)的對應的FFT頻段譜加在一起產生一個midi note段的譜。這樣的操作在一定程度上提高了抗噪聲干擾能力,因為噪聲或其他的濾波處理,可能會影響某一個octave段的頻譜,即它會影響所有的在這個段內的midi note頻譜,但其他沒受影響的octave段還會提供信息。
對于一個頻率值f,對應的chroma特征的維數索引k是:
k=mod(12×log2(f440)+69,12),k=[0,11]]]>
chroma特征數據可以表示為:
chroma(t,k)=log(∑f∈C(k)fft(t,f)+minimal_value)
其中,t是幀的索引,k是維度的索引,minimal_value是預設的一個很小的值,目的是防止溢出。
至此,對應每個音頻片斷的每幀數據,計算得到了12維的chroma特征數據。
S223:對所述chroma特征數據進行比特圖特征提取,得到比特圖特征數據,所述比特圖特征數據包括多個幀對應的比特圖特征數據。
如果對照chroma譜和FFT譜,就會發現1存在的地方通常對應著頻譜中重要的頻率點和時頻譜中重要的事件。將這些重要的“事件”,用比特“1”來描述,其他“事件”用“0”描述,從而形成比特圖(bitmap)特征數據。
具體的,chroma特征提取后,可以計算該特征在長時間窗口的統計量,并利用該統計量把chroma特征進一步轉化為0/1比特圖。
這里的統計量指的是均值和方差。假設長時窗口長度為M(可設置),則從chroma(t,k)到chroma(t+M-1,k)共M幀的比特圖特征數據bitmap(t,k)可計算為:
bitmap(t,k)=1chroma(t,k)-μσ>bitmapThreshold0otherwise]]>
其中,μ是M幀的chroma特征數據的均值,σ是M幀chroma特征數據的標準方差,bitmapThreshold是設定的定值,目前設為2.0。
S224:對預設個數的幀對應的比特圖特征數據進行級聯,得到級聯后的特征數據,將所述級聯后的特征數據作為所述音頻片斷對應的特征數據
當比特圖特征數據提取后,就會發現這是一個稀疏的圖,1大約只占10%左右,因此12維的bitmap特征數據區分度不夠。為了提高區分度,需要更多比特。
本實施例中,把連續W(可設置)個比特幀級聯起來作為一個基本的索引單元。例如,W=14,則將連續14幀bitmap特征數據級聯在一起,形成168維的比特圖特征數據,該168維的比特圖特征數據就是一個音頻片斷對應的特征數據。
S23:根據所述特征數據獲取相關信息,并存儲所述相關信息,生成數據模型。
可選的,相關信息可以包括:所述特征數據本身和所述特征數據對應的音頻片斷的標識信息,并在存儲時,所述特征數據與所述音頻片斷的標識信息進行對應存儲。例如,第一個音頻片斷的標識信息是1,第一個音頻片斷對應的特征數據是168維的第一向量,則可以對應存儲1與第一向量。或者,
可選的,由于168維的特征數據依然是1只占很少部分,因此,為了避免存儲資源浪費,同時也可以方便后續比對,可以采用倒排文檔索引(inverted document index)的方式,對特征數據和相應的音頻片斷的標識信息進行記錄。此時,相關信息是:采用倒排文檔索引方式,得到的在相同比特位置數據是1的所有音頻片斷的標識信息。例如,10000個音頻片斷分別對應一個168維的向量,而每個向量的168個數據(0或1)中,1占小部分,大部分都是0,假設在第一維為1的音頻片斷的標識信息包括:1,10,…,則對應第一維的標識信息包括:1,10,…。
至此,可以得到數據模型。
在驗證時,如上述相關步驟描述,需要先對待識別的音頻片斷進行特征提取,特征提取的流程與生成數據模型時的特征提取流程一致。參見圖3,服務端接收到客戶端發送的待識別的音頻片斷(客戶端錄音得到的)后,進行特征提取(S31),特征提取包括:短時FFT,chroma特征數據提取,bitmap特征數據提取和14幀級聯,生成168維的特征數據。在得到待識別的音頻片斷對應的168維的特征數據后,可以與數據模型內存儲的特征數據的相關信息進行比對,進而獲取驗證結果。
參見圖3,所述數據模型內存儲有:作為樣本的音頻片斷的特征數據的相關信息,所述待識別的音頻片斷是對所述樣本中的一個音頻片斷進行錄制得到的,所述根據所述特征數據和預先生成的數據模型,獲取驗證結果,包括:
S32:根據所述特征數據和所述相關信息,確定與所述待識別的音頻片斷匹配的音頻片斷,并確定所述匹配的音頻片斷的標識信息。
在得到待識別的音頻片斷對應的特征數據后,可以依次與數據模型中10000個音頻片斷對應的特征數據進行比對,從而得到匹配的音頻片斷。
比對時,可以通過計算兩個音頻片斷對應的特征數據的點積的方式,計算出點積值,將點積值最大的音頻片斷確定為匹配的音頻片斷。
為了方便說明,假設如下的簡化場景:假設待識別的音頻片斷對應的特征數據是5維 的,為10100,假設數據模型內共有3個音頻片斷的特征數據,分別是10010,01000,10100,由于10100與10010的點積值是1,10100與01000的點積值是0,10100與10100的點積值是2,由于2是最大值,則匹配的音頻片斷就是10100對應的音頻片斷。
另外,考慮到音頻片斷在電話信道傳輸時的延時等原因,錄制后得到的待識別的音頻片斷與原始播放的音頻片斷會存在不同步的問題。假設數據模型內存儲的每個音頻片斷對應的特征數據稱為索引段,待識別的音頻片斷對應的特征數據稱為原始段,索引段和原始段都包括14幀的數據。則在獲取到原始段后,可以對原始段進行時移操作,例如,對原始段前后分別時移1到7幀,則可以得到14個新的查詢段,假設原始段和14個新的查詢段統稱為查詢段,則共有15個查詢段。之后,可以計算每個查詢段與每個索引段的點積值,共得到150000個點積值,將最大的點積值對應的索引段對應的音頻片斷確定為匹配的音頻片斷。例如,最大的點積值是第6個查詢段與第100個索引段的點積值,且第100個索引段是第100個音頻片斷的特征數據,則匹配的音頻片斷是第100個音頻片斷。
上述產生新的查詢段的方法在于富有彈性,可擴展。因為數據庫情況是已知的,一旦索引建立,基本很少變化。而查詢時,查詢時的條件是不可預測的,因此,如果碰到非常難的情況,可以對查詢做處理,而不是去改變索引。
由于在獲取10000個音頻片斷后,會生成相應的標識信息,因此,在確定出匹配的音頻片斷后,也就可以獲取該匹配的音頻片斷的標識信息。
S33:比較所述匹配的音頻片斷的標識信息,與所述待識別的音頻片斷的標識信息。
由于待識別的音頻片斷是服務端播放給客戶端的,服務端可以記錄播放的音頻片斷的標識信息,從而服務端可以比較匹配的音頻片斷的標識信息與待識別的音頻片斷的標識信息。
S34:如果兩者一致,確定驗證結果是驗證成功,否則,確定驗證結果是驗證失敗。
例如,匹配的音頻片斷的標識信息是100,如果記錄的待識別的音頻片斷的標識信息也是100,則驗證成功,否則驗證失敗。
本實施例中,通過對待識別的音頻片斷進行特征提取,并根據提取后的特征數據進行驗證,可以實現基于音頻的驗證,從而避免短信驗證方式存在的一些問題,提高信息驗證的安全性和使用便捷性。本實施例的方法可以應用到支付相關的移動產品中。本實施例中,通過對電話信道內播放的音頻片斷進行錄制,可以避免外界環境因素的干擾,提高準確度。本實施例中,通過自動接聽電話和錄制,無需人工參與,可以提高效率,提高準確度,提升用戶體驗。
圖4是本發明另一實施例提出的信息驗證系統的結構示意圖,該系統40可以包括:獲取模塊41,提取模塊42和驗證模塊43。其中,獲取模塊可以位于客戶端,提取模塊和驗 證模塊可以位于服務端,或者,獲取模塊,提取模塊和驗證模塊都位于服務端。
獲取模塊41,用于獲取待識別的音頻片斷;
與現有技術采用短信發送驗證碼方式不同的是,本實施例中采用音頻方式進行驗證。
可選的,所述獲取模塊位于客戶端,所述獲取模塊具體用于:
對電話信道內傳輸的音頻片斷進行錄音,得到所述待識別的音頻片斷。
客戶端可以具體位于手機內,例如,用戶使用手機進行支付之前,可以先進行基于音頻片斷的驗證。此時,可以對手機的電話信道內傳輸的音頻片斷進行錄音,得到待識別的音頻片斷。
通過對電話信道內的音頻片斷進行錄音,可以使得待識別的音頻片斷與用戶周圍的聲學環境無關,不會受到環境噪聲的影響,從而提高待識別的音頻片斷的精度,進而提高驗證準確度。
可選的,所述獲取模塊進一步具體用于:
在檢測到電話呼入后,自動接聽電話,并啟動錄音模塊;
在接聽電話后,在電話信道內接收音頻片斷,并采用所述錄音模塊對所述音頻片斷進行錄音。
其中,自動接聽電話和啟動錄音模塊可以同步進行。
本實施例中,通過自動接聽電話及啟動錄音模塊,可以不需要人為參與,相對人為等待和輸入短信中的驗證碼的方式,可以提高效率。
本實施例中,呼入手機的電話可以是服務端發起的,以便在手機自動接聽電話后,服務端與手機建立通信連接,通過該通信連接在電話信道內傳輸音頻片斷。當用戶需要采用音頻驗證方式時,可以點擊客戶端上的音頻驗證按鈕,用戶點擊該按鈕后,客戶端可以向服務端發送獲取音頻的請求,服務端接收到該請求后,可以在獲取的10000個音頻片斷中隨機選擇一個音頻片斷,記錄該音頻片斷的SliceID,然后連通用戶預留的電話號碼一起交給呼叫中心,呼叫中心通過運營商撥打電話,將選擇的音頻片斷在電話信道上播放。客戶端在自動接聽電話后,對電話信道上播放的音頻片斷進行錄制,得到待識別的音頻片斷。
另外,客戶端在完成錄制后,可以將電話掛斷。
上述描述了客戶端如何獲取待識別的音頻片斷,由于需要對待識別的音頻片斷進行驗證,而驗證通常是在服務端進行的,因此,服務端也需要先獲取待識別的音頻片斷。具體的,服務端可以接收客戶端發送的待識別的音頻片斷。
另一實施例中,參見圖5,該系統40還包括:
發送模塊44,位于客戶端,用于在錄音完成得到所述待識別的音頻片斷后,向服務端 發送驗證請求消息,所述驗證請求消息中包含所述待識別的音頻片斷。
本實施例中,通過客戶端在錄制完成后自動發送待識別的音頻片斷給服務端,可以提高效率。
提取模塊42,用于對所述待識別的音頻片斷進行特征提取,獲取所述待識別的音頻片斷對應的特征數據;
可選的,所述提取模塊42具體用于:
對所述待識別的音頻片斷進行短時FFT,得到頻率值;
對所述頻率值進行音色chroma特征數據提取,得到chroma特征數據;
對所述chroma特征數據進行比特圖特征提取,得到比特圖特征數據,所述比特圖特征數據包括多個幀對應的比特圖特征數據;
對預設個數的幀對應的比特圖特征數據進行級聯,得到級聯后的特征數據,將所述級聯后的特征數據作為所述待識別的音頻片斷對應的特征數據。
其中,對待識別的音頻片斷進行特征提取的方式,可以與后續描述的建立數據模型時對作為樣本的音頻片斷進行特征提取的方式一致,因此,具體內容可以參見后續相關描述。
驗證模塊43,用于根據所述特征數據和預先生成的數據模型,獲取驗證結果。
其中,驗證流程可以是在線實現的,而數據模型可以是離線實現的。
另一實施例中,參見圖5,該系統40還包括:用于生成數據模型的生成模塊45,所述生成模塊45具體用于:
獲取預設個數的作為樣本的音頻片斷;
通常的驗證信息都是由四位數字,或者數字+字母的形式構成,為了簡化問題,假設以四位數字驗證碼為例展開描述。
四位數字的隨機組合共有10000(0000~9999)種,因此預設個數是10000。之后可以選擇10000個音頻片斷,這10000個音頻片斷可以從歌曲、音樂、伴奏等各式各樣的音頻資源中獲得。
另外,在獲取到10000個音頻片斷后,可以為每個音頻片斷生成唯一的標識信息,假設標識信息用SliceID表示,則SliceID可以表示為1~10000。
可以理解的是,由于需要在電話信道中播放音頻片段,因此每個音頻片段不宜太長,否則將會增加驗證時間,影響用戶體驗。因此,在保證識別率的前提下,可以規定每個音頻片段的長度為1s。另外,為了提高驗證準確度,可以選擇差異較大的音頻片斷。
至此,可以構造了一個由10000個1s的音頻片段組成的音頻片斷集合,該集合可以稱為驗證閉集。
對每個音頻片斷,進行特征提取,得到每個音頻片斷對應的特征數據;
對音頻片斷進行特征數據提取的流程可以包括:
對每個音頻片斷進行短時FFT,得到頻率值;
對所述頻率值進行音色chroma特征數據提取,得到chroma特征數據;
對所述chroma特征數據進行比特圖特征提取,得到比特圖特征數據,所述比特圖特征數據包括多個幀對應的比特圖特征數據;
對預設個數的幀對應的比特圖特征數據進行級聯,得到級聯后的特征數據,將所述級聯后的特征數據作為所述音頻片斷對應的特征數據。
具體內容可以參見S221-S224,在此不再贅述。
根據所述特征數據獲取相關信息,并存儲所述相關信息,生成數據模型。
可選的,相關信息可以包括:所述特征數據本身和所述特征數據對應的音頻片斷的標識信息,并在存儲時,所述特征數據與所述音頻片斷的標識信息進行對應存儲。例如,第一個音頻片斷的標識信息是1,第一個音頻片斷對應的特征數據是168維的第一向量,則可以對應存儲1與第一向量。或者,
可選的,由于168維的特征數據依然是1只占很少部分,因此,為了避免存儲資源浪費,同時也可以方便后續比對,可以采用倒排文檔索引(inverted document index)的方式,對特征數據和相應的音頻片斷的標識信息進行記錄。此時,相關信息是:采用倒排文檔索引方式,得到的在相同比特位置數據是1的所有音頻片斷的標識信息。例如,10000個音頻片斷分別對應一個168維的向量,而每個向量的168個數據(0或1)中,1占小部分,大部分都是0,假設在第一維為1的音頻片斷的標識信息包括:1,10,…,則對應第一維的標識信息包括:1,10,…。
至此,可以得到數據模型。
在驗證時,如上述相關步驟描述,需要先對待識別的音頻片斷進行特征提取,特征提取的流程與生成數據模型時的特征提取流程一致。參見圖3,服務端接收到客戶端發送的待識別的音頻片斷(客戶端錄音得到的)后,進行特征提取(S31),特征提取包括:短時FFT,chroma特征數據提取,bitmap特征數據提取和14幀級聯,生成168維的特征數據。在得到待識別的音頻片斷對應的168維的特征數據后,可以與數據模型內存儲的特征數據的相關信息進行比對,進而獲取驗證結果。
另一實施例中,參見圖5,所述數據模型內存儲有:作為樣本的音頻片斷的特征數據的相關信息,所述待識別的音頻片斷是對所述樣本中的一個音頻片斷進行錄制得到的,所述驗證模塊43包括:
第一單元431,用于根據所述特征數據和所述相關信息,確定與所述待識別的音頻片斷匹配的音頻片斷,并確定所述匹配的音頻片斷的標識信息;
可選的,所述第一單元用于根據所述特征數據和所述相關信息,確定與所述待識別的音頻片斷匹配的音頻片斷,包括:
對所述特征數據進行時移,并由時移后的特征數據和原始的特征數據組成多個查詢段;
計算每個查詢段與每個相關信息中的特征數據之間的點積值,將點積值最大時的音頻片斷確定為匹配的音頻片斷。
在得到待識別的音頻片斷對應的特征數據后,可以依次與數據模型中10000個音頻片斷對應的特征數據進行比對,從而得到匹配的音頻片斷。
比對時,可以通過計算兩個音頻片斷對應的特征數據的點積的方式,計算出點積值,將點積值最大的音頻片斷確定為匹配的音頻片斷。
為了方便說明,假設如下的簡化場景:假設待識別的音頻片斷對應的特征數據是5維的,為10100,假設數據模型內共有3個音頻片斷的特征數據,分別是10010,01000,10100,由于10100與10010的點積值是1,10100與01000的點積值是0,10100與10100的點積值是2,由于2是最大值,則匹配的音頻片斷就是10100對應的音頻片斷。
另外,考慮到音頻片斷在電話信道傳輸時的延時等原因,錄制后得到的待識別的音頻片斷與原始播放的音頻片斷會存在不同步的問題。假設數據模型內存儲的每個音頻片斷對應的特征數據稱為索引段,待識別的音頻片斷對應的特征數據稱為原始段,索引段和原始段都包括14幀的數據。則在獲取到原始段后,可以對原始段進行時移操作,例如,對原始段前后分別時移1到7幀,則可以得到14個新的段,假設原始段和14個新的段統稱為查詢段,則共有15個查詢段。之后,可以計算每個查詢段與每個索引段的點積值,共得到150000個點積值,將最大的點積值對應的索引段對應的音頻片斷確定為匹配的音頻片斷。例如,最大的點積值是第6個查詢段與第100個索引段的點積值,且第100個索引段是第100個音頻片斷的特征數據,則匹配的音頻片斷是第100個音頻片斷。
由于在獲取10000個音頻片斷后,會生成相應的標識信息,因此,在確定出匹配的音頻片斷后,也就可以獲取該匹配的音頻片斷的標識信息。
第二單元432,用于比較所述匹配的音頻片斷的標識信息,與所述待識別的音頻片斷的標識信息;
由于待識別的音頻片斷是服務端播放給客戶端的,服務端可以記錄播放的音頻片斷的標識信息,從而服務端可以比較匹配的音頻片斷的標識信息與待識別的音頻片斷的標識信息。
第三單元433,用于如果兩者一致,確定驗證結果是驗證成功,否則,確定驗證結果是驗證失敗。
例如,匹配的音頻片斷的標識信息是100,如果記錄的待識別的音頻片斷的標識信息 也是100,則驗證成功,否則驗證失敗。
本實施例中,通過對待識別的音頻片斷進行特征提取,并根據提取后的特征數據進行驗證,可以實現基于音頻的驗證,從而避免短信驗證方式存在的一些問題,提高信息驗證的安全性和使用便捷性。本實施例的方法可以應用到支付相關的移動產品中。本實施例中,通過對電話信道內播放的音頻片斷進行錄制,可以避免外界環境因素的干擾,提高準確度。本實施例中,通過自動接聽電話和錄制,無需人工參與,可以提高效率,提高準確度,提升用戶體驗。
需要說明的是,上述描述了客戶端和服務端的流程,或者服務端單側的流程,從單側角度來講,本發明實施例還可以提供單側的客戶端的流程以及對應的裝置,單側的客戶端的流程可以包括:獲取待識別的音頻片斷,將所述待識別的音頻片斷發送給服務端,接收服務端發送的驗證結果。其中,客戶端獲取待識別的音頻片斷的具體內容可以參見上述相關描述,服務端根據待識別的音頻片斷得到驗證結果的流程可以參見上述相關描述。
需要說明的是,在本發明的描述中,術語“第一”、“第二”等僅用于描述目的,而不能理解為指示或暗示相對重要性。此外,在本發明的描述中,除非另有說明,“多個”的含義是指至少兩個。
流程圖中或在此以其他方式描述的任何過程或方法描述可以被理解為,表示包括一個或更多個用于實現特定邏輯功能或過程的步驟的可執行指令的代碼的模塊、片段或部分,并且本發明的優選實施方式的范圍包括另外的實現,其中可以不按所示出或討論的順序,包括根據所涉及的功能按基本同時的方式或按相反的順序,來執行功能,這應被本發明的實施例所屬技術領域的技術人員所理解。
應當理解,本發明的各部分可以用硬件、軟件、固件或它們的組合來實現。在上述實施方式中,多個步驟或方法可以用存儲在存儲器中且由合適的指令執行系統執行的軟件或固件來實現。例如,如果用硬件來實現,和在另一實施方式中一樣,可用本領域公知的下列技術中的任一項或他們的組合來實現:具有用于對數據信號實現邏輯功能的邏輯門電路的離散邏輯電路,具有合適的組合邏輯門電路的專用集成電路,可編程門陣列(PGA),現場可編程門陣列(FPGA)等。
本技術領域的普通技術人員可以理解實現上述實施例方法攜帶的全部或部分步驟是可以通過程序來指令相關的硬件完成,所述的程序可以存儲于一種計算機可讀存儲介質中,該程序在執行時,包括方法實施例的步驟之一或其組合。
此外,在本發明各個實施例中的各功能單元可以集成在一個處理模塊中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個模塊中。上述集成的模塊既可以采用硬件的形式實現,也可以采用軟件功能模塊的形式實現。所述集成的模塊如果以 軟件功能模塊的形式實現并作為獨立的產品銷售或使用時,也可以存儲在一個計算機可讀取存儲介質中。
上述提到的存儲介質可以是只讀存儲器,磁盤或光盤等。
在本說明書的描述中,參考術語“一個實施例”、“一些實施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結合該實施例或示例描述的具體特征、結構、材料或者特點包含于本發明的至少一個實施例或示例中。在本說明書中,對上述術語的示意性表述不一定指的是相同的實施例或示例。而且,描述的具體特征、結構、材料或者特點可以在任何的一個或多個實施例或示例中以合適的方式結合。
盡管上面已經示出和描述了本發明的實施例,可以理解的是,上述實施例是示例性的,不能理解為對本發明的限制,本領域的普通技術人員在本發明的范圍內可以對上述實施例進行變化、修改、替換和變型。

關 鍵 詞:
信息 驗證 方法 系統
  專利查詢網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
關于本文
本文標題:信息驗證方法和系統.pdf
鏈接地址:http://www.rgyfuv.icu/p-6381596.html
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服客服 - 聯系我們

[email protected] 2017-2018 zhuanlichaxun.net網站版權所有
經營許可證編號:粵ICP備17046363號-1 
 


收起
展開
山东11选5中奖结果走势图