基礎(chǔ)信息
權(quán)利要求
說明書
PDF全文
法律信息
引證文獻
1.一種聲紋認證方法,其特征在于,包括:
向用戶展示提示文本,所述提示文本是所述用戶預(yù)先注冊的短語的組合;
獲取所述用戶朗誦所述提示文本的語音;
在所述語音與所述提示文本一致時,獲取預(yù)先建立的所述短語或提示文本的注冊模型,并根據(jù)所述語音和所述注冊模型,確定聲紋認證結(jié)果;
其中,所述方法,還包括:
向所述用戶展示待注冊的短語;
獲取所述用戶朗誦所述待注冊的短語的語音;
在所述用戶朗誦的語音與所述待注冊的短語一致時,建立所述待注冊的短語的注冊模型。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取預(yù)先建立的所述短語或提示文本的注冊模型,并根據(jù)所述語音和所述注冊模型,確定聲紋認證結(jié)果,包括:
對所述語音進行切分,得到與所述短語對應(yīng)的短語語音;獲取預(yù)先建立的與所述短語對應(yīng)的注冊模型;將所述短語語音作為待認證的語音,將所述注冊模型作為認證模型,并根據(jù)所述待認證的語音和所述認證模型,確定聲紋認證結(jié)果;或者,
獲取預(yù)先建立的與所述短語對應(yīng)的注冊模型;對所述注冊模型進行組合,得到組合后的注冊模型;將所述語音作為待認證的語音,將所述組合后的注冊模型作為認證模型,并根據(jù)所述待認證的語音和所述認證模型,確定聲紋認證結(jié)果;或者,
獲取預(yù)先建立的與所述提示文本對應(yīng)的注冊模型;將所述語音作為待認證的語音,將所述注冊模型作為認證模型,并根據(jù)所述待認證的語音和所述認證模型,確定聲紋認證結(jié)果。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述預(yù)先注冊的短語為多個,所述向用戶展示提示文本之前,所述方法還包括:
在預(yù)先注冊的多個短語中隨機選擇一個或多個短語,并將選擇的短語組合成所述提示文本。
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述根據(jù)所述待認證的語音和所述認證模型,確定聲紋認證結(jié)果,包括:
計算所述待認證的語音與所述認證模型之間的匹配數(shù)值;
如果所述匹配數(shù)值大于預(yù)設(shè)閾值,則確定聲紋認證結(jié)果是認證成功。
5.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述獲取預(yù)先建立的與所述短語對應(yīng)的注冊模型,包括:
獲取所述用戶的用戶標識;
根據(jù)所述用戶的用戶標識,所述短語,以及,注冊時生成的用戶標識、短語及注冊模型的對應(yīng)關(guān)系,獲取與所述短語對應(yīng)的注冊模型。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述用戶朗誦的語音為多次,所述在所述用戶朗誦的語音與所述待注冊的短語一致時,建立所述待注冊的短語的注冊模型,包括:
在每次所述用戶朗誦的語音都與所述待注冊的短語一致時,根據(jù)多次朗誦的語音,建立所述待注冊的短語的注冊模型。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括:
向所述用戶展示可供選擇的短語;
獲取所述用戶在所述可供選擇的短語中,選擇的所述待注冊的短語。
8.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述待注冊的短語為多個時,不同的待注冊的短語滿足如下條件中的至少一項:
不同的待注冊的短語的長度均小于預(yù)設(shè)的長度閾值;
不同的待注冊的短語的長度差值小于預(yù)設(shè)的差值;
不同的待注冊的短語中不包含同音字。
9.一種聲紋認證裝置,其特征在于,包括:
第一展示模塊,用于向用戶展示提示文本,所述提示文本是所述用戶預(yù)先注冊的短語的組合;
第一獲取模塊,用于獲取所述用戶朗誦所述提示文本的語音;
認證模塊,用于在所述語音與所述提示文本一致時,獲取預(yù)先建立的所述短語或提示文本的注冊模型,并根據(jù)所述語音和所述注冊模型,確定聲紋認證結(jié)果;
其中,所述裝置,還包括:
第二展示模塊,用于向所述用戶展示待注冊的短語;
第二獲取模塊,用于獲取所述用戶朗誦所述待注冊的短語的語音;
建模模塊,用于在所述用戶朗誦的語音與所述待注冊的短語一致時,建立所述待注冊的短語的注冊模型。
10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述認證模塊具體用于:
對所述語音進行切分,得到與所述短語對應(yīng)的短語語音;獲取預(yù)先建立的與所述短語對應(yīng)的注冊模型;將所述短語語音作為待認證的語音,將所述注冊模型作為認證模型,并根據(jù)所述待認證的語音和所述認證模型,確定聲紋認證結(jié)果;或者,
獲取預(yù)先建立的與所述短語對應(yīng)的注冊模型;對所述注冊模型進行組合,得到組合后的注冊模型;將所述語音作為待認證的語音,將所述組合后的注冊模型作為認證模型,并根據(jù)所述待認證的語音和所述認證模型,確定聲紋認證結(jié)果;或者,
獲取預(yù)先建立的與所述提示文本對應(yīng)的注冊模型;將所述語音作為待認證的語音,將所述注冊模型作為認證模型,并根據(jù)所述待認證的語音和所述認證模型,確定聲紋認證結(jié)果。
11.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述預(yù)先注冊的短語為多個,所述裝置還包括:
生成模塊,用于在預(yù)先注冊的多個短語中隨機選擇一個或多個短語,并將選擇的短語組合成所述提示文本。
12.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述認證模塊用于根據(jù)所述待認證的語音和所述認證模型,確定聲紋認證結(jié)果,包括:
計算所述待認證的語音與所述認證模型之間的匹配數(shù)值;
如果所述匹配數(shù)值大于預(yù)設(shè)閾值,則確定聲紋認證結(jié)果是認證成功。
13.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述認證模塊用于獲取預(yù)先建立的與所述短語對應(yīng)的注冊模型,包括:
獲取所述用戶的用戶標識;
根據(jù)所述用戶的用戶標識,所述短語,以及,注冊時生成的用戶標識、短語及注冊模型的對應(yīng)關(guān)系,獲取與所述短語對應(yīng)的注冊模型。
14.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述用戶朗誦的語音為多次,所述建模模塊具體用于:
在每次所述用戶朗誦的語音都與所述待注冊的短語一致時,根據(jù)多次朗誦的語音,建立所述待注冊的短語的注冊模型。
15.根據(jù)權(quán)利要求9所述的裝置,其特征在于,還包括:
第三展示模塊,用于向所述用戶展示可供選擇的短語;
第三獲取模塊,用于獲取所述用戶在所述可供選擇的短語中,選擇的所述待注冊的短語。
聲紋認證方法和裝置\n技術(shù)領(lǐng)域\n[0001] 本發(fā)明涉及身份認證技術(shù)領(lǐng)域,尤其涉及一種聲紋認證方法和裝置。\n背景技術(shù)\n[0002] 當(dāng)前的聲紋認證技術(shù)主要分為文本無關(guān)和文本相關(guān)兩種。文本無關(guān)的聲紋認證技術(shù)對用戶說的內(nèi)容不加區(qū)分,而文本相關(guān)的聲紋認證技術(shù)需要用戶說的內(nèi)容與注冊時必須一致。兩種技術(shù)各有優(yōu)缺點:文本無關(guān)的聲紋驗證技術(shù)因為不限制用戶說話的內(nèi)容,應(yīng)用比較靈活,但為了覆蓋盡量大的樣本空間,需要用戶長時間說話;文本相關(guān)技術(shù)的用戶語音通常比較短,但是文本必須與注冊時相一致,從而導(dǎo)致其無法防止錄音欺騙。\n發(fā)明內(nèi)容\n[0003] 本發(fā)明旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。\n[0004] 為此,本發(fā)明的一個目的在于提出一種聲紋認證方法,該方法可以既保證了用戶在認證時不需要說太長時間的話,也保證了語音內(nèi)容的變化性,從而防止錄音欺騙。\n[0005] 本發(fā)明的另一個目的在于提出一種聲紋認證裝置。\n[0006] 為達到上述目的,本發(fā)明第一方面實施例提出的聲紋認證方法,包括:向用戶展示提示文本,所述提示文本是所述用戶預(yù)先注冊的短語的組合;獲取所述用戶朗誦所述提示文本的語音;在所述語音與所述提示文本一致時,獲取預(yù)先建立的注冊模型,并根據(jù)所述語音和所述注冊模型,確定聲紋認證結(jié)果。\n[0007] 本發(fā)明第一方面實施例提出的聲紋認證方法,通過比對朗誦的語音與注冊模型,可以實現(xiàn)基于限定文本的聲紋認證,由于采用注冊模型,相當(dāng)于文本無關(guān)方式,可以保證用戶在認證時不需要說太長時間的話;另外,由于提示文本是對預(yù)先注冊的短語的組合,相當(dāng)于文本相關(guān)方式中采用固定的注冊短語的方式,可以保證語音內(nèi)容的變化性,從而防止錄音欺騙。\n[0008] 為達到上述目的,本發(fā)明第二方面實施例提出的聲紋認證裝置,包括:第一展示模塊,用于向用戶展示提示文本,所述提示文本是所述用戶預(yù)先注冊的短語的組合;第一獲取模塊,用于獲取所述用戶朗誦所述提示文本的語音;認證模塊,用于在所述語音與所述提示文本一致時,獲取預(yù)先建立的注冊模型,并根據(jù)所述語音和所述注冊模型,確定聲紋認證結(jié)果。\n[0009] 本發(fā)明第二方面實施例提出的聲紋認證裝置,通過比對朗誦的語音與注冊模型,可以實現(xiàn)基于限定文本的聲紋認證,由于采用注冊模型,相當(dāng)于文本無關(guān)方式,可以保證用戶在認證時不需要說太長時間的話;另外,由于提示文本是對預(yù)先注冊的短語的組合,相當(dāng)于文本相關(guān)方式中采用固定的注冊短語的方式,可以保證語音內(nèi)容的變化性,從而防止錄音欺騙。\n[0010] 本發(fā)明附加的方面和優(yōu)點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發(fā)明的實踐了解到。\n附圖說明\n[0011] 本發(fā)明上述的和/或附加的方面和優(yōu)點從下面結(jié)合附圖對實施例的描述中將變得明顯和容易理解,其中:\n[0012] 圖1是本發(fā)明一實施例提出的聲紋認證方法的流程示意圖;\n[0013] 圖2是本發(fā)明另一實施例提出的聲紋認證方法的流程示意圖;\n[0014] 圖3是本發(fā)明實施例中一種注冊流程的示意圖;\n[0015] 圖4是本發(fā)明實施例中另一種注冊流程的示意圖;\n[0016] 圖5是本發(fā)明實施例中注冊流程時可供選擇的短語的示意圖;\n[0017] 圖6是本發(fā)明另一實施例提出的聲紋認證裝置的結(jié)構(gòu)示意圖;\n[0018] 圖7是本發(fā)明另一實施例提出的聲紋認證裝置的結(jié)構(gòu)示意圖。\n具體實施方式\n[0019] 下面詳細描述本發(fā)明的實施例,所述實施例的示例在附圖中示出,其中自始至終相同或類似的標號表示相同或類似的模塊或具有相同或類似功能的模塊。下面通過參考附圖描述的實施例是示例性的,僅用于解釋本發(fā)明,而不能理解為對本發(fā)明的限制。相反,本發(fā)明的實施例包括落入所附加權(quán)利要求書的精神和內(nèi)涵范圍內(nèi)的所有變化、修改和等同物。\n[0020] 圖1是本發(fā)明一實施例提出的聲紋認證方法的流程示意圖,該方法包括:\n[0021] S11:向用戶展示提示文本,所述提示文本是所述用戶預(yù)先注冊的短語的組合。\n[0022] 其中,在用戶需要進行聲紋認證時,可以先獲取該用戶的用戶標識(用戶ID),例如,手機號,登錄賬號等,之后在預(yù)先建立的注冊信息中查找與該用戶標識對應(yīng)的注冊過的短語。\n[0023] 例如,用戶是第一用戶,在注冊信息中第一用戶注冊過的短語包括:A,B,C等,則可以從A,B,C中選擇出短語組合成提示文本。\n[0024] 其中,在注冊過的短語中選擇組合成提示文本的短語時,選擇算法以及選擇個數(shù)是可配置的。\n[0025] 可選的,所述預(yù)先注冊的短語為多個,所述向用戶展示提示文本之前,所述方法還包括:\n[0026] 在預(yù)先注冊的多個短語中隨機選擇一個或多個短語,并將選擇的短語組合成所述提示文本。\n[0027] 例如,選擇算法是隨機選擇,選擇個數(shù)是兩個,假設(shè)預(yù)先注冊過的短語包括:“我們”,“真的”,“憤怒的”,“公?!保霸诔燥垺?,“不洗手”,則可以在這六個短語中隨機選擇出兩個組合成提示文本,提示文本例如為:“憤怒的公?!保罢娴牟幌词帧钡?。\n[0028] 可以理解的是,選擇出的組合成提示文本的短語的個數(shù)不限定,可以是一個或者多個。另外,提示文本的個數(shù)也不限定,也可以是一個或者多個。后續(xù)實施例以一個提示文本的認證流程為例,可以理解的是,當(dāng)提示文本是多個時,可以依照一個提示文本的認證流程完成所有提示文本的認證流程,并在均認證成功后確定聲紋認證成功,否則認證失敗。\n[0029] S12:獲取所述用戶朗誦所述提示文本的語音。\n[0030] 在將提示文本展示給用戶之后,用戶可以依據(jù)提示文本進行朗誦。\n[0031] 執(zhí)行該方法的認證裝置內(nèi)可以設(shè)置語音獲取模塊,從而可以獲取用戶朗誦的語音。例如,該認證裝置可以包括前臺模塊和后臺模塊,前臺模塊可以設(shè)置在用戶設(shè)備內(nèi),用戶設(shè)備內(nèi)還可以包含語音獲取模塊,從而獲取用戶朗誦的語音。\n[0032] S13:在所述語音與所述提示文本一致時,獲取預(yù)先建立的注冊模型,并根據(jù)所述語音和所述注冊模型,確定聲紋認證結(jié)果。\n[0033] 例如,參見圖2,在獲取語音后,該方法還包括:\n[0034] S21:判斷該語音是否與提示文本一致。\n[0035] 其中,由于提示文本是該認證裝置展示給用戶的,因此,認證裝置內(nèi)會保存該提示文本。\n[0036] 另外,當(dāng)該認證裝置獲取到語音后,例如可以通過語音識別等技術(shù)確定語音對應(yīng)的文本,之后再將該文本與保存的提示文本進行比對,判斷兩者是否一致。\n[0037] S22:如果不一致,返回錯誤,提示文本不一致。\n[0038] 例如,經(jīng)過比對,兩個文本不一致時,可以提示用戶文本不一致,用戶可以進行重新朗誦等操作。\n[0039] 在兩者一致時,可以根據(jù)該語音和預(yù)先建立的注冊模型,確定聲紋認證結(jié)果。\n[0040] 可選的,所述獲取預(yù)先建立的注冊模型,并根據(jù)所述語音和所述注冊模型,確定聲紋認證結(jié)果,包括:\n[0041] 對所述語音進行切分,得到與所述短語對應(yīng)的短語語音;獲取預(yù)先建立的與所述短語對應(yīng)的注冊模型;將所述短語語音作為待認證的語音,將所述注冊模型作為認證模型,并根據(jù)所述待認證的語音和所述認證模型,確定聲紋認證結(jié)果;或者,\n[0042] 獲取預(yù)先建立的與所述短語對應(yīng)的注冊模型;對所述注冊模型進行組合,得到組合后的注冊模型;將所述語音作為待認證的語音,將所述組合后的注冊模型作為認證模型,并根據(jù)所述待認證的語音和所述認證模型,確定聲紋認證結(jié)果;或者,\n[0043] 獲取預(yù)先建立的與所述提示文本對應(yīng)的注冊模型;將所述語音作為待認證的語音,將所述注冊模型作為認證模型,并根據(jù)所述待認證的語音和所述認證模型,確定聲紋認證結(jié)果。\n[0044] 例如,獲取的語音是“憤怒的公牛”的語音,則可以對該語音進行切分,得到的短信語音包括:“憤怒的”對應(yīng)的語音,以及,“公?!睂?yīng)的語音。之后,與注冊時存儲的“憤怒的”對應(yīng)的語音,以及,“公?!睂?yīng)的語音分別進行匹配,得到聲紋認證結(jié)果。其中,在語音切分時,可以采用預(yù)先建立的切分模型,該切分模型可以根據(jù)注冊時的短語對應(yīng)的短語語音建立,例如,切分模型中記錄注冊時每個短語語音的起止標識,從而可以根據(jù)起止標識可以完成對語音切分,得到短語語音。\n[0045] 又例如,確定當(dāng)前的提示文本是“憤怒的公?!睍r,可以在注冊信息中查找到“憤怒的”對應(yīng)的語音,以及,“公?!睂?yīng)的語音,之后將這兩個語音進行組合,得到組合后的語音,再將該組合后的語音與獲取的用戶朗誦的“憤怒的公牛”的語音進行匹配,得到聲紋認證結(jié)果。\n[0046] 又例如,在注冊時,不是如上建立短語的注冊模型,而是建立可能的提示文本的注冊模型,例如,建立“憤怒的公?!钡恼Z音對應(yīng)的注冊模型,從而在認證時,可以獲取“憤怒的公牛”對應(yīng)的注冊模型,再與獲取的用戶朗誦的“憤怒的公牛”的語音進行匹配,得到聲紋認證結(jié)果。\n[0047] 參見圖2,以語音切分為例,在S21判斷出是一致時,該方法還包括:\n[0048] S23:將該語音切分為短語語音。\n[0049] 其中,在語音切分時,可以采用預(yù)先建立的切分模型,該切分模型可以根據(jù)注冊時的短語對應(yīng)的短語語音建立,例如,切分模型中記錄注冊時每個短語語音的起止標識,從而可以根據(jù)起止標識可以完成對語音切分,得到短語語音。\n[0050] S24:計算每個短語語音與相應(yīng)的注冊模型的匹配數(shù)值。\n[0051] 匹配數(shù)值的計算方法包括但不限于:用于隱馬爾可夫模型(Hidden?Markov?\nModel,HMM)的Viterbi打分,和用于ivector模型的概率線性鑒別分析(Probabilistic?Linear?Discriminant?Analysis,PLDA)打分。\n[0052] S25:判斷是否每個匹配數(shù)值都大于預(yù)設(shè)閾值,若是,執(zhí)行S26,否則,執(zhí)行S27。\n[0053] S26:認證成功。\n[0054] S27:認證失敗。\n[0055] 可選的,所述確定與所述短語對應(yīng)的注冊模型,包括:\n[0056] 獲取所述用戶的用戶標識;\n[0057] 根據(jù)所述用戶的用戶標識,所述短語,以及,注冊時生成的用戶標識、短語及注冊模型的對應(yīng)關(guān)系,確定與所述短語對應(yīng)的注冊模型。\n[0058] 例如,經(jīng)過語音切分,得到的短語語音包括:“憤怒的”的語音,以及,“公?!钡恼Z音。\n[0059] 而注冊會生成如下的對應(yīng)關(guān)系:用戶標識,短語與注冊模塊的對應(yīng)關(guān)系,例如,第一用戶的第一短語對應(yīng)第一注冊模型,則在用戶進行認證時,可以獲取用戶的用戶標識,在切分后可以得到短語,再根據(jù)該對應(yīng)關(guān)系,就可以確定相應(yīng)的注冊模型。\n[0060] 在確定注冊模型后,可以計算該注冊模型與相應(yīng)的短語語音之間的匹配數(shù)值,匹配數(shù)值的計算方法包括但不限于:用于HMM的Viterbi打分,和用于ivector模型的plda打分。\n[0061] 上述描述了認證過程,可以理解的是,在認證之前還可以進行注冊過程,在注冊過程中建立短語的注冊模型。\n[0062] 參見圖3,注冊流程可以包括:\n[0063] S31:向用戶展示待注冊的短語。\n[0064] 其中,待注冊的短語是在注冊之前預(yù)先生成的,待注冊的短語可以是一個或多個。\n[0065] 可選的,所述待注冊的短語為多個時,不同的待注冊的短語滿足如下條件中的至少一項:\n[0066] 不同的待注冊的短語的長度均小于預(yù)設(shè)的長度閾值;\n[0067] 不同的待注冊的短語的長度差值小于預(yù)設(shè)的差值;\n[0068] 不同的待注冊的短語中不包含同音字。\n[0069] 例如,可以設(shè)置待注冊的短語的長度都是兩個字或者三個字,從而使得短語是短文本,且長度基本一致。\n[0070] 又例如,還可以設(shè)置不同的短語中盡量不包含同音字,例如,“公?!焙汀肮笆帧敝卸加術(shù)ong這個發(fā)音,盡量不能同時出現(xiàn)。\n[0071] 可選的,待注冊的短語可以是默認固定設(shè)置的,或者,也可以是用戶在多個可供選擇的短語中選擇得到的。例如,參見圖4,注冊流程還可以包括:\n[0072] S41:向所述用戶展示可供選擇的短語。\n[0073] 例如,參見圖5,展示選擇界面51,該選擇界面中包含可供選擇的短語,可供選擇的短語例如包括:我們,真的,煩怒的,…。\n[0074] S42:獲取所述用戶在所述可供選擇的短語中,選擇的所述待注冊的短語。\n[0075] 在向用戶展示如圖5所示的短語后,用戶可以在這些短語中選擇待注冊的短語,例如,選擇的待注冊的短語包括:真的,煩怒的,不洗手,孔雀。之后,在完成對這些待注冊的短語的注冊后,可以在認證流程時生成提示文本。例如,提示文本可以包括:孔雀不洗手,煩怒的孔雀不洗手,憤怒的孔雀真的不洗手??梢岳斫獾氖牵緦嵤├幸赃壿嬌系亩陶Z組合為例,為了提高可讀性,可以在將短語進行組合后再檢查語法等,當(dāng)符合語法等要求后,再將該提示文本展示給用戶。\n[0076] 之后,可以將該待注冊的短語展示給用戶,用戶可以朗誦該待注冊的短語。\n[0077] S32:獲取所述用戶朗誦所述待注冊的短語的語音。\n[0078] 例如,用戶依次朗誦每個待注冊的短語,通過用戶設(shè)備內(nèi)的語音獲取模塊可以獲取到相應(yīng)的語音。\n[0079] S33:在所述用戶朗誦的語音與所述待注冊的短語一致時,建立所述待注冊的短語的注冊模型。\n[0080] 可選的,所述用戶朗誦的語音為多次,所述在所述用戶朗誦的語音與所述待注冊的短語一致時,建立所述待注冊的短語的注冊模型,包括:\n[0081] 在每次所述用戶朗誦的語音都與所述待注冊的短語一致時,根據(jù)多次朗誦的語音,建立所述待注冊的短語的注冊模型。\n[0082] 例如,用戶朗誦“真的”時,可以設(shè)置為需要朗誦多次,在每次朗誦之后,通過語音識別等技術(shù)識別出相應(yīng)的文本,如果與“真的”一致,則可以根據(jù)多次的語音建立“真的”對應(yīng)的注冊模型。\n[0083] 根據(jù)語音建立注冊模型的方式有多種,例如建立的注冊模塊包括但不限于:基于HMM的聲紋模型,基于ivector的聲紋模型。\n[0084] 本實施例中,通過比對朗誦的語音與注冊模型,可以實現(xiàn)基于限定文本的聲紋認證,由于采用注冊模型,相當(dāng)于文本無關(guān)方式,可以保證用戶在認證時不需要說太長時間的話;另外,由于提示文本是對預(yù)先注冊的短語的組合,相當(dāng)于文本相關(guān)方式中采用固定的注冊短語的方式,可以保證語音內(nèi)容的變化性,從而防止錄音欺騙。本實施例采用聲紋認證,不易被模仿,安全程度增強,增加了便利性。當(dāng)用在支付時,可以不在需要用戶輸入密碼,也不用驗證短信,提高了使用過程的便利性和支付效率。\n[0085] 圖6是本發(fā)明另一實施例提出的聲紋認證裝置的結(jié)構(gòu)示意圖,該裝置60包括:\n[0086] 第一展示模塊61,用于向用戶展示提示文本,所述提示文本是所述用戶預(yù)先注冊的短語的組合;\n[0087] 其中,在用戶需要進行聲紋認證時,可以先獲取該用戶的用戶標識(用戶ID),例如,手機號,登錄賬號等,之后在預(yù)先建立的注冊信息中查找與該用戶標識對應(yīng)的注冊過的短語。\n[0088] 例如,用戶是第一用戶,在注冊信息中第一用戶注冊過的短語包括:A,B,C等,則可以從A,B,C中選擇出短語組合成提示文本。\n[0089] 其中,在注冊過的短語中選擇組合成提示文本的短語時,選擇算法以及選擇個數(shù)是可配置的。\n[0090] 可選的,所述預(yù)先注冊的短語為多個,參見圖7,所述裝置60還包括:\n[0091] 生成模塊64,用于在預(yù)先注冊的多個短語中隨機選擇一個或多個短語,并將選擇的短語組合成所述提示文本。\n[0092] 例如,選擇算法是隨機選擇,選擇個數(shù)是兩個,假設(shè)預(yù)先注冊過的短語包括:“我們”,“真的”,“憤怒的”,“公?!?,“在吃飯”,“不洗手”,則可以在這六個短語中隨機選擇出兩個組合成提示文本,提示文本例如為:“憤怒的公?!?,“真的不洗手”等。\n[0093] 可以理解的是,選擇出的組合成提示文本的短語的個數(shù)不限定,可以是一個或者多個。另外,提示文本的個數(shù)也不限定,也可以是一個或者多個。后續(xù)實施例以一個提示文本的認證流程為例,可以理解的是,當(dāng)提示文本是多個時,可以依照一個提示文本的認證流程完成所有提示文本的認證流程,并在均認證成功后確定聲紋認證成功,否則認證失敗。\n[0094] 第一獲取模塊62,用于獲取所述用戶朗誦所述提示文本的語音;\n[0095] 在將提示文本展示給用戶之后,用戶可以依據(jù)提示文本進行朗誦。\n[0096] 第一獲取模塊可以是語音獲取模塊,從而獲取用戶朗誦的語音。\n[0097] 認證模塊63,用于在所述語音與所述提示文本一致時,獲取預(yù)先建立的注冊模型,并根據(jù)所述語音和所述注冊模型,確定聲紋認證結(jié)果。\n[0098] 其中,由于提示文本是該認證裝置展示給用戶的,因此,認證裝置內(nèi)會保存該提示文本。\n[0099] 另外,當(dāng)該認證裝置獲取到語音后,例如可以通過語音識別等技術(shù)確定語音對應(yīng)的文本,之后再將該文本與保存的提示文本進行比對,判斷兩者是否一致。\n[0100] 另一方面,如果不一致,返回錯誤,提示文本不一致。例如,經(jīng)過比對,兩個文本不一致時,可以提示用戶文本不一致,用戶可以進行重新朗誦等操作。\n[0101] 可選的,所述認證模塊63具體用于:\n[0102] 對所述語音進行切分,得到與所述短語對應(yīng)的短語語音;獲取預(yù)先建立的與所述短語對應(yīng)的注冊模型;將所述短語語音作為待認證的語音,將所述注冊模型作為認證模型,并根據(jù)所述待認證的語音和所述認證模型,確定聲紋認證結(jié)果;或者,\n[0103] 獲取預(yù)先建立的與所述短語對應(yīng)的注冊模型;對所述注冊模型進行組合,得到組合后的注冊模型;將所述語音作為待認證的語音,將所述組合后的注冊模型作為認證模型,并根據(jù)所述待認證的語音和所述認證模型,確定聲紋認證結(jié)果;或者,\n[0104] 獲取預(yù)先建立的與所述提示文本對應(yīng)的注冊模型;將所述語音作為待認證的語音,將所述注冊模型作為認證模型,并根據(jù)所述待認證的語音和所述認證模型,確定聲紋認證結(jié)果。\n[0105] 例如,獲取的語音是“憤怒的公?!钡恼Z音,則可以對該語音進行切分,得到的短信語音包括:“憤怒的”對應(yīng)的語音,以及,“公?!睂?yīng)的語音。之后,與注冊時存儲的“憤怒的”對應(yīng)的語音,以及,“公?!睂?yīng)的語音分別進行匹配,得到聲紋認證結(jié)果。其中,在語音切分時,可以采用預(yù)先建立的切分模型,該切分模型可以根據(jù)注冊時的短語對應(yīng)的短語語音建立,例如,切分模型中記錄注冊時每個短語語音的起止標識,從而可以根據(jù)起止標識可以完成對語音切分,得到短語語音。\n[0106] 又例如,確定當(dāng)前的提示文本是“憤怒的公?!睍r,可以在注冊信息中查找到“憤怒的”對應(yīng)的語音,以及,“公?!睂?yīng)的語音,之后將這兩個語音進行組合,得到組合后的語音,再將該組合后的語音與獲取的用戶朗誦的“憤怒的公?!钡恼Z音進行匹配,得到聲紋認證結(jié)果。\n[0107] 又例如,在注冊時,不是如上建立短語的注冊模型,而是建立可能的提示文本的注冊模型,例如,建立“憤怒的公牛”的語音對應(yīng)的注冊模型,從而在認證時,可以獲取“憤怒的公?!睂?yīng)的注冊模型,再與獲取的用戶朗誦的“憤怒的公牛”的語音進行匹配,得到聲紋認證結(jié)果。\n[0108] 可選的,所述認證模塊63用于根據(jù)所述待認證的語音和所述認證模型,確定聲紋認證結(jié)果,包括:\n[0109] 計算所述待認證的語音與所述認證模型之間的匹配數(shù)值;\n[0110] 如果所述匹配數(shù)值大于預(yù)設(shè)閾值,則確定聲紋認證結(jié)果是認證成功。\n[0111] 可選的,所述認證模塊63用于獲取預(yù)先建立的與所述短語對應(yīng)的注冊模型,包括:\n[0112] 獲取所述用戶的用戶標識;\n[0113] 根據(jù)所述用戶的用戶標識,所述短語,以及,注冊時生成的用戶標識、短語及注冊模型的對應(yīng)關(guān)系,獲取與所述短語對應(yīng)的注冊模型。\n[0114] 例如,經(jīng)過語音切分,得到的短語語音包括:“憤怒的”的語音,以及,“公?!钡恼Z音。\n[0115] 而注冊會生成如下的對應(yīng)關(guān)系:用戶標識,短語與注冊模塊的對應(yīng)關(guān)系,例如,第一用戶的第一短語對應(yīng)第一注冊模型,則在用戶進行認證時,可以獲取用戶的用戶標識,在切分后可以得到短語,再根據(jù)該對應(yīng)關(guān)系,就可以確定相應(yīng)的注冊模型。\n[0116] 在確定注冊模型后,可以計算該注冊模型與相應(yīng)的短語語音之間的匹配數(shù)值,匹配數(shù)值的計算方法包括但不限于:用于HMM的Viterbi打分,和用于ivector模型的plda打分。\n[0117] 另一實施例中,參見圖7,該裝置60還包括:\n[0118] 第二展示模塊65,用于向所述用戶展示待注冊的短語;\n[0119] 其中,待注冊的短語是在注冊之前預(yù)先生成的,待注冊的短語可以是一個或多個。\n[0120] 可選的,所述待注冊的短語為多個時,不同的待注冊的短語滿足如下條件中的至少一項:\n[0121] 不同的待注冊的短語的長度均小于預(yù)設(shè)的長度閾值;\n[0122] 不同的待注冊的短語的長度差值小于預(yù)設(shè)的差值;\n[0123] 不同的待注冊的短語中不包含同音字。\n[0124] 例如,可以設(shè)置待注冊的短語的長度都是兩個字或者三個字,從而使得短語是短文本,且長度基本一致。\n[0125] 又例如,還可以設(shè)置不同的短語中盡量不包含同音字,例如,“公牛”和“拱手”中都有g(shù)ong這個發(fā)音,盡量不能同時出現(xiàn)。\n[0126] 可選的,待注冊的短語可以是默認固定設(shè)置的,或者,也可以是用戶在多個可供選擇的短語中選擇得到的。\n[0127] 另一實施例中,參見圖7,該裝置60還包括:\n[0128] 第三展示模塊66,用于向所述用戶展示可供選擇的短語;\n[0129] 例如,參見圖5,展示選擇界面51,該選擇界面中包含可供選擇的短語,可供選擇的短語例如包括:我們,真的,煩怒的,…。\n[0130] 第三獲取模塊67,用于獲取所述用戶在所述可供選擇的短語中,選擇的所述待注冊的短語。\n[0131] 在向用戶展示如圖5所示的短語后,用戶可以在這些短語中選擇待注冊的短語,例如,選擇的待注冊的短語包括:真的,煩怒的,不洗手,孔雀。之后,在完成對這些待注冊的短語的注冊后,可以在認證流程時生成提示文本。例如,提示文本可以包括:孔雀不洗手,煩怒的孔雀不洗手,憤怒的孔雀真的不洗手??梢岳斫獾氖?,本實施例中以邏輯上的短語組合為例,為了提高可讀性,可以在將短語進行組合后再檢查語法等,當(dāng)符合語法等要求后,再將該提示文本展示給用戶。\n[0132] 之后,可以將該待注冊的短語展示給用戶,用戶可以朗誦該待注冊的短語。\n[0133] 第二獲取模塊68,用于獲取所述用戶朗誦所述待注冊的短語的語音;\n[0134] 例如,用戶依次朗誦每個待注冊的短語,通過用戶設(shè)備內(nèi)的語音獲取模塊可以獲取到相應(yīng)的語音。\n[0135] 建模模塊69,用于在所述用戶朗誦的語音與所述待注冊的短語一致時,建立所述待注冊的短語的注冊模型。\n[0136] 可選的,所述用戶朗誦的語音為多次,所述建模模塊69具體用于:\n[0137] 在每次所述用戶朗誦的語音都與所述待注冊的短語一致時,根據(jù)多次朗誦的語音,建立所述待注冊的短語的注冊模型。\n[0138] 例如,用戶朗誦“真的”時,可以設(shè)置為需要朗誦多次,在每次朗誦之后,通過語音識別等技術(shù)識別出相應(yīng)的文本,如果與“真的”一致,則可以根據(jù)多次的語音建立“真的”對應(yīng)的注冊模型。\n[0139] 根據(jù)語音建立注冊模型的方式有多種,例如建立的注冊模塊包括但不限于:基于HMM的聲紋模型,基于ivector的聲紋模型。\n[0140] 本實施例中,通過比對朗誦的語音與注冊模型,可以實現(xiàn)基于限定文本的聲紋認證,由于采用注冊模型,相當(dāng)于文本無關(guān)方式,可以保證用戶在認證時不需要說太長時間的話;另外,由于提示文本是對預(yù)先注冊的短語的組合,相當(dāng)于文本相關(guān)方式中采用固定的注冊短語的方式,可以保證語音內(nèi)容的變化性,從而防止錄音欺騙。本實施例采用聲紋認證,不易被模仿,安全程度增強,增加了便利性。當(dāng)用在支付時,可以不在需要用戶輸入密碼,也不用驗證短信,提高了使用過程的便利性和支付效率。\n[0141] 需要說明的是,在本發(fā)明的描述中,術(shù)語“第一”、“第二”等僅用于描述目的,而不能理解為指示或暗示相對重要性。此外,在本發(fā)明的描述中,除非另有說明,“多個”的含義是指至少兩個。\n[0142] 流程圖中或在此以其他方式描述的任何過程或方法描述可以被理解為,表示包括一個或更多個用于實現(xiàn)特定邏輯功能或過程的步驟的可執(zhí)行指令的代碼的模塊、片段或部分,并且本發(fā)明的優(yōu)選實施方式的范圍包括另外的實現(xiàn),其中可以不按所示出或討論的順序,包括根據(jù)所涉及的功能按基本同時的方式或按相反的順序,來執(zhí)行功能,這應(yīng)被本發(fā)明的實施例所屬技術(shù)領(lǐng)域的技術(shù)人員所理解。\n[0143] 應(yīng)當(dāng)理解,本發(fā)明的各部分可以用硬件、軟件、固件或它們的組合來實現(xiàn)。在上述實施方式中,多個步驟或方法可以用存儲在存儲器中且由合適的指令執(zhí)行系統(tǒng)執(zhí)行的軟件或固件來實現(xiàn)。例如,如果用硬件來實現(xiàn),和在另一實施方式中一樣,可用本領(lǐng)域公知的下列技術(shù)中的任一項或他們的組合來實現(xiàn):具有用于對數(shù)據(jù)信號實現(xiàn)邏輯功能的邏輯門電路的離散邏輯電路,具有合適的組合邏輯門電路的專用集成電路,可編程門陣列(PGA),現(xiàn)場可編程門陣列(FPGA)等。\n[0144] 本技術(shù)領(lǐng)域的普通技術(shù)人員可以理解實現(xiàn)上述實施例方法攜帶的全部或部分步驟是可以通過程序來指令相關(guān)的硬件完成,所述的程序可以存儲于一種計算機可讀存儲介質(zhì)中,該程序在執(zhí)行時,包括方法實施例的步驟之一或其組合。\n[0145] 此外,在本發(fā)明各個實施例中的各功能單元可以集成在一個處理模塊中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個模塊中。上述集成的模塊既可以采用硬件的形式實現(xiàn),也可以采用軟件功能模塊的形式實現(xiàn)。所述集成的模塊如果以軟件功能模塊的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時,也可以存儲在一個計算機可讀取存儲介質(zhì)中。\n[0146] 上述提到的存儲介質(zhì)可以是只讀存儲器,磁盤或光盤等。\n[0147] 在本說明書的描述中,參考術(shù)語“一個實施例”、“一些實施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點包含于本發(fā)明的至少一個實施例或示例中。在本說明書中,對上述術(shù)語的示意性表述不一定指的是相同的實施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點可以在任何的一個或多個實施例或示例中以合適的方式結(jié)合。\n[0148] 盡管上面已經(jīng)示出和描述了本發(fā)明的實施例,可以理解的是,上述實施例是示例性的,不能理解為對本發(fā)明的限制,本領(lǐng)域的普通技術(shù)人員在本發(fā)明的范圍內(nèi)可以對上述實施例進行變化、修改、替換和變型。
法律信息
- 2017-08-18
- 2016-01-20
實質(zhì)審查的生效
IPC(主分類): G10L 17/00
專利申請?zhí)? 201510337291.8
申請日: 2015.06.17
- 2015-12-23
引用專利(該專利引用了哪些專利)
序號 | 公開(公告)號 | 公開(公告)日 | 申請日 | 專利名稱 | 申請人 |
1
| |
2006-07-26
|
2006-01-26
| | |
2
| |
2012-05-16
|
2010-10-19
| | |
3
| |
2011-08-03
|
2011-03-25
| | |
被引用專利(該專利被哪些專利引用)
序號 | 公開(公告)號 | 公開(公告)日 | 申請日 | 專利名稱 | 申請人 | 該專利沒有被任何外部專利所引用! |