<strike id="ywled"></strike>

<button id="ywled"></button>

首頁專利查詢專利詳情

*來源于國(guó)家知識(shí)產(chǎn)權(quán)局?jǐn)?shù)據(jù)，僅供參考，實(shí)際以國(guó)家知識(shí)產(chǎn)權(quán)局展示為準(zhǔn)

基于位置標(biāo)記的語音識(shí)別模型

發(fā)明專利有效專利

申請(qǐng)?zhí)枺?/span>
CN201380040775.5
IPC分類號(hào)：H04M1/725;G10L15/30
申請(qǐng)日期：
2013-07-23
申請(qǐng)人：
谷歌公司

基礎(chǔ)信息

權(quán)利要求

說明書

PDF全文

法律信息

引證文獻(xiàn)

著錄項(xiàng)信息

專利名稱	基于位置標(biāo)記的語音識(shí)別模型
申請(qǐng)?zhí)?/td>	CN201380040775.5	申請(qǐng)日期	2013-07-23
法律狀態(tài)	暫無	申報(bào)國(guó)家	中國(guó)
公開/公告日	2015-04-08	公開/公告號(hào)	CN104509079A
優(yōu)先權(quán)	暫無	優(yōu)先權(quán)號(hào)	暫無
主分類號(hào)	H04M1/725 ? IPC結(jié)構(gòu)圖譜： H 電學(xué) H9 電學(xué) H04 電通信技術(shù) H04M 電話通信（通過電話電纜控制其他設(shè)備，但不包括電話交換設(shè)備的電路入G08） H04M1/00 分局設(shè)備，例如用戶使用的（交換機(jī)提供的用戶服務(wù)或設(shè)備入H04M 3/00；預(yù)付費(fèi)電話硬幣箱入H04M 17/00；電流供給裝置入H04M 19/08）〔1，7〕 H04M1/72 分局的分機(jī)裝置；無繩電話機(jī)，即無需路由選擇建立無線鏈路到基站的設(shè)備〔1，7〕 H04M1/725 無繩電話機(jī)〔7〕	IPC分類號(hào)	H;0;4;M;1;/;7;2;5;;;G;1;0;L;1;5;/;3;0查看分類表>
申請(qǐng)人	谷歌公司	申請(qǐng)人地址	美國(guó)加利福尼亞州變更專利地址、主體等相關(guān)變化，請(qǐng)及時(shí)變更，防止失效
權(quán)利人	谷歌有限責(zé)任公司	當(dāng)前權(quán)利人	谷歌有限責(zé)任公司
發(fā)明人	G·陶布曼;B·斯特羅普
代理機(jī)構(gòu)	北京市金杜律師事務(wù)所	代理人	酆迅

摘要

公開了用于使用模型執(zhí)行語音識(shí)別的方法、系統(tǒng)和包括編碼在計(jì)算機(jī)存儲(chǔ)介質(zhì)上的計(jì)算機(jī)程序的裝置，該模型基于其中說話者做出話語的建筑物內(nèi)的位置。所述方法、系統(tǒng)和裝置包括接收對(duì)應(yīng)于話語的數(shù)據(jù)和獲得用于其中話語被說出的建筑物內(nèi)的區(qū)域的位置標(biāo)記的動(dòng)作。進(jìn)一步的動(dòng)作包括基于位置標(biāo)記選擇用于語音識(shí)別的一個(gè)或多個(gè)模型，其中每個(gè)所選擇的一個(gè)或多個(gè)模型與基于位置標(biāo)記的權(quán)重相關(guān)聯(lián)。此外，動(dòng)作還包括使用所選擇的一個(gè)或多個(gè)模型和所選擇的一個(gè)或多個(gè)模型的相應(yīng)權(quán)重生成復(fù)合模型。所述動(dòng)作還包括使用復(fù)合模型生成話語的轉(zhuǎn)錄。

1.一種用于處理語音的計(jì)算機(jī)實(shí)現(xiàn)的方法，包括：
在處理系統(tǒng)處接收對(duì)應(yīng)于話語的數(shù)據(jù)；
在所述處理系統(tǒng)處獲得用于其中所述話語被說出的建筑物內(nèi)的區(qū)域的位置標(biāo)記；
在所述處理系統(tǒng)處基于所述位置標(biāo)記來確定可能性集合，所述集合中的每個(gè)可能性對(duì)應(yīng)于所述話語在來自所述建筑物的多個(gè)候選區(qū)域中的所述建筑物的特定區(qū)域被說出的可能性；
在所述處理系統(tǒng)處基于所述可能性集合來從所述建筑物的所述多個(gè)候選區(qū)域選擇所述建筑物的一個(gè)或者多個(gè)候選區(qū)域；
針對(duì)所述建筑物的每個(gè)選擇的候選區(qū)域，訪問與所述建筑物的每個(gè)相應(yīng)的候選區(qū)域相關(guān)聯(lián)的用于語音識(shí)別的模型；
在所述處理系統(tǒng)處使用訪問的所述用于語音識(shí)別的模型以及與所述建筑物的對(duì)應(yīng)的候選區(qū)域相關(guān)聯(lián)的所述可能性來生成復(fù)合模型；以及
在所述處理系統(tǒng)處使用所述復(fù)合模型來生成所述話語的轉(zhuǎn)錄。
2.根據(jù)權(quán)利要求1所述的方法，
其中接收對(duì)應(yīng)于所述話語的數(shù)據(jù)包括：從客戶端設(shè)備接收對(duì)應(yīng)于所述話語的數(shù)據(jù)，其中獲得用于其中所述話語被說出的建筑物內(nèi)的區(qū)域的位置標(biāo)記包括：從所述客戶端設(shè)備接收用于其中所述話語被說出的所述建筑物內(nèi)的所述區(qū)域的位置標(biāo)記。
3.根據(jù)權(quán)利要求2所述的方法，其中所述位置標(biāo)記包括：基于在所述客戶端設(shè)備處接收的短程無線電傳輸?shù)奈恢脭?shù)據(jù)。
4.根據(jù)權(quán)利要求1所述的方法，其中獲得所述位置標(biāo)記包括：
使用位置無關(guān)語言模型生成所述話語的一個(gè)或多個(gè)候選轉(zhuǎn)錄；以及
基于將所述一個(gè)或多個(gè)候選轉(zhuǎn)錄與一個(gè)或多個(gè)位置相關(guān)語言模型中的短語進(jìn)行比較，標(biāo)識(shí)所述建筑物內(nèi)的一個(gè)或多個(gè)候選區(qū)域。
5.根據(jù)權(quán)利要求1所述的方法，
其中接收對(duì)應(yīng)于所述話語的數(shù)據(jù)包括：從在所述建筑物處的處理系統(tǒng)接收對(duì)應(yīng)于所述話語的數(shù)據(jù)，并且
其中獲得用于其中所述話語被說出的建筑物內(nèi)的區(qū)域的位置標(biāo)記包括：從在所述建筑物處的所述處理系統(tǒng)接收用于其中所述話語被說出的所述建筑物內(nèi)的所述區(qū)域的位置標(biāo)記。
6.根據(jù)權(quán)利要求5所述的方法，其中所述位置標(biāo)記包括從所述處理系統(tǒng)獲得的位置數(shù)據(jù)，其中所述處理系統(tǒng)使用被布置在所述建筑物中的麥克風(fēng)陣列定位所述話語，并且其中所述麥克風(fēng)陣列可操作地耦合到所述處理系統(tǒng)。
7.根據(jù)權(quán)利要求1所述的方法，
其中與所述建筑物的所述候選區(qū)域相關(guān)聯(lián)的每個(gè)用于語音識(shí)別的模型包括語言模型；
以及
其中所述復(fù)合模型包括復(fù)合語言模型。
8.根據(jù)權(quán)利要求1所述的方法，
其中與所述建筑物的所述候選區(qū)域相關(guān)聯(lián)的每個(gè)用于語音識(shí)別的模型包括聲學(xué)模型；
以及
其中所述復(fù)合模型包括復(fù)合聲學(xué)模型。
9.一種用于處理語音的系統(tǒng)，包括：
一個(gè)或多個(gè)計(jì)算機(jī)和存儲(chǔ)指令的一個(gè)或多個(gè)存儲(chǔ)設(shè)備，所述指令在被所述一個(gè)或多個(gè)計(jì)算機(jī)執(zhí)行時(shí)，使得所述一個(gè)或多個(gè)計(jì)算機(jī)執(zhí)行操作，所述操作包括：
接收對(duì)應(yīng)于話語的數(shù)據(jù)；
獲得用于其中所述話語被說出的建筑物內(nèi)的區(qū)域的位置標(biāo)記；
基于所述位置標(biāo)記來確定可能性集合，所述集合中的每個(gè)可能性對(duì)應(yīng)于所述話語在來自所述建筑物的多個(gè)候選區(qū)域中的所述建筑物的特定區(qū)域被說出的可能性；
基于所述可能性集合來從所述建筑物的所述多個(gè)候選區(qū)域選擇所述建筑物的一個(gè)或者多個(gè)候選區(qū)域；
針對(duì)所述建筑物的每個(gè)選擇的候選區(qū)域，訪問與所述建筑物的每個(gè)相應(yīng)的候選區(qū)域相關(guān)聯(lián)的用于語音識(shí)別的模型；
使用訪問的所述用于語音識(shí)別的模型以及與所述建筑物的對(duì)應(yīng)的候選區(qū)域相關(guān)聯(lián)的所述可能性來生成復(fù)合模型；以及
使用所述復(fù)合模型生成所述話語的轉(zhuǎn)錄。
10.根據(jù)權(quán)利要求9所述的系統(tǒng)，
其中接收對(duì)應(yīng)于所述話語的數(shù)據(jù)包括：從客戶端設(shè)備接收對(duì)應(yīng)于所述話語的數(shù)據(jù)，其中獲得用于其中所述話語被說出的建筑物內(nèi)的區(qū)域的位置標(biāo)記包括：從所述客戶端設(shè)備接收用于其中所述話語被說出的所述建筑物內(nèi)的所述區(qū)域的位置標(biāo)記。
11.根據(jù)權(quán)利要求10所述的系統(tǒng)，其中所述位置標(biāo)記包括：基于在所述客戶端設(shè)備處接收的短程無線電傳輸?shù)奈恢脭?shù)據(jù)。
12.根據(jù)權(quán)利要求9所述的系統(tǒng)，其中獲得所述位置標(biāo)記包括：
使用位置無關(guān)語言模型生成所述話語的一個(gè)或多個(gè)候選轉(zhuǎn)錄；以及
基于將所述一個(gè)或多個(gè)候選轉(zhuǎn)錄與一個(gè)或多個(gè)位置相關(guān)語言模型中的短語進(jìn)行比較，標(biāo)識(shí)所述建筑物內(nèi)的一個(gè)或多個(gè)候選區(qū)域。
13.根據(jù)權(quán)利要求9所述的系統(tǒng)，
其中接收對(duì)應(yīng)于所述話語的數(shù)據(jù)包括：從在所述建筑物處的處理系統(tǒng)接收對(duì)應(yīng)于所述話語的數(shù)據(jù)，并且
其中獲得用于其中所述話語被說出的建筑物內(nèi)的區(qū)域的位置標(biāo)記包括：從在所述建筑物處的所述處理系統(tǒng)接收用于其中所述話語被說出的所述建筑物內(nèi)的所述區(qū)域的位置標(biāo)記。
14.根據(jù)權(quán)利要求13所述的系統(tǒng)，其中所述位置標(biāo)記包括從所述處理系統(tǒng)獲得的位置數(shù)據(jù)，其中所述處理系統(tǒng)使用被布置在所述建筑物中的麥克風(fēng)陣列定位所述話語，并且其中所述麥克風(fēng)陣列可操作地耦合到所述處理系統(tǒng)。
15.根據(jù)權(quán)利要求9所述的系統(tǒng)，
其中與所述建筑物的所述候選區(qū)域相關(guān)聯(lián)的每個(gè)用于語音識(shí)別的模型包括語言模型；
以及
其中所述復(fù)合模型包括復(fù)合語言模型。
16.根據(jù)權(quán)利要求9所述的系統(tǒng)，
其中與所述建筑物的所述候選區(qū)域相關(guān)聯(lián)的每個(gè)用于語音識(shí)別的模型包括聲學(xué)模型；
以及
其中所述復(fù)合模型包括復(fù)合聲學(xué)模型。
17.一種用于處理語音的裝置，包括：
用于接收對(duì)應(yīng)于話語的數(shù)據(jù)的部件；
用于獲得用于其中所述話語被說出的建筑物內(nèi)的區(qū)域的位置標(biāo)記的部件；
用于基于所述位置標(biāo)記來確定可能性集合的部件，所述集合中的每個(gè)可能性對(duì)應(yīng)于所述話語在來自所述建筑物的多個(gè)候選區(qū)域中的所述建筑物的特定區(qū)域被說出的可能性；
用于基于所述可能性集合來從所述建筑物的所述多個(gè)候選區(qū)域選擇所述建筑物的一個(gè)或者多個(gè)候選區(qū)域的部件；
用于針對(duì)所述建筑物的每個(gè)選擇的候選區(qū)域，訪問與所述建筑物的每個(gè)相應(yīng)的候選區(qū)域相關(guān)聯(lián)的用于語音識(shí)別的模型的部件；
用于使用訪問的所述用于語音識(shí)別的模型以及與所述建筑物的對(duì)應(yīng)的候選區(qū)域相關(guān)聯(lián)的所述可能性來生成復(fù)合模型的部件；以及
用于使用所述復(fù)合模型生成所述話語的轉(zhuǎn)錄的部件。
18.根據(jù)權(quán)利要求17所述的裝置，
其中用于接收對(duì)應(yīng)于所述話語的數(shù)據(jù)的部件包括：從客戶端設(shè)備接收對(duì)應(yīng)于所述話語的數(shù)據(jù)，
其中用于獲得用于其中所述話語被說出的建筑物內(nèi)的區(qū)域的位置標(biāo)記的部件包括：用于從所述客戶端設(shè)備接收用于其中所述話語被說出的所述建筑物內(nèi)的所述區(qū)域的位置標(biāo)記的部件。
19.根據(jù)權(quán)利要求18所述的裝置，其中所述位置標(biāo)記包括：基于在所述客戶端設(shè)備處接收的短程無線電傳輸?shù)奈恢脭?shù)據(jù)。
20.根據(jù)權(quán)利要求17所述的裝置，其中用于獲得所述位置標(biāo)記的部件包括：
用于使用位置無關(guān)語言模型生成所述話語的一個(gè)或多個(gè)候選轉(zhuǎn)錄的部件；以及用于基于將所述一個(gè)或多個(gè)候選轉(zhuǎn)錄與一個(gè)或多個(gè)位置相關(guān)語言模型中的短語進(jìn)行比較，標(biāo)識(shí)所述建筑物內(nèi)的一個(gè)或多個(gè)候選區(qū)域的部件。
21.根據(jù)權(quán)利要求17所述的裝置，
其中用于接收對(duì)應(yīng)于所述話語的數(shù)據(jù)的部件包括：用于從在所述建筑物處的處理系統(tǒng)接收對(duì)應(yīng)于所述話語的數(shù)據(jù)的部件，并且
其中用于獲得用于其中所述話語被說出的建筑物內(nèi)的區(qū)域的位置標(biāo)記的部件包括：用于從在所述建筑物處的所述處理系統(tǒng)接收用于其中所述話語被說出的所述建筑物內(nèi)的所述區(qū)域的位置標(biāo)記的部件。
22.根據(jù)權(quán)利要求21所述的裝置，其中所述位置標(biāo)記包括從所述處理系統(tǒng)獲得的位置數(shù)據(jù)，其中所述處理系統(tǒng)使用被布置在所述建筑物中的麥克風(fēng)陣列定位所述話語，并且其中所述麥克風(fēng)陣列可操作地耦合到所述處理系統(tǒng)。
23.根據(jù)權(quán)利要求17所述的裝置，
其中與所述建筑物的所述候選區(qū)域相關(guān)聯(lián)的每個(gè)用于語音識(shí)別的模型包括語言模型；
以及
其中所述復(fù)合模型包括復(fù)合語言模型。
24.根據(jù)權(quán)利要求17所述的裝置，
其中與所述建筑物的所述候選區(qū)域相關(guān)聯(lián)的每個(gè)用于語音識(shí)別的模型包括聲學(xué)模型；
以及
其中所述復(fù)合模型包括復(fù)合聲學(xué)模型。
25.一種客戶端設(shè)備，包括：
一個(gè)或多個(gè)處理器和存儲(chǔ)指令的一個(gè)或多個(gè)存儲(chǔ)設(shè)備，所述指令當(dāng)由所述一個(gè)或多個(gè)處理器執(zhí)行時(shí)、可操作用于使得所述一個(gè)或多個(gè)處理器執(zhí)行操作，所述操作包括：
在客戶端設(shè)備處接收話語；
在所述客戶端設(shè)備處獲得用于其中所述話語被說出的建筑物內(nèi)的區(qū)域的位置標(biāo)記；
從所述客戶端設(shè)備向服務(wù)器傳送對(duì)應(yīng)于所述話語的數(shù)據(jù)和用于其中所述話語被說出的所述建筑物內(nèi)的所述區(qū)域的所述位置標(biāo)記；以及
在所述客戶端設(shè)備處接收所述話語的轉(zhuǎn)錄，其中使用復(fù)合模型生成所述話語的所述轉(zhuǎn)錄，并且其中使用與所述建筑的一個(gè)或多個(gè)預(yù)定區(qū)域相關(guān)聯(lián)的一個(gè)或多個(gè)選擇的模型來生成所述復(fù)合模型，基于所述話語在所述建筑物的對(duì)應(yīng)的預(yù)定區(qū)域中被說出的可能性來選擇所述一個(gè)或多個(gè)選擇的模型中的每個(gè)模型。
26.根據(jù)權(quán)利要求25所述的客戶端設(shè)備，其中所述位置標(biāo)記包括基于在所述客戶端設(shè)備處接收的短程無線電傳輸?shù)奈恢脭?shù)據(jù)。
27.根據(jù)權(quán)利要求25所述的客戶端設(shè)備，其中所述復(fù)合模型包括復(fù)合聲學(xué)模型，并且其中所述一個(gè)或多個(gè)模型和所述一個(gè)或多個(gè)模型的相應(yīng)權(quán)重包括一個(gè)或多個(gè)聲學(xué)模型和所述一個(gè)或多個(gè)聲學(xué)模型的相應(yīng)權(quán)重。
28.根據(jù)權(quán)利要求25所述的客戶端設(shè)備，其中所述復(fù)合模型包括復(fù)合語言模型，并且其中所述一個(gè)或多個(gè)模型和所述一個(gè)或多個(gè)模型的相應(yīng)權(quán)重包括一個(gè)或多個(gè)語言模型和所述一個(gè)或多個(gè)語言模型的相應(yīng)權(quán)重。

基于位置標(biāo)記的語音識(shí)別模型\n[0001] 相關(guān)申請(qǐng)的交叉引用\n[0002] 本申請(qǐng)要求于2012年8月1日提交的序列號(hào)為61/678,277和于2012年10月15日提交的序列號(hào)為13/651,566的美國(guó)臨時(shí)申請(qǐng)的權(quán)益，其整體如同完全記載于此一樣通過引用的方式并入。\n技術(shù)領(lǐng)域\n[0003] 本說明書總體上涉及自動(dòng)語音識(shí)別。\n背景技術(shù)\n[0004] 語音識(shí)別通常依賴于所說語言的語音識(shí)別模型。然而，對(duì)于給定的語言(或給定語言的方言)，取決于在何處發(fā)出詞語而不同地使用詞語。例如，當(dāng)人在他們的客廳中時(shí)，他們可能頻繁地使用與電視節(jié)目和媒體播放器的控制相關(guān)的詞語，而當(dāng)人在他們的廚房中時(shí)，他們可能使用與食物類型或烹飪相關(guān)的詞語。用于語音識(shí)別的典型語言模型通常沒有考慮到在說出詞語處的位置特定情境，特別是對(duì)于在建筑物(例如在家)內(nèi)的詞語使用的變化。\n發(fā)明內(nèi)容\n[0005] 一般而言，本說明書中所描述的主題的一方面可以包括自動(dòng)語音識(shí)別引擎(ASR)，該自動(dòng)語音識(shí)別引擎使用基于說話者在建筑物中何處做出話語的模型，執(zhí)行語音識(shí)別。在一些實(shí)現(xiàn)方式中，該語音識(shí)別模型可以是基于兩個(gè)或更多情境特定模型的復(fù)合模型。ASR引擎可以將話語轉(zhuǎn)錄成文本，例如用于語音查詢，或者通過處理器執(zhí)行將話語轉(zhuǎn)換成命令。\n[0006] 在某些方面，本說明書中所描述的主題可以體現(xiàn)為方法，該方法包括接收對(duì)應(yīng)于話語的數(shù)據(jù)和獲得用于其中該話語被說出的建筑物內(nèi)的區(qū)域的位置標(biāo)記的動(dòng)作。進(jìn)一步的動(dòng)作包括基于位置標(biāo)記選擇用于語音識(shí)別的一個(gè)或多個(gè)模型，其中每個(gè)所選擇的一個(gè)或多個(gè)模型與基于位置標(biāo)記的權(quán)重相關(guān)聯(lián)。此外，所述動(dòng)作還包括使用所選擇的一個(gè)或多個(gè)模型和所選擇的一個(gè)或多個(gè)模型的相應(yīng)權(quán)重來生成復(fù)合模型。所述動(dòng)作還包括使用復(fù)合模型生成話語的轉(zhuǎn)錄。\n[0007] 主題的另一方面可以體現(xiàn)為方法，該方法包括在客戶端設(shè)備處接收話語和在客戶端設(shè)備處獲得用于其中該話語被說出的建筑物內(nèi)的區(qū)域的位置標(biāo)記的動(dòng)作。所述動(dòng)作還包括從客戶端設(shè)備向服務(wù)器傳送對(duì)應(yīng)于話語和用于其中話語被說出的建筑物內(nèi)的區(qū)域的位置標(biāo)記的數(shù)據(jù)。并且所述動(dòng)作包括在客戶端設(shè)備處接收話語的轉(zhuǎn)錄。在一些方面，使用復(fù)合模型生成話語的轉(zhuǎn)錄，并且使用一個(gè)或多個(gè)模型和基于位置標(biāo)記而選擇的一個(gè)或多個(gè)模型的相應(yīng)權(quán)重來生成復(fù)合模型。\n[0008] 其他版本包括相對(duì)應(yīng)的系統(tǒng)、裝置和被配置為執(zhí)行所述方法的動(dòng)作的計(jì)算機(jī)程序，該計(jì)算機(jī)程序編碼在計(jì)算機(jī)存儲(chǔ)設(shè)備上。\n[0009] 這些和其他的版本可以每個(gè)可選擇地包括以下特征中的一個(gè)或多個(gè)特征。例如，一些實(shí)現(xiàn)方式涉及到從客戶端設(shè)備接收對(duì)應(yīng)于話語的數(shù)據(jù)，從客戶端設(shè)備接收用于其中該話語被說出的建筑物內(nèi)的區(qū)域的位置標(biāo)記。該位置標(biāo)記可以為基于在客戶端設(shè)備處接收的短程無線電傳輸?shù)奈恢脭?shù)據(jù)。\n[0010] 一些實(shí)現(xiàn)方式涉及到使用位置無關(guān)語言模型生成話語的一個(gè)或多個(gè)候選轉(zhuǎn)錄，并且然后基于將一個(gè)或多個(gè)候選轉(zhuǎn)錄與一個(gè)或多個(gè)位置相關(guān)語言模型中的短語進(jìn)行比較，標(biāo)識(shí)建筑物內(nèi)的一個(gè)或多個(gè)候選區(qū)域。\n[0011] 某些實(shí)現(xiàn)方式涉及到從在建筑物處的處理系統(tǒng)接收對(duì)應(yīng)于話語的數(shù)據(jù)，并且從在建筑物處的處理系統(tǒng)接收用于其中話語被說出的建筑物內(nèi)的區(qū)域的位置標(biāo)記。在一些方面，位置標(biāo)記為從處理系統(tǒng)獲得的位置數(shù)據(jù)。處理系統(tǒng)使用被布置在建筑物中的麥克風(fēng)陣列定位話語，其中麥克風(fēng)陣列可操作地耦合到處理系統(tǒng)。\n[0012] 此外，在一些實(shí)現(xiàn)方式中，所選擇的用于語音識(shí)別的模型為語言模型，并且復(fù)合模型為復(fù)合語言模型。在一些實(shí)現(xiàn)方式中，所選擇的用于語音識(shí)別的模型為聲學(xué)模型，并且復(fù)合模型為復(fù)合聲學(xué)模型。并且在一些實(shí)現(xiàn)方式中，所選擇的用于語音識(shí)別的模型為語言模型和聲學(xué)模型，并且復(fù)合模型為復(fù)合語言模型和復(fù)合聲學(xué)模型。\n[0013] 在下文的附圖和描述中記載了本說明書所描述的主題的一個(gè)或多個(gè)實(shí)施例的細(xì)節(jié)。所述主題的其他特征、方面以及優(yōu)點(diǎn)將根據(jù)描述、附圖和權(quán)利要求而變得清楚。\n附圖說明\n[0014] 圖1a和1b是生成位置相關(guān)語音識(shí)別模型和使用位置相關(guān)語音識(shí)別模型執(zhí)行語音識(shí)別的示例系統(tǒng)的圖。\n[0015] 圖2是生成和獲得位置相關(guān)聲學(xué)模型以用于在語音識(shí)別中使用的樣本ASR引擎的組件的圖。\n[0016] 圖3a和3b是生成和獲得位置相關(guān)語音模型以用于在語音識(shí)別中使用的樣本ASR引擎的組件的圖。\n[0017] 圖4是用于使用基于位置標(biāo)記的語音識(shí)別模型來執(zhí)行語音識(shí)別的示例過程的流程圖。\n[0018] 在不同附圖中相同的附圖的標(biāo)記表示相同的元件。\n具體實(shí)施方式\n[0019] 如下所述，ASR引擎可以基于在建筑物(例如用戶的家)中用戶做出話語所處的區(qū)域(例如房間)，使語音識(shí)別模型偏向，或者選擇完全不同的語音識(shí)別模型。這可以涉及到若干特征。第一，安裝在建筑物中的客戶端設(shè)備和/或應(yīng)答器系統(tǒng)被用來當(dāng)用戶在建筑物中移動(dòng)并做出話語時(shí)估計(jì)他們的位置。第二，在訓(xùn)練階段期間，ASR引擎使用位置無關(guān)語音識(shí)別模型來執(zhí)行語音識(shí)別，并從遍及建筑物的各個(gè)位置收集話語的轉(zhuǎn)錄。第三，轉(zhuǎn)錄可以被用來生成位置相關(guān)語音識(shí)別模型，該位置相關(guān)語音識(shí)別模型可以隨后被用來執(zhí)行語音識(shí)別。在一些方面，可以將來自多個(gè)用戶和/或多個(gè)建筑物的轉(zhuǎn)錄組合以生成聚合的位置相關(guān)語音識(shí)別模型。例如，可以將處于或者靠近位于各個(gè)建筑物的廚房的多個(gè)話語的轉(zhuǎn)錄組合以生成廚房特定語音識(shí)別模型。\n[0020] 如在本公開中使用的，位置相關(guān)語音識(shí)別模型是被偏向于與建筑物的給定區(qū)域相關(guān)的主題、詞語、噪聲和/或聲學(xué)特征(signature)的模型。本公開中所使用的區(qū)域指的是建筑物的功能部分(例如廚房、餐廳、臥室、客廳、洗手間、辦公室)。在不同的建筑物中，相同類型的區(qū)域(例如廚房)可以具有不同的尺寸和聲學(xué)特性(例如混響)，但是可以共享相似的噪聲特征和詞匯。例如，一室公寓中的廚房與大的獨(dú)戶住宅中的廚房相比可能具有不同的聲學(xué)特性，但是仍然可以具有共同的噪聲和語義主題。因此，與廚房區(qū)域相關(guān)聯(lián)的位置相關(guān)模型可以包括與食物和烹飪主題和/或在廚房中最常發(fā)現(xiàn)的噪聲(例如微波爐、攪拌器、洗碗機(jī)等)相關(guān)的詞語。位置無關(guān)語音識(shí)別模型是不偏向于住宅的任何特定區(qū)域的模型。\n[0021] 此外，在本公開中，人說出的短語被稱為話語。一般而言，話語可以包含一個(gè)或多個(gè)詞語。話語可以表示任何語音通信類型，例如(例如為了操作家庭自動(dòng)化系統(tǒng)的)基于語音的指令、命令或動(dòng)作，基于語音的搜索查詢、口述(dictation)、對(duì)話系統(tǒng)或者使用經(jīng)轉(zhuǎn)錄的語音或者調(diào)用使用經(jīng)轉(zhuǎn)錄的語音來執(zhí)行動(dòng)作的軟件應(yīng)用的任何其他輸入。\n[0022] 圖1a示出了生成位置相關(guān)語音識(shí)別模型和使用位置相關(guān)語音識(shí)別模型執(zhí)行語音識(shí)別的示例系統(tǒng)100。圖1a還示出了語音識(shí)別在執(zhí)行時(shí)處理器系統(tǒng)102中的數(shù)據(jù)流。參照?qǐng)D\n1a，首先描述了用于執(zhí)行語音識(shí)別方法的一般性描述，然后提供了更詳細(xì)的描述。\n[0023] 初始地，在圖1a中，當(dāng)用戶102位于客廳120中時(shí)，用戶102做出話語104(即“蘋果和香料”)。例如，用戶102可以具有家庭自動(dòng)化系統(tǒng)，該家庭自動(dòng)化系統(tǒng)控制客廳里包括音樂播放器(例如MP3播放器)的娛樂系統(tǒng)，用戶102可以打算播放叫做“蘋果&香料”樂隊(duì)的“精選集”專輯。響應(yīng)于該話語，客戶端設(shè)備106將話語104編碼成音頻信號(hào)，并通過檢測(cè)來自無線電應(yīng)答器112的信號(hào)來獲得位置標(biāo)記?？蛻舳嗽O(shè)備106然后將音頻信號(hào)和位置標(biāo)記(例如無線電應(yīng)答器112的標(biāo)識(shí)符)經(jīng)由網(wǎng)絡(luò)110發(fā)送到處理系統(tǒng)108。處理系統(tǒng)108執(zhí)行接收了位置標(biāo)記和音頻信號(hào)的ASR引擎116。\n[0024] 假定ASR引擎116已經(jīng)被訓(xùn)練，位置確定組件130訪問位置標(biāo)記，并獲得用戶102在說出話語時(shí)的估計(jì)位置。在本實(shí)施例中，由于位置確定組件130接收到無線電應(yīng)答器110(與客廳相關(guān)聯(lián))的標(biāo)識(shí)符，因此位置確定組件130會(huì)輸出與客廳120對(duì)應(yīng)的估計(jì)位置。這一估計(jì)位置然后被輸出至聲學(xué)模型生成器134和語言模型生成器140。聲學(xué)模型生成器134從聲學(xué)模型的集合136中選擇與客廳區(qū)域相關(guān)聯(lián)的位置相關(guān)聲學(xué)模型。語言模型生成器140從語言模型的集合142中選擇也與客廳區(qū)域相關(guān)聯(lián)的位置相關(guān)語言模型142b。\n[0025] ASR引擎116然后使用所選擇的聲學(xué)模型132和語言模型138來將對(duì)應(yīng)于話語104的音頻信號(hào)轉(zhuǎn)換成轉(zhuǎn)錄。在這一情況下，用于客廳142b的語言模型包括短語“蘋果&香料”，ASR引擎116將其識(shí)別為針對(duì)話語104的最佳匹配。例如，客廳語言模型142b可以通過用戶媒體庫(例如電影、音樂、電視節(jié)目、視頻游戲等)來編程。應(yīng)當(dāng)注意，詞語“蘋果”和“香料”也在用于廚房142a的語言模型中，這在沒有附加情境信息的情況下可能導(dǎo)致歧義。有利的是，因?yàn)锳SR引擎116使語言模型的選擇基于位置標(biāo)記，這表明當(dāng)說出話語時(shí)，用戶102在客廳120中而不是廚房122中，所以，ASR引擎116可以容易地解決歧義。\n[0026] 最后，ASR引擎116可以經(jīng)由輸出組件144傳達(dá)轉(zhuǎn)錄“蘋果&香料”。例如，輸出組件\n144可以提供去往在處理器系統(tǒng)108上執(zhí)行的媒體播放器控制程序的接口，反過來可以使得媒體播放器排隊(duì)等候“蘋果&香料的精選集”專輯以用于重放。\n[0027] 更詳細(xì)地，用戶102位于具有多個(gè)區(qū)域(例如客廳120和廚房122)的建筑物(例如在用戶的家中)中。當(dāng)在客廳102中時(shí)，用戶102說出話語104至客戶端設(shè)備106中(例如“蘋果和香料”)?？蛻舳嗽O(shè)備106是在用戶的控制下并且能夠通過網(wǎng)絡(luò)請(qǐng)求和接收資源的電子設(shè)備。\n客戶端設(shè)備(其示例包括圖1a和1b的設(shè)備)可以包括一個(gè)或多個(gè)處理設(shè)備，并且可以為或者包括移動(dòng)電話(例如智能電話)、膝上型計(jì)算機(jī)、手持計(jì)算機(jī)、平板計(jì)算機(jī)、網(wǎng)絡(luò)設(shè)備、相機(jī)、增強(qiáng)通用分組無線業(yè)務(wù)(EGPRS)移動(dòng)電話，媒體播放器、導(dǎo)航設(shè)備、電子郵件設(shè)備、可穿戴式計(jì)算機(jī)、游戲控制臺(tái)、交互式或者所謂“智能”電視、或者任何兩個(gè)或更多這些數(shù)據(jù)處理設(shè)備或者其他數(shù)據(jù)處理設(shè)備的組合。\n[0028] 用戶102可以記錄話語104，例如通過按壓客戶端設(shè)備106上的按鈕來在說話之前發(fā)起對(duì)話，說出該、話語，并然后釋放移動(dòng)設(shè)備上的按鈕。在另一示例中，客戶端設(shè)備106可以通過說話者的話語來激活。在另一示例中，用戶可以在說出話語之前選擇客戶端設(shè)備106上的用戶接口控制(例如麥克風(fēng)圖標(biāo))。作為又一示例，麥克風(fēng)可以在用戶說話之前被激活，或者可以處于“始終開啟(always?on)”狀態(tài)，來允許用戶不需要手動(dòng)激活麥克風(fēng)就能說話。\n例如，客戶端設(shè)備可以使用連續(xù)記錄緩沖器。\n[0029] 客戶端設(shè)備106然后將用戶的話語104轉(zhuǎn)換成一系列音頻信號(hào)(例如樣本或波形)，該音頻信號(hào)例如可以為兩秒(或更多)相對(duì)高質(zhì)量音頻(例如16kHz無損音頻)的片段。例如，客戶端設(shè)備106可以在記錄話語時(shí)創(chuàng)建聲音文件或者數(shù)據(jù)流。此外，響應(yīng)于接收到話語104，客戶端設(shè)備106發(fā)起用以獲得用于其中話語被說出的建筑物的區(qū)域的位置標(biāo)記的過程。本公開所指的位置標(biāo)記為指示信號(hào)從特定位置獲得的相對(duì)可能性的數(shù)據(jù)。\n[0030] 在一些實(shí)現(xiàn)方式中，例如在圖1a中示出的示例，位置標(biāo)記可以為描述從無線電應(yīng)答器發(fā)送的無線電信號(hào)的數(shù)據(jù)(例如無線電應(yīng)答器標(biāo)識(shí)符和信號(hào)強(qiáng)度)，該無線電信號(hào)由位于建筑物的特定區(qū)域中的客戶端設(shè)備所接收。例如，如下所述，無線電應(yīng)答器130可以被定位在遍及建筑物的各個(gè)區(qū)域中。無線電應(yīng)答器可以為任何合適的短程無線電系統(tǒng)，例如藍(lán)牙、近場(chǎng)通信(NFC)或者WiFi。\n[0031] 無線電應(yīng)答器可以被安裝在遍及建筑物的各個(gè)區(qū)域中，并然后與建筑物中的相應(yīng)區(qū)域相關(guān)聯(lián)。例如，無線電應(yīng)答器112可以與客廳區(qū)域120相關(guān)聯(lián)，無線電應(yīng)答器114可以與廚房區(qū)域122相關(guān)聯(lián)?？梢允褂萌魏魏线m的手段使無線電應(yīng)答器與建筑物的不同區(qū)域相關(guān)聯(lián)。例如，處理系統(tǒng)108可以提供接口，以使得用戶可以將每個(gè)無線電應(yīng)答器標(biāo)記為處于特定類別的房間(例如廚房、客廳、臥室、辦公室、餐廳、浴室)中。在一些實(shí)現(xiàn)方式中，處理系統(tǒng)\n108可以呈現(xiàn)網(wǎng)絡(luò)接口，通過網(wǎng)絡(luò)接口，用戶能夠經(jīng)由網(wǎng)絡(luò)瀏覽器進(jìn)行交互。在其他方面，可以經(jīng)由客戶端設(shè)備106上的圖形用戶接口訪問處理器系統(tǒng)108，該圖形用戶接口例如在客戶端設(shè)備上執(zhí)行的移動(dòng)應(yīng)用。\n[0032] 一旦客戶端設(shè)備106將話語104編碼成音頻信號(hào)，并獲得用于其中話語被說出的建筑物內(nèi)的區(qū)域的位置標(biāo)記，客戶端設(shè)備就經(jīng)由網(wǎng)絡(luò)110將音頻信號(hào)和位置標(biāo)記發(fā)送至處理系統(tǒng)108。在一些實(shí)現(xiàn)方式中，客戶端設(shè)備106可以建立與處理系統(tǒng)108的通信會(huì)話，并在會(huì)話期間將音頻信號(hào)和位置標(biāo)記發(fā)送至處理系統(tǒng)108。在替代實(shí)現(xiàn)方式中，客戶端設(shè)備106周期性地(例如每30秒、每1分鐘、每5分鐘)獲得并發(fā)送位置標(biāo)記，而不管是否接收到話語。在其他實(shí)現(xiàn)方式中，客戶端設(shè)備106可以在客戶端設(shè)備106識(shí)別到改變時(shí)發(fā)送位置標(biāo)記，該改變例如是客戶端設(shè)備檢測(cè)到：(i)新的無線電應(yīng)答器標(biāo)識(shí)符，(ii)無線電應(yīng)答器的相對(duì)信號(hào)強(qiáng)度改變，或(iii)無線電應(yīng)答器已經(jīng)停止被檢測(cè)到。在這樣的實(shí)現(xiàn)方式中，位置標(biāo)記的改變可以表明客戶端106已經(jīng)被重新定位到建筑物中的不同區(qū)域。\n[0033] 處理系統(tǒng)108接收與話語對(duì)應(yīng)的音頻信號(hào)和位置標(biāo)記，該音頻信號(hào)和位置標(biāo)記用于執(zhí)行語音識(shí)別和/或訓(xùn)練位置相關(guān)語音識(shí)別模型。處理系統(tǒng)108可以為一個(gè)或多個(gè)計(jì)算設(shè)備(例如包括一個(gè)或多個(gè)處理器和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)的服務(wù)器)，該計(jì)算設(shè)備使用ASR引擎116將語音轉(zhuǎn)換成文本，以及其他能力。ASR引擎116可以為處理語音轉(zhuǎn)文本的軟件實(shí)現(xiàn)的輸入/輸出系統(tǒng)。例如，ASR引擎116可以為例如庫的軟件代碼、平臺(tái)、軟件開發(fā)包或者對(duì)象。\n[0034] 處理系統(tǒng)108可以物理地位于與用戶102相同的建筑物中或者遠(yuǎn)程地定位。網(wǎng)絡(luò)\n110可以因此包括一個(gè)或多個(gè)網(wǎng)絡(luò)。網(wǎng)絡(luò)可以在各種模式或協(xié)議下提供通信，例如全球移動(dòng)通信系統(tǒng)(GSM)語音電話、短消息服務(wù)(SMS)、增強(qiáng)消息服務(wù)(EMS)、多媒體信息服務(wù)(MMS)消息、碼分多址(CDMA)、時(shí)分多址(TDMA)、個(gè)人數(shù)字蜂窩電話(PDC)、寬帶碼分多址(WCDMA)、CDMA2000、通用分組無線電系統(tǒng)(GPRS)或者一個(gè)或多個(gè)電視或者電纜網(wǎng)絡(luò)，以及其他。例如，通信可以通過射頻收發(fā)器發(fā)生。此外，可以使用例如藍(lán)牙、WiFi或其他這樣的收發(fā)器發(fā)生短程通信。此外，在一些實(shí)現(xiàn)方式中，本公開所描述的處理系統(tǒng)108中的一個(gè)、幾個(gè)或所有功能可以由客戶端設(shè)備106來執(zhí)行。\n[0035] ASR引擎116可以在訓(xùn)練模式和操作模式兩種模式中操作。在訓(xùn)練模式中，ASR引擎\n116：(i)使用位置無關(guān)(例如無偏向的)語音識(shí)別模型執(zhí)行語音識(shí)別；和(ii)收集使話語的轉(zhuǎn)錄和其中做出話語的位置相關(guān)的數(shù)據(jù)，來訓(xùn)練位置相關(guān)語音識(shí)別模型。在操作模式中，ASR引擎116使用經(jīng)訓(xùn)練的位置相關(guān)語音識(shí)別模型來執(zhí)行語音識(shí)別。然而，在一些實(shí)現(xiàn)方式中，ASR引擎116在操作模式中繼續(xù)訓(xùn)練位置相關(guān)語音識(shí)別模型。ASR引擎116可以基于若干輸入來確定在哪個(gè)模式中操作。例如，用戶102可以被提示為經(jīng)由與處理系統(tǒng)108的接口來選擇模式。備選地或另外地，ASR引擎116可以包括用于在模式之間切換的預(yù)定閾值(例如給定區(qū)域中的特定數(shù)目的話語或給定區(qū)域中的特定數(shù)目的標(biāo)識(shí)出的詞語)。在一些實(shí)現(xiàn)方式中，可以觸發(fā)ASR引擎116切換模式的外部訓(xùn)練數(shù)據(jù)可以被提供給ASR引擎116。例如，ASR引擎116可以從應(yīng)用服務(wù)器接收經(jīng)訓(xùn)練的位置相關(guān)語音識(shí)別模型，該應(yīng)用服務(wù)器聚集來自多個(gè)建筑物和用戶的位置相關(guān)語音識(shí)別模型。\n[0036] ASR引擎116包括用于執(zhí)行語音到文字轉(zhuǎn)換和訓(xùn)練位置相關(guān)語音識(shí)別模型的多種組件(例如軟件模塊或庫)。具體而言，ASR引擎116包括估計(jì)做出話語104時(shí)的客戶端設(shè)備\n106位置的位置確定組件130。位置確定組件130將估計(jì)位置輸出至聲學(xué)模型生成器134和語言模型生成器140。在訓(xùn)練模式期間，聲學(xué)模型生成器134收集針對(duì)各種類別的房間的話語，來更新聲學(xué)模型的集合136。另外，聲學(xué)模型生成器134可以提供位置無關(guān)聲學(xué)模型以用于執(zhí)行語音識(shí)別。在操作模式期間，聲學(xué)模型生成器134根據(jù)聲學(xué)模型的集合136生成位置相關(guān)聲學(xué)模型132。在訓(xùn)練模式期間，語言模型生成器140收集針對(duì)各種類別的房間的話語，來更新語言模型的集合142。另外，語言模型生成器140可以提供位置無關(guān)聲學(xué)模型以用于執(zhí)行語音識(shí)別。在操作模式期間，語言模型生成器140根據(jù)語言模型的集合142生成位置相關(guān)語言模型140。ASR引擎116使用聲學(xué)模型132和語言模型138以將來自話語104的音頻信號(hào)轉(zhuǎn)換成轉(zhuǎn)錄。輸出組件144然后輸出轉(zhuǎn)錄，例如輸出至客戶端設(shè)備106或處理系統(tǒng)108的另一組件(例如家庭自動(dòng)化系統(tǒng))。\n[0037] 更詳細(xì)地，位置確定組件130基于位置標(biāo)記(例如從無線電應(yīng)答器中發(fā)現(xiàn)的信號(hào))估計(jì)在做出話語時(shí)客戶端設(shè)備106的位置。例如，客戶端設(shè)備106可能已經(jīng)檢測(cè)到無線電應(yīng)答器112，因此位置標(biāo)記可以包括相對(duì)應(yīng)的無線電應(yīng)答器標(biāo)識(shí)符(例如“應(yīng)答器1”)，在一些實(shí)現(xiàn)方式中，也可以為無線電應(yīng)答器的信號(hào)強(qiáng)度(例如-60dBm)。因此，位置確定組件130可以確定當(dāng)話語104被說出時(shí)，客戶端設(shè)備106在客廳區(qū)域120中。\n[0038] 在一些實(shí)現(xiàn)方式中，客戶端設(shè)備106可能檢測(cè)到多于一個(gè)應(yīng)答器，并且可以將來自多個(gè)應(yīng)答器的信號(hào)加權(quán)來估計(jì)位置。例如，客戶端設(shè)備106可能檢測(cè)到來自兩個(gè)無線電應(yīng)答器的信號(hào)，并確定所接收到信號(hào)的信號(hào)強(qiáng)度(例如接收信號(hào)強(qiáng)度指示器(RSSI))?？蛻舳嗽O(shè)備106可以將描述兩個(gè)信號(hào)的位置標(biāo)記發(fā)送至處理系統(tǒng)108，處理系統(tǒng)108可以利用信號(hào)強(qiáng)度之間的相對(duì)差來估計(jì)在做出話語時(shí)客戶端設(shè)備106的位置。\n[0039] 例如，假定客戶端設(shè)備106檢測(cè)到來自無線電應(yīng)答器112和無線電應(yīng)答器114的信號(hào)。客戶端設(shè)備106可以確定來自無線電應(yīng)答器112的信號(hào)具有-60dBm的RSSI，并且來自無線電應(yīng)答器114的信號(hào)具有-63dBm的RSSI。因?yàn)闊o線電應(yīng)答器112的信號(hào)強(qiáng)度比來自無線電應(yīng)答器114的信號(hào)多3dB，因此這表明來自無線電應(yīng)答器112的信號(hào)是來自無線電應(yīng)答器114的信號(hào)的兩倍強(qiáng)度，并且應(yīng)答器112可能比應(yīng)答器114更接近客戶端設(shè)備106。因此，位置確定組件130可以使得與應(yīng)答器112相關(guān)聯(lián)的位置(例如客廳區(qū)域120)的權(quán)重比與應(yīng)答器114相關(guān)聯(lián)的位置(例如廚房區(qū)域122)重。這些權(quán)重可以對(duì)應(yīng)于該話語在相關(guān)聯(lián)的區(qū)域中被說出的概率或者可能性。因此，使用基于相對(duì)信號(hào)強(qiáng)度的加權(quán)，位置標(biāo)記可以表明其中話語被說出的區(qū)域67％的可能性為客廳，并且33％的可能性為廚房。下表1示出了根據(jù)這一示例的位置標(biāo)記。\n[0040]\n[0041] 表1\n[0042] 位置確定組件130的輸出可以然后用來生成用于執(zhí)行語音識(shí)別的統(tǒng)計(jì)模型，或者用來訓(xùn)練語音識(shí)別模型。一般而言，ASR引擎116使用統(tǒng)計(jì)模型來處理語音。ASR引擎116可以使用聲學(xué)模型132以用于處理音頻信號(hào)來生成子詞序列。例如，聲學(xué)模型可以被實(shí)施為隱馬爾可夫模型(HMM)或者高斯混合模型(GMM)。在一些方面，如下所述，ASR引擎116可以使用由聲學(xué)模型生成器134基于位置標(biāo)記生成的復(fù)合聲學(xué)模型。下面將更詳細(xì)地描述，聲學(xué)模型生成器134是接收位置確定組件130輸出的組件，其根據(jù)聲學(xué)模型136庫生成聲學(xué)模型，并輸出聲學(xué)模型以供ASR引擎116使用。在訓(xùn)練模式中，聲學(xué)模型生成器134可以訓(xùn)練位置相關(guān)聲學(xué)模型。\n[0043] ASR引擎116使用來自聲學(xué)模型132的子詞序列作為對(duì)語言模型138的輸入。語言模型138處理子詞序列來確定最佳匹配子詞序列的一個(gè)或多個(gè)詞語。例如，ASR引擎116可以將子詞序列與包括在語言模型138中的詞匯表進(jìn)行比較。在一些方面，如下所述，ASR引擎116可以使用由語言模型生成器140基于位置標(biāo)記生成的復(fù)合語言模型。下面將更詳細(xì)地描述，語言模型生成器140是接收位置確定組件130的輸出的組件，其根據(jù)語言模型142a、142b的集合生成語言模型，并輸出語言模型以供ASR引擎116使用。在訓(xùn)練模式中，語言模型生成器\n140可以訓(xùn)練位置相關(guān)語言模型。\n[0044] 一旦ASR引擎116生成話語104的轉(zhuǎn)錄，輸出組件144就將轉(zhuǎn)錄路由至合適的系統(tǒng)。\n在一些實(shí)現(xiàn)方式中，輸出組件144可以將轉(zhuǎn)錄發(fā)送回客戶端設(shè)備106。在其他實(shí)現(xiàn)方式中，輸出組件144可以將轉(zhuǎn)錄發(fā)送至在處理系統(tǒng)108上執(zhí)行的另一組件，例如，家庭自動(dòng)化系統(tǒng)、基于語音的搜索服務(wù)、口述應(yīng)用、文字處理應(yīng)用、或使用經(jīng)轉(zhuǎn)錄的語音或者調(diào)用使用經(jīng)轉(zhuǎn)錄的語音來執(zhí)行動(dòng)作的軟件應(yīng)用的任何其他應(yīng)用。在一些實(shí)現(xiàn)方式中，輸出組件144可以將說話者的話語的轉(zhuǎn)錄提交給搜索服務(wù)。搜索服務(wù)通過抓取或者索引網(wǎng)站上內(nèi)容出版商提供的資源來識(shí)別資源?？梢曰跀?shù)據(jù)與之對(duì)應(yīng)的資源對(duì)關(guān)于資源的數(shù)據(jù)進(jìn)行索引。例如，響應(yīng)于搜索查詢，匹配輸入關(guān)鍵詞的資源的經(jīng)索引和可選地經(jīng)高速緩存的副本可以被檢索到并被輸出，。\n[0045] 參考圖1b，在一些實(shí)現(xiàn)方式中，可以使用麥克風(fēng)陣列而不是無線電應(yīng)答器來確定說出話語時(shí)用戶102的位置。作為示例，在圖1b的系統(tǒng)150中，當(dāng)用戶102位于客廳120中時(shí)，用戶102做出話語104(即“蘋果和香料”)。然而，安裝在客廳120中的語音檢測(cè)設(shè)備160檢測(cè)話語104，而不是使用客戶端設(shè)備檢測(cè)話語。語音檢測(cè)設(shè)備160將話語104轉(zhuǎn)換成音頻信號(hào)，然后，其將音頻信號(hào)和位置標(biāo)記(例如語音檢測(cè)設(shè)備160的標(biāo)識(shí)符和/或話語的聲壓級(jí))經(jīng)由網(wǎng)絡(luò)110發(fā)送至處理系統(tǒng)108。處理系統(tǒng)108正在執(zhí)行ASR引擎116，ASR引擎116如上文進(jìn)行操作將話語104轉(zhuǎn)換成與“蘋果&香料的精選集”相對(duì)應(yīng)的語音命令。\n[0046] 語音檢測(cè)設(shè)備160、162可以為任何合適的組件或組件的集合，其適于檢測(cè)話語，將話語轉(zhuǎn)換成音頻信號(hào)，將音頻信號(hào)和位置標(biāo)記傳達(dá)至處理系統(tǒng)108。例如，語音檢測(cè)設(shè)備可以為可操作地耦合到處理系統(tǒng)108的麥克風(fēng)。在其他實(shí)現(xiàn)方式中，語音檢測(cè)設(shè)備可以包括麥克風(fēng)、模數(shù)轉(zhuǎn)換器、處理器、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)和能夠用于經(jīng)由網(wǎng)絡(luò)110與處理系統(tǒng)108進(jìn)行通信的網(wǎng)絡(luò)接口。在一些實(shí)現(xiàn)方式中，語音檢測(cè)設(shè)備可以包括一個(gè)或多個(gè)用戶輸入/輸出組件(例如按鈕、LCD和/或存在敏感顯示器)。麥克風(fēng)可以為用于將聲音轉(zhuǎn)換成音頻信號(hào)的任何合適的聲電換能器，例如單向的、雙向的或者全方向的有線或無線麥克風(fēng)。\n[0047] 語音檢測(cè)設(shè)備(例如麥克風(fēng)陣列)可以被安裝在遍及建筑物的各個(gè)區(qū)域，然后與建筑物的相應(yīng)區(qū)域相關(guān)聯(lián)。例如，語音檢測(cè)設(shè)備160可以與客廳區(qū)域120相關(guān)聯(lián)，并且語音檢測(cè)設(shè)備162可以與廚房區(qū)域相關(guān)聯(lián)。語音檢測(cè)設(shè)備可以使用任何合適的手段與建筑物的不同區(qū)域相關(guān)聯(lián)。例如，處理系統(tǒng)108可以提供接口，以便用戶可以將每個(gè)語音檢測(cè)設(shè)備標(biāo)記為被安裝在特定類別的房間中(例如廚房、客廳、臥室、辦公室、餐廳、浴室)。在一些實(shí)現(xiàn)方式中，處理系統(tǒng)108可以提供網(wǎng)絡(luò)接口，通過該網(wǎng)絡(luò)接口，用戶可以經(jīng)由網(wǎng)絡(luò)瀏覽器進(jìn)行交互。\n在其他方面，可以經(jīng)由客戶端設(shè)備106上的圖形用戶接口訪問處理器系統(tǒng)108，例如執(zhí)行于客戶端設(shè)備上的移動(dòng)應(yīng)用。在一些方面，一個(gè)或多個(gè)語音檢測(cè)設(shè)備可以包括針對(duì)建筑物的具體區(qū)域的定向麥克風(fēng)，在這種情況下，來自定向麥克風(fēng)的話語可以與特定區(qū)域更高度相關(guān)。\n[0048] 用戶102可以發(fā)起話語104，例如通過按壓語音檢測(cè)設(shè)備160、162上的按鈕來在說話之前發(fā)起對(duì)話，說出話語，然后釋放按鈕。在另一示例中，語音檢測(cè)設(shè)備160可以通過說話者的話語來被激活。在又一示例中，麥克風(fēng)可以在用戶說話被激活，或者可以處于“始終開啟”狀態(tài)，以允許用戶不需要手動(dòng)激活麥克風(fēng)就能說話。例如，客戶端設(shè)備可以使用連續(xù)的記錄緩沖器。\n[0049] 語音檢測(cè)設(shè)備160、162將用戶的話語104轉(zhuǎn)換成一系列音頻信號(hào)(例如樣本或波形)，該一系列音頻信號(hào)例如可以為兩秒(或更多)相對(duì)高質(zhì)量音頻(例如16kHz無損音頻)的片段。例如，語音檢測(cè)設(shè)備160、162可以在記錄話語時(shí)創(chuàng)建聲音文件或者數(shù)據(jù)流。\n[0050] 此外，響應(yīng)于接收到話語104，語音檢測(cè)設(shè)備160、162獲得位置標(biāo)記。位置標(biāo)記可以包括描述語音檢測(cè)設(shè)備的標(biāo)識(shí)符的數(shù)據(jù)，和/或在語音檢測(cè)設(shè)備處所接收到的話語的聲壓級(jí)(例如dB?re?20μPa?RMS)。例如，假定語音檢測(cè)設(shè)備160檢測(cè)到聲壓級(jí)為60dB的話語104。\n假定語音檢測(cè)設(shè)備162也檢測(cè)到話語104，但聲壓級(jí)為57dB。因?yàn)檎Z音檢測(cè)設(shè)備160處的聲壓級(jí)比語音檢測(cè)設(shè)備162處的聲壓級(jí)多3dB，這表明語音檢測(cè)設(shè)備160處的聲壓級(jí)是語音檢測(cè)設(shè)備162處的聲壓級(jí)的兩倍強(qiáng)度，并且表明，話語104可能與語音檢測(cè)設(shè)備162相比更接近語音檢測(cè)設(shè)備160而做出。因此，位置確定組件130可以使得與語音檢測(cè)設(shè)備160相關(guān)聯(lián)的位置(例如客廳區(qū)域120)的權(quán)重比與語音檢測(cè)設(shè)備162相關(guān)聯(lián)的位置(例如廚房區(qū)域122)重。這些權(quán)重可以對(duì)應(yīng)于話語在相關(guān)聯(lián)區(qū)域中被說出的概率或者可能性。因此，使用基于相對(duì)聲壓級(jí)的加權(quán)，位置標(biāo)記可以表明話語的區(qū)域67％的可能性為客廳，并且33％的可能性為廚房。下表2示出了根據(jù)這一示例的位置標(biāo)記。\n[0051]\n[0052] 表2\n[0053] 在一些實(shí)現(xiàn)方式中，可以使用話語本身，而不是使用無線電應(yīng)答器或語音檢測(cè)設(shè)備的標(biāo)識(shí)符來作為位置標(biāo)記。例如，客戶端設(shè)備106或者語音檢測(cè)設(shè)備160、162可以生成對(duì)應(yīng)于話語104的音頻信號(hào)，并將其發(fā)送至處理系統(tǒng)108。ASR引擎116可能隨后使用位置無關(guān)語音識(shí)別模型來生成話語104的一個(gè)或多個(gè)候選轉(zhuǎn)錄。然后，ASR引擎116可以將候選轉(zhuǎn)錄與一個(gè)或多個(gè)位置相關(guān)語言模型中的短語進(jìn)行比較。與最佳匹配位置相關(guān)語言模型相關(guān)聯(lián)的區(qū)域可隨后被用作做出話語104的估計(jì)位置。例如，如果使用位置無關(guān)語音模型的轉(zhuǎn)錄是“蘋果&香料”，并且這一短語僅僅在廚房語言模型中被找到，則位置可以被確定為廚房。如果短語在多個(gè)語言模型中被找到，則位置估計(jì)可以基于詞語出現(xiàn)的概率對(duì)相關(guān)聯(lián)的區(qū)域進(jìn)行加權(quán)，以生成經(jīng)加權(quán)的位置估計(jì)(例如33％廚房，67％客廳)，或者可以選擇與對(duì)于該詞語具有最高概率的語言模型相關(guān)聯(lián)的區(qū)域作為估計(jì)位置。\n[0054] 圖2示出了生成和獲得用于在語音識(shí)別中使用的位置相關(guān)聲學(xué)模型的樣本ASR引擎的組件。具體而言，該組件包括基于位置標(biāo)記向聲學(xué)模型生成器134提供估計(jì)位置的位置確定組件130。聲學(xué)模型生成器134使用估計(jì)位置來從聲學(xué)模型的集合136中選擇或者生成聲學(xué)模型，或者，在訓(xùn)練模式中，訓(xùn)練聲學(xué)模型的集合136中的聲學(xué)模型。聲學(xué)模型的集合\n136存儲(chǔ)了位置相關(guān)聲學(xué)模型，包括廚房聲學(xué)模型208、辦公室聲學(xué)模型210、臥室聲學(xué)模型\n212和客廳聲學(xué)模型214。\n[0055] 如上所述，客戶端設(shè)備或者語音檢測(cè)設(shè)備向處理系統(tǒng)108提供位置標(biāo)記，處理系統(tǒng)\n108在合適的存儲(chǔ)器中存儲(chǔ)數(shù)據(jù)。位置確定組件130訪問存儲(chǔ)的位置標(biāo)記202，并針對(duì)相關(guān)聯(lián)的話語在建筑物中哪里被做出而生成估計(jì)位置。具體而言，建筑物區(qū)域映射器組件204(例如軟件庫或功能)解析位置標(biāo)記來生成估計(jì)位置。估計(jì)位置可以為話語在各種類別房間中被做出的可能性或概率的形式。估計(jì)位置可以被輸出到任何合適的數(shù)據(jù)結(jié)構(gòu)中，例如，對(duì)象或者一組變量。\n[0056] 例如，假定位置標(biāo)記僅包括(例如用于無線電應(yīng)答器和/或語音檢測(cè)設(shè)備的)一個(gè)標(biāo)識(shí)符。然后，建筑物映射器204可以基于與標(biāo)識(shí)符相關(guān)聯(lián)的區(qū)域來生成建筑物內(nèi)的估計(jì)位置。因此，如果位置標(biāo)記包括與客廳區(qū)域120相關(guān)聯(lián)的無線電應(yīng)答器112的標(biāo)識(shí)符，則估計(jì)位置可能是1.0客廳。\n[0057] 假定位置標(biāo)記包括兩個(gè)標(biāo)識(shí)符。建筑物區(qū)域映射204繼而可以基于內(nèi)插與標(biāo)識(shí)符相關(guān)聯(lián)的區(qū)域來生成建筑物內(nèi)的估計(jì)位置。因此，如果位置標(biāo)記包括用于與客廳區(qū)域120相關(guān)聯(lián)的無線電應(yīng)答器112的標(biāo)識(shí)符，和用于與廚房區(qū)域122相關(guān)聯(lián)的無線電應(yīng)答器114的標(biāo)識(shí)符，則估計(jì)位置可能是0.5客廳和0.5廚房。\n[0058] 進(jìn)一步假定位置標(biāo)記包括兩個(gè)標(biāo)識(shí)符和相對(duì)應(yīng)的信號(hào)強(qiáng)度(例如無線電應(yīng)答器處的RSSI或語音檢測(cè)設(shè)備處的聲壓級(jí))。建筑物區(qū)域映射器204可以基于內(nèi)插與標(biāo)識(shí)符相關(guān)聯(lián)的區(qū)域與基于相對(duì)信號(hào)強(qiáng)度的加權(quán)一起生成建筑物內(nèi)的估計(jì)位置。因此，如果位置標(biāo)記包括用于與客廳區(qū)域120相關(guān)聯(lián)的無線電應(yīng)答器112的標(biāo)識(shí)符和-60dBm的RSSI，以及用于與廚房區(qū)域122相關(guān)聯(lián)的無線電應(yīng)答器114的標(biāo)識(shí)符和-63dBm的RSSI，則估計(jì)位置可能是0.67客廳和0.33廚房。注意這一基于信號(hào)強(qiáng)度確定估計(jì)位置的示例是為了說明的目的，并且實(shí)現(xiàn)方式可以包含更為經(jīng)微調(diào)和精細(xì)的模型來改進(jìn)估計(jì)位置的準(zhǔn)確度。此外，盡管出于示例性目的描述了僅從兩個(gè)源接收位置標(biāo)記，但是在實(shí)現(xiàn)方式中位置標(biāo)記可以從任何數(shù)目的來源進(jìn)行接收。\n[0059] 在接收到估計(jì)位置之后，聲學(xué)模型生成器134執(zhí)行取決于ASR引擎116在訓(xùn)練模式還是在操作模式進(jìn)行操作的操作。在訓(xùn)練模式中，聲學(xué)模型生成器134接收訓(xùn)練數(shù)據(jù)(例如用于與位置標(biāo)記相關(guān)聯(lián)的話語的音頻信號(hào))，并訓(xùn)練存儲(chǔ)在聲學(xué)模型的集合136中的一個(gè)或多個(gè)聲學(xué)模型。此外，聲學(xué)模型生成器提供位置無關(guān)聲學(xué)模型以用于在執(zhí)行語音識(shí)別中使用。在操作模式中，聲學(xué)模型生成器134基于估計(jì)位置獲得(例如選擇或生成)位置相關(guān)聲學(xué)模型以用于在執(zhí)行語音識(shí)別中使用。\n[0060] 聲學(xué)模型的集合136可以被存儲(chǔ)在文件結(jié)構(gòu)(例如網(wǎng)絡(luò)文件系統(tǒng))中或者數(shù)據(jù)庫(例如MySQL,PostgreSQL,MS?SQL?Server,MongoDB)中，或者可以被處理系統(tǒng)108訪問的任何其他合適的數(shù)據(jù)結(jié)構(gòu)中。在一些實(shí)現(xiàn)方式中，處理系統(tǒng)108可以經(jīng)由網(wǎng)絡(luò)服務(wù)存儲(chǔ)和訪問所存儲(chǔ)的聲學(xué)模型的集合136，網(wǎng)絡(luò)服務(wù)例如表述性狀態(tài)轉(zhuǎn)移(REST)形式服務(wù)。\n[0061] 集合136中的聲學(xué)模型最初可以用與用戶通常遇到的各種聲學(xué)空間匹配的之前經(jīng)訓(xùn)練的聲學(xué)模型填充。在訓(xùn)練模式中，聲學(xué)模型生成器134接收與話語相關(guān)聯(lián)的音頻信號(hào)，并做出相對(duì)應(yīng)的聲學(xué)空間是否匹配之前存儲(chǔ)的聲學(xué)模型的確定。分析音頻信號(hào)可以提供關(guān)于周圍空間的聲學(xué)特性的信息。那些特性可以包括房間的大小、噪聲源和混響特性，噪聲源例如為通風(fēng)管或外窗。\n[0062] 如果聲學(xué)空間與之前存儲(chǔ)的聲學(xué)模型不匹配，則聲學(xué)模型生成器134可以初始化并適配新的聲學(xué)模型?；谥車臻g的大小，聲學(xué)模型生成器134還可以調(diào)整聲學(xué)模型以考慮混響。可以使用各種方法來完成這一調(diào)整，包括使用模型自適應(yīng)，例如對(duì)于已知目標(biāo)的最大似然線性回歸。目標(biāo)轉(zhuǎn)換可以在之前在該位置遇到時(shí)已經(jīng)被估計(jì)，或者可以從與空間相關(guān)聯(lián)的混響時(shí)間推斷出。一旦位置被充分地建模，則聲學(xué)模型生成器134在聲學(xué)模型136的集合中存儲(chǔ)聲學(xué)模型。\n[0063] 在操作模式中，當(dāng)ASR引擎116執(zhí)行語音識(shí)別時(shí)，聲學(xué)模型生成器134選擇由位置估計(jì)所標(biāo)識(shí)的位置相關(guān)聲學(xué)模型。例如，如果位置估計(jì)標(biāo)識(shí)出客廳120和廚房122很可能為其中做出話語的區(qū)域，然后，聲學(xué)模型生成器134選擇客廳聲學(xué)模型214和廚房聲學(xué)模型208。\n[0064] 然后，聲學(xué)模型生成器134使用所選擇的位置相關(guān)聲學(xué)模型生成聲學(xué)模型。具體而言，復(fù)合聲學(xué)模型220可以與一個(gè)或多個(gè)基礎(chǔ)聲學(xué)模型222相聯(lián)系，基礎(chǔ)聲學(xué)模型222對(duì)應(yīng)于存儲(chǔ)在聲學(xué)模型的集合136中的聲學(xué)模型，復(fù)合聲學(xué)模型220和基礎(chǔ)聲學(xué)模型222之間的聯(lián)系可以被加權(quán)。在一些實(shí)現(xiàn)方式中，來自一個(gè)復(fù)合聲學(xué)模型的聯(lián)系的權(quán)重的總和可以為1或者被歸一化為1。\n[0065] 聲學(xué)模型生成器134可以使用任何合適的技術(shù)合并基礎(chǔ)聲學(xué)模型來形成復(fù)合聲學(xué)模型。例如，假定每個(gè)聲學(xué)模型包括高斯分布和相關(guān)聯(lián)的隱馬爾可夫模型(HMM)的集合。聲學(xué)模型生成器134可以使用基于估計(jì)位置的權(quán)重，通過映射高斯分布和HMM來生成復(fù)合聲學(xué)模型。因此，如果估計(jì)位置為0.67客廳和0.33廚房，則可以映射高斯分布和HMM以生成復(fù)合聲學(xué)模型，該復(fù)合聲學(xué)模型具有權(quán)重為67％的客廳聲學(xué)模型214的高斯分布和HMM，以及權(quán)重為33％的廚房聲學(xué)模型208的高斯分布和HMM。\n[0066] 應(yīng)當(dāng)理解，雖然示出了復(fù)合聲學(xué)模型220、基礎(chǔ)聲學(xué)模型222和聯(lián)系的特定數(shù)目和配置，但是其他數(shù)目和配置也是可行的。例如，可以存在足夠的復(fù)合聲學(xué)模型220，使得基礎(chǔ)聲學(xué)模型222的每個(gè)經(jīng)加權(quán)的組合具有聯(lián)系的復(fù)合聲學(xué)模型220。在一些示例中，復(fù)合聲學(xué)模型可以與更多或更少基礎(chǔ)聲學(xué)模型222相聯(lián)系。在一些實(shí)現(xiàn)方式中，可以存在復(fù)合聲學(xué)模型220和基礎(chǔ)聲學(xué)模型222之間不同的聯(lián)系權(quán)重，例如正整數(shù)、概率或維距離(例如四維空間中的W,X,Y,Z值)。\n[0067] 在一些實(shí)現(xiàn)方式中，復(fù)合聲學(xué)模型220可以根據(jù)需要被創(chuàng)建，例如當(dāng)接收到與之前存儲(chǔ)的聲學(xué)模型不對(duì)應(yīng)的位置估計(jì)時(shí)。復(fù)合聲學(xué)模型220可以通過存儲(chǔ)在可以由聲學(xué)模型生成器134可訪問的存儲(chǔ)器結(jié)構(gòu)中持續(xù)存在。在一些實(shí)現(xiàn)方式中，多個(gè)可能的復(fù)合聲學(xué)模型\n220可以被預(yù)生成。例如，這可在預(yù)處理時(shí)間可用時(shí)，和/或當(dāng)預(yù)期有很少的基礎(chǔ)聲學(xué)模型\n222時(shí)被使用。\n[0068] 圖3a和3b示出了生成和獲得位置相關(guān)語言模型以用于在語音識(shí)別中使用的樣本ASR引擎的組件。具體而言，該組件包括向語言模型生成器140提供基于位置標(biāo)記的估計(jì)位置的位置確定組件130。語言模型生成器140使用估計(jì)位置來從語言模型的集合142中選擇或者生成語言模型，或者，在訓(xùn)練模式中，訓(xùn)練語言模型的集合142中的語言模型。\n[0069] 在圖3a中，語言模型142的集合存儲(chǔ)位置相關(guān)語言模型，包括廚房語言模型142a、客廳語言模型142b、辦公室語言模型142c和臥室語言模型142d。如圖所示，廚房語言模型\n142a包括與食物和烹飪相關(guān)的詞語，例如“攪拌機(jī)”、“蘋果”和“烤箱”；客廳語言模型142b包括媒體和娛樂相關(guān)的詞語，例如“電視”、“電影”和“音樂”；辦公室語言模型142c包括辦公相關(guān)的詞語，例如“郵件”、“傳真”和“口述”；并且臥室語言模型142d包括睡眠相關(guān)的詞語，例如“鬧鐘”、“睡眠”和“燈光”。\n[0070] 在圖3b中，語言模型的集合142存儲(chǔ)了核心語言模型160和與網(wǎng)絡(luò)瀏覽、媒體和食物分別相關(guān)的各種主題特定語言模型162、164、166。每個(gè)主題可以與一個(gè)或多個(gè)區(qū)域相關(guān)聯(lián)，并且可以使用核心語言模型和主題特定語言模型中的一個(gè)或多個(gè)主題特定語言模型來生成復(fù)合語言模型。如圖所示，核心語言模型160包括與建筑控制、例如“燈光”、“空調(diào)”和“加熱”相關(guān)聯(lián)的通用詞語，網(wǎng)絡(luò)瀏覽語言模型162包括例如“購物”、“新聞”和“名人”的詞語；并且媒體語言模型164包括例如“電視”、“電影”和“音樂”的詞語；并且食物語言模型166包括例如“爆米花”、“蘋果”和“烤箱”的詞語。\n[0071] 如上所述，位置確定組件130提供估計(jì)位置。在接收到估計(jì)位置之后，語言模型生成器140取決于ASR引擎116在訓(xùn)練模式還是在操作模式中進(jìn)行操作來執(zhí)行操作。在訓(xùn)練模式中，語言模型生成器140接收訓(xùn)練數(shù)據(jù)(例如使用與位置標(biāo)記相關(guān)聯(lián)的位置無關(guān)語言模型所做出的轉(zhuǎn)錄)，并訓(xùn)練存儲(chǔ)在語言模型的集合142中的一個(gè)或多個(gè)語言模型。另外，語言模型生成器提供位置無關(guān)語言模型以用于在執(zhí)行語音識(shí)別中使用。在操作模式中，語言模型生成器140基于估計(jì)位置獲得(例如選擇或生成)位置相關(guān)語言模型以用于在執(zhí)行語音識(shí)別中使用。\n[0072] 語言模型的集合142可以被存儲(chǔ)在文件結(jié)構(gòu)中(例如網(wǎng)絡(luò)文件系統(tǒng))或者數(shù)據(jù)庫中(例如MySQL,PostgreSQL,MS?SQL?Server,MongoDB)，或者可以被處理系統(tǒng)108訪問的任何其他合適的數(shù)據(jù)結(jié)構(gòu)中。在一些實(shí)現(xiàn)方式中，處理系統(tǒng)108可以經(jīng)由網(wǎng)絡(luò)服務(wù)存儲(chǔ)和訪問所存儲(chǔ)的語言模型的集合142，網(wǎng)絡(luò)服務(wù)例如表述性狀態(tài)轉(zhuǎn)移(REST)形式服務(wù)。\n[0073] 集合142中的語言模型可以用包括與房間或主題的類別相對(duì)應(yīng)的常用詞的之前訓(xùn)練的語言模型填充。例如，第三方網(wǎng)絡(luò)服務(wù)可以組合來自多個(gè)用戶和/或多個(gè)建筑物中的轉(zhuǎn)錄，從而生成用于潛在類別的房間(例如廚房、客廳、辦公室、臥室)的聚合位置相關(guān)語言模型。此外，用于一些類別房間的語言模型可以通過參考用戶所擁有的內(nèi)容或產(chǎn)品來填充。例如，ASR引擎116可能訪問來自用戶的媒體庫(例如電影、音樂、電視節(jié)目、視頻游戲等)的主題來填充用于可能具有媒體播放器(例如客廳或臥室)的房間類別的語言模型。類似的技術(shù)可以用于填充主題特定的語言模型。在訓(xùn)練模式中，語言模型生成器140接收與估計(jì)位置相關(guān)聯(lián)的轉(zhuǎn)錄，并使用來自轉(zhuǎn)錄的詞語來訓(xùn)練相對(duì)應(yīng)的位置相關(guān)語言模型和/或主題特定語言模型。\n[0074] 參考圖3a的示例系統(tǒng)，在操作模式中，語言模型生成器140選擇由位置估計(jì)所標(biāo)識(shí)的位置相關(guān)語言模型。例如，如果位置估計(jì)標(biāo)識(shí)出客廳120和廚房122很可能為做出話語的區(qū)域，則語言模型生成器140選擇客廳語言模型142a和廚房語言模型142b。\n[0075] 然后，語言模型生成器140使用所選擇的位置相關(guān)語言模型生成語言模型。具體而言，復(fù)合語言模型320可以與一個(gè)或多個(gè)基礎(chǔ)語言模型322相聯(lián)系，基礎(chǔ)語言模型322對(duì)應(yīng)于存儲(chǔ)在語言模型的集合140中的語言模型，復(fù)合語言模型320和基礎(chǔ)語言模型322之間的聯(lián)系可以被加權(quán)。在一些示例中，來自一個(gè)復(fù)合語言模型的聯(lián)系的權(quán)重的總和可以為1或者可以被歸一化為1。\n[0076] 雖然示出了復(fù)合語言模型320、基礎(chǔ)語言模型322和聯(lián)系的特定數(shù)目和配置，但是其他數(shù)目和配置也是可行的。例如，可以存在足夠的復(fù)合語言模型320，使得基礎(chǔ)語言模型\n322的每個(gè)經(jīng)加權(quán)的組合具有與相聯(lián)系的復(fù)合語言模型320。在一些示例中，復(fù)合語言模型可以與更多或更少基礎(chǔ)語言模型322相聯(lián)系。在一些示例中，可以存在復(fù)合語言模型320和基礎(chǔ)語言模型322之間的不同的聯(lián)系權(quán)重，例如正整數(shù)、概率或維距離(例如四維空間中的W,X,Y,Z值)。\n[0077] 在一些實(shí)現(xiàn)方式中，復(fù)合語言模型320可以根據(jù)需要被創(chuàng)建，例如在接收到與之前存儲(chǔ)的語言模型不對(duì)應(yīng)的位置估計(jì)時(shí)。復(fù)合語言模型320可以通過存儲(chǔ)在可以由語言模型生成器140可訪問的存儲(chǔ)器結(jié)構(gòu)中持續(xù)存在。在一些實(shí)現(xiàn)方式中，多個(gè)可能的復(fù)合語言模型\n320可以被預(yù)生成。例如，這可以在預(yù)處理時(shí)間可用時(shí)被使用，和/或在預(yù)期有很少的基礎(chǔ)語言模型322時(shí)。\n[0078] 參考圖3b的樣本系統(tǒng)，在操作模式中，語言模型生成器140通過兩個(gè)步驟生成復(fù)合位置相關(guān)語言模型：1)從主題特定語言模型中生成區(qū)域特定語言模型；2)從區(qū)域特定語言模型中生成復(fù)合位置相關(guān)語言模型。\n[0079] 在第一步驟中，語言模型生成器140使用各種權(quán)重，通過組合主題特定語言模型來創(chuàng)建區(qū)域特定語言模型(例如廚房語言模型、客廳語言模型和辦公室語言模型)。每個(gè)區(qū)域特定語言模型可以在不同程度上包括核心語言模型。在一些實(shí)現(xiàn)方式中，主題特定語言模型334可以與一個(gè)或多個(gè)區(qū)域特定語言模型332相聯(lián)系。復(fù)合語言模型330和區(qū)域特定語言模型332之間的聯(lián)系可以被加權(quán)。在一些示例中，來自一個(gè)復(fù)合語言模型的聯(lián)系的權(quán)重的總和可以為1或者被歸一化為1。\n[0080] 權(quán)重可以基于經(jīng)驗(yàn)分析預(yù)先確定，和/或它們可以在訓(xùn)練模式中被訓(xùn)練。權(quán)重也可以基于用戶習(xí)慣周期性地更新。例如，如果用戶主要在客廳中執(zhí)行網(wǎng)絡(luò)瀏覽，則用于網(wǎng)絡(luò)瀏覽主題的權(quán)重可以基于他的使用隨時(shí)間增加。在另一示例中，在訓(xùn)練期間，語言模型生成器\n140可以確定后端語義服務(wù)是否響應(yīng)于給定話語。后端語義服務(wù)可以為家庭自動(dòng)化系統(tǒng)中的功能、搜索服務(wù)、應(yīng)用或者可以接收語音命令的任何其他服務(wù)。例如，如果電視相關(guān)后端語義服務(wù)響應(yīng)于給定話語，則話語可以被標(biāo)識(shí)為對(duì)應(yīng)于媒體主題相關(guān)語言模型。如果媒體主題相關(guān)語言模型與客廳相關(guān)聯(lián)，則這將表明話語很可能是在客廳中做出的。語言模型生成器140可以在任何合適的存儲(chǔ)結(jié)構(gòu)中持久存儲(chǔ)這些權(quán)重，存儲(chǔ)結(jié)構(gòu)例如為數(shù)據(jù)庫或文件系統(tǒng)。\n[0081] 如圖所示，樣本廚房語言模型332a包括75％的食物語言模型166的權(quán)重和25％的核心語言模型160的權(quán)重；樣本客廳語言模型332b包括50％的媒體語言模型164的權(quán)重、\n25％的網(wǎng)絡(luò)瀏覽模型162的權(quán)重和25％的核心語言模型160的權(quán)重；并且樣本辦公室語言模型332c包括50％的網(wǎng)絡(luò)瀏覽語言模型162的權(quán)重和50％的核心語言模型160的權(quán)重。\n[0082] 在第二步驟中，語言模型生成器140使用所選擇的區(qū)域特定語言模型生成位置相關(guān)復(fù)合語言模型，區(qū)域特定語言模型在來自位置確定組件130的位置估計(jì)中被標(biāo)識(shí)。具體而言，復(fù)合語言模型330可以與在第一個(gè)步驟中被生成的一個(gè)或多個(gè)區(qū)域特定語言模型332相聯(lián)系。復(fù)合語言模型330和區(qū)域特定語言模型332之間的聯(lián)系可以被加權(quán)。在一些示例中，來自一個(gè)復(fù)合語言模型的聯(lián)系的權(quán)重的總和可以為1或者被歸一化為1。\n[0083] 雖然示出了復(fù)合語言模型330、區(qū)域特定語言模型332、主題特定語言模型334和聯(lián)系的特定數(shù)目和配置，但是其他數(shù)目和配置也是可行的。例如，可以存在足夠的復(fù)合語言模型330，使得區(qū)域特定語言模型332的每個(gè)經(jīng)加權(quán)的組合具有與聯(lián)系的復(fù)合語言模型330。在一些示例中，復(fù)合語言模型可以與更多或更少區(qū)域特定語言模型332相聯(lián)系。在一些示例中，可以存在復(fù)合語言模型330和區(qū)域特定語言模型332之間不同的聯(lián)系權(quán)重，例如正整數(shù)、概率或維距離(例如四維空間中的W,X,Y,Z值)。\n[0084] 在一些實(shí)現(xiàn)方式中，復(fù)合語言模型330可以根據(jù)需要被創(chuàng)建，例如當(dāng)接收到與之前存儲(chǔ)的語言模型不對(duì)應(yīng)的位置估計(jì)時(shí)。復(fù)合語言模型330可以通過存儲(chǔ)在可以由語言模型生成器140可訪問的存儲(chǔ)器結(jié)構(gòu)中持續(xù)存在。在一些實(shí)現(xiàn)方式中，多個(gè)可能的復(fù)合語言模型\n330可以被預(yù)生成。例如，這可用于在預(yù)處理時(shí)間可用時(shí)，和/或當(dāng)預(yù)期有很少的區(qū)域特定語言模型332時(shí)被使用。\n[0085] 語言模型生成器140可以使用任何合適的技術(shù)合并語言模型。例如，假定每個(gè)語言模型包括詞語和每個(gè)詞語的相關(guān)聯(lián)的計(jì)數(shù)(例如頻率)。語言模型生成器140可以使用計(jì)數(shù)合并策略，例如最大后驗(yàn)(MAP)自適應(yīng)。這樣的計(jì)數(shù)合并策略可以生成詞語的概率p(w|h)，如下面的公式(1)中示出：\n[0086]\n[0087] 在公式(1)中，hw是在具有上下文h的詞語w中的N元文法結(jié)尾，c1(hw)和c2(hw)分別為在第一和第二語言模型中hw的計(jì)數(shù)，并且x是控制每個(gè)語言模型語料庫向組合的語言模型的貢獻(xiàn)的常量。\n[0088] 備選地，語言模型生成器140可以使用語言模型聯(lián)合策略生成復(fù)合語言模型。這可以生成詞語的概率，下面的公式(2)中示出了p(w)：p(w)＝max(xp1(w)，(1-x)p2(w))??(2)[0089] 在公式(2)中，p1(w)和p2(w)分別為在第一個(gè)和第二語言模型中w的概率，x是控制每個(gè)語言模型語料庫向組合的語言模型的貢獻(xiàn)的常量。\n[0090] 圖4示出了用于使用基于位置標(biāo)記的語音識(shí)別模型來執(zhí)行語音識(shí)別的示例過程\n400。簡(jiǎn)而言之，過程400包括接收對(duì)應(yīng)于話語的數(shù)據(jù)(404)，獲得其中話語被說出的建筑物內(nèi)的區(qū)域的位置標(biāo)記(406)，基于位置標(biāo)記選擇用于語音識(shí)別的一個(gè)或多個(gè)模型，其中每個(gè)所選擇的一個(gè)或多個(gè)模型與基于位置標(biāo)記的權(quán)重相關(guān)聯(lián)(408)，使用所選擇的一個(gè)或多個(gè)模型和所選擇的一個(gè)或多個(gè)模型的相應(yīng)權(quán)重來生成復(fù)合模型(410)，以及使用復(fù)合模型生成話語的轉(zhuǎn)錄(412)。\n[0091] 更詳細(xì)地，過程400從步驟404開始，此時(shí)ASR引擎116從客戶端設(shè)備160或語音檢測(cè)設(shè)備160、162接收對(duì)應(yīng)于話語的數(shù)據(jù)，。例如，語音信號(hào)可以為相對(duì)高質(zhì)量音頻(例如16kHz無損音頻)的片段。\n[0092] 如上所述，在步驟406中，然后ASR引擎116獲得其中話語被說出的建筑物內(nèi)的區(qū)域的位置標(biāo)記。例如，位置標(biāo)記可以為無線電應(yīng)答器或語音檢測(cè)設(shè)備的標(biāo)識(shí)符，并且還可以包括信號(hào)強(qiáng)度(例如RSSI和/或聲壓級(jí))。在一些實(shí)現(xiàn)方式中，位置標(biāo)記可以為基于在客戶端設(shè)備處接收的短程無線電傳輸?shù)奈恢脭?shù)據(jù)。備選地，位置標(biāo)記可以根據(jù)話語生成。具體而言，ASR引擎116可以使用位置無關(guān)語言模型生成話語的一個(gè)或多個(gè)候選轉(zhuǎn)錄。然后，所ASR引擎\n116可以基于將一個(gè)或多個(gè)候選轉(zhuǎn)錄與一個(gè)或多個(gè)位置相關(guān)語言模型中的短語進(jìn)行比較，標(biāo)識(shí)建筑物內(nèi)的一個(gè)或多個(gè)候選區(qū)域。在這種實(shí)現(xiàn)方式中，ASR引擎116從在建筑物處的處理系統(tǒng)接收對(duì)應(yīng)于話語的數(shù)據(jù)。在又一實(shí)現(xiàn)方式中，位置標(biāo)記可以為從處理系統(tǒng)獲得的位置數(shù)據(jù)。在這種實(shí)現(xiàn)方式中，處理系統(tǒng)可以使用被布置在建筑物中的麥克風(fēng)陣列(例如語音檢測(cè)設(shè)備)來定位話語，該麥克風(fēng)陣列可操作地耦合到處理系統(tǒng)。\n[0093] 接下來，在步驟408中，ASR引擎116基于位置標(biāo)記選擇用于語音的一個(gè)或多個(gè)語音模型(例如聲學(xué)模型和/或語言模型)。每個(gè)所選擇的語音模型可以與基于位置標(biāo)記的權(quán)重相關(guān)聯(lián)。例如，如果ASR引擎116接收到與分別為33％和67％的廚房區(qū)域和客廳區(qū)域?qū)?yīng)標(biāo)識(shí)符，則所選擇的用于廚房和客廳的語音模型會(huì)相應(yīng)地將被選擇和加權(quán)。\n[0094] 然后，在步驟410中，ASR引擎116使用所選擇的一個(gè)或多個(gè)語音模型和相應(yīng)權(quán)重生成復(fù)合語音模型。如上文所詳細(xì)描述，ASR引擎166可以組合語言模型(例如聲學(xué)模型和/或語音模型)。最后，在步驟412中，ASR引擎116使用復(fù)合語音模型生成話語的轉(zhuǎn)錄。\n[0095] 對(duì)于其中收集關(guān)于用戶的信息的此處所討論的系統(tǒng)的情形，可以向用戶提供選擇打開/關(guān)閉可以收集用戶信息(例如關(guān)于用戶的偏好或者用戶的目前位置)的程序或功能的機(jī)會(huì)。此外，特定數(shù)據(jù)可以在其被存儲(chǔ)或使用之前以一種或多種方式匿名化，使得個(gè)人可標(biāo)識(shí)的信息被移除。例如，用戶的身份可以匿名化。\n[0096] 可以在數(shù)字電子電路裝置中或者在有形地體現(xiàn)的計(jì)算機(jī)軟件、固件或者在計(jì)算機(jī)硬件(包括在本說明書中公開的結(jié)構(gòu)及其結(jié)構(gòu)等效物)中或者在它們中的一項(xiàng)或者多項(xiàng)的組合中實(shí)施在本說明書中描述的主題、功能操作和過程的實(shí)現(xiàn)方式?？梢詫⒃诒菊f明書中描述的主題的實(shí)施例實(shí)施為一個(gè)或者多個(gè)計(jì)算機(jī)程序、即編碼在有形非易失程序載體上的用于由數(shù)據(jù)處理裝置執(zhí)行或者控制數(shù)據(jù)處理裝置的操作的一個(gè)或者多個(gè)計(jì)算機(jī)程序指令模塊。備選地或者附加地，可以在人為生成的傳播的信號(hào)(例如，機(jī)器生成的電、光或者電磁信號(hào))上對(duì)程序指令編碼，該信號(hào)被生成用于對(duì)信息編碼以用于向適當(dāng)接收器設(shè)備發(fā)送以供數(shù)據(jù)處理裝置執(zhí)行。計(jì)算機(jī)存儲(chǔ)介質(zhì)可以是機(jī)器可讀存儲(chǔ)設(shè)備、機(jī)器可讀存儲(chǔ)襯底、隨機(jī)或者串行存取存儲(chǔ)器設(shè)備或者它們中的一項(xiàng)或者多項(xiàng)的組合。\n[0097] 術(shù)語“數(shù)據(jù)處理裝置”涵蓋各種用于處理數(shù)據(jù)的裝置、設(shè)備和機(jī)器，舉例而言包括可編程處理器、計(jì)算機(jī)、多個(gè)處理器或計(jì)算機(jī)。該設(shè)備可以包括專用邏輯電路裝置，例如，F(xiàn)PGA(現(xiàn)場(chǎng)可編程門陣列)或者ASIC(專用集成電路)。該裝置除了硬件之外也可以包括為討論的計(jì)算機(jī)程序創(chuàng)建執(zhí)行環(huán)境的代碼，例如，構(gòu)成處理器固件、協(xié)議棧、數(shù)據(jù)庫管理系統(tǒng)、操作系統(tǒng)的代碼或者它們中的一項(xiàng)或者多項(xiàng)的組合。\n[0098] 計(jì)算機(jī)程序(也被稱為或描述為程序、軟件、軟件應(yīng)用、模塊、軟件模塊、腳本或者代碼)可以用任何形式的編程語言編寫，包括編譯或者解譯語言、或說明或者過程語言，并且計(jì)算機(jī)程序可以用任何形式部署，包括部署為獨(dú)立程序或者部署為適合于在計(jì)算環(huán)境中使用的模塊、組件、子例程或者其他單元。計(jì)算機(jī)程序可以、但是無需對(duì)應(yīng)于文件系統(tǒng)中的文件。程序可以被存儲(chǔ)于保持其他程序或者數(shù)據(jù)的文件(例如，存儲(chǔ)于標(biāo)記語言文檔中的一個(gè)或者多個(gè)腳本)的一部分中、專用于討論的程序的單個(gè)文件中，或者多個(gè)協(xié)同文件(例如，存儲(chǔ)一個(gè)或者多個(gè)模塊、子程序或者代碼部分的文件)中。計(jì)算機(jī)程序可以被部署用于在一個(gè)計(jì)算機(jī)上或者在位于一個(gè)地點(diǎn)或者跨多個(gè)地點(diǎn)分布并且由通信網(wǎng)絡(luò)互連的多個(gè)計(jì)算機(jī)上執(zhí)行。\n[0099] 在本說明書中描述的過程和邏輯流程可以由一個(gè)或者多個(gè)可編程處理器執(zhí)行，該一個(gè)或者多個(gè)可編程計(jì)算機(jī)執(zhí)行一個(gè)或者多個(gè)計(jì)算機(jī)程序以通過對(duì)輸入數(shù)據(jù)操作并且生成輸出來執(zhí)行功能。該過程和邏輯流也可以由專用邏輯電路裝置(例如，F(xiàn)PGA(現(xiàn)場(chǎng)可編程門陣列)或者ASIC(專用集成電路)執(zhí)行并且也可以將設(shè)備實(shí)施為專用邏輯電路裝置。\n[0100] 舉例而言，適合于執(zhí)行計(jì)算機(jī)程序的計(jì)算機(jī)可以基于通用微處理器或者專用微處理器，或者其兩者，或者任何其他種類的中央處理器。一般而言，中央處理器將從只讀存儲(chǔ)器或者隨機(jī)存取存儲(chǔ)器或者二者接收指令和數(shù)據(jù)。計(jì)算機(jī)的必要元件是用于執(zhí)行指令的中央處理器單元以及用于存儲(chǔ)指令和數(shù)據(jù)的一個(gè)或者多個(gè)存儲(chǔ)器設(shè)備。一般而言，計(jì)算機(jī)還將包括用于存儲(chǔ)數(shù)據(jù)的一個(gè)或者多個(gè)海量存儲(chǔ)裝置(例如，磁盤、磁光盤或者光盤)或者被操作地耦合用于從該一個(gè)或者多個(gè)海量存儲(chǔ)設(shè)備接收數(shù)據(jù)或者向該一個(gè)或者多個(gè)海量存儲(chǔ)設(shè)備發(fā)送數(shù)據(jù)或者接收和發(fā)送二者。然而，計(jì)算機(jī)無需具有這樣的設(shè)備。另外，計(jì)算機(jī)可以被嵌入于另一設(shè)備中，聊舉數(shù)例，例如，移動(dòng)電話、個(gè)人數(shù)字助理(PDA)、移動(dòng)音頻或者視頻播放器、游戲控制臺(tái)、全球定位系統(tǒng)(GPS)接收器或者便攜存儲(chǔ)設(shè)備(例如，通用串行總線(USB)閃存驅(qū)動(dòng))。\n[0101] 適合于存儲(chǔ)計(jì)算機(jī)程序指令和數(shù)據(jù)的計(jì)算機(jī)可讀介質(zhì)包括所有形式的非易失性存儲(chǔ)器、介質(zhì)和存儲(chǔ)器設(shè)備，舉例而言包括半導(dǎo)體存儲(chǔ)器設(shè)備，例如，EPROM、EEPROM和閃速存儲(chǔ)器設(shè)備；磁盤，例如，內(nèi)部硬盤或者可去除盤；磁光盤；以及CD-ROM和DVD-ROM盤。處理器和存儲(chǔ)器可以由專用邏輯電路裝置補(bǔ)充或者并入于專用邏輯電路裝置中。\n[0102] 為了提供與用戶的交互，可以在計(jì)算機(jī)上實(shí)施在本說明書中描述的主題的實(shí)施例，該計(jì)算機(jī)具有用于向用戶顯示信息的顯示設(shè)備(例如，CRT(陰極射線管)或者LCD(液晶顯示器)監(jiān)視器)以及用戶可以用來向計(jì)算機(jī)提供輸入的鍵盤和指向設(shè)備，例如，鼠標(biāo)或者軌跡球。其他種類的設(shè)備也可以用來提供與用戶的交互；例如，向用戶提供的反饋可以是任何形式的感官反饋，例如，視覺反饋、聽覺反饋或者觸覺反饋；并且可以用包括聲音、語音或者觸覺輸入的任何形式接收來自用戶的輸入。此外，計(jì)算機(jī)可以通過向用戶使用的設(shè)備發(fā)送文檔和從該設(shè)備接收文檔(例如，通過響應(yīng)于從用戶的客戶端設(shè)備上的web瀏覽器接收的請(qǐng)求向web瀏覽器發(fā)送網(wǎng)頁)來與用戶交互。\n[0103] 在本說明書中描述的主題的實(shí)施例可以在計(jì)算系統(tǒng)中實(shí)施，該計(jì)算系統(tǒng)包括例如作為數(shù)據(jù)服務(wù)器的后端組件或者包括中間件組件(例如，應(yīng)用服務(wù)器)或者包括前端組件(例如，具有圖形用戶接口或者Web瀏覽器(用戶可以通過該圖形用戶接口或者Web瀏覽器與在本說明書中描述的主題的實(shí)現(xiàn)方式交互——)的客戶端計(jì)算機(jī))或者一個(gè)或者多個(gè)這樣的后端、中間件或者前端部件的任何組合。系統(tǒng)的組件可以通過任何數(shù)字?jǐn)?shù)據(jù)通信形式或者介質(zhì)(例如，通信網(wǎng)絡(luò))互連。通信網(wǎng)絡(luò)的示例包括局域網(wǎng)(“LAN”)和廣域網(wǎng)(“WAN”)，例如，因特網(wǎng)。\n[0104] 計(jì)算系統(tǒng)可以包括客戶端和服務(wù)器?？蛻舳撕头?wù)器一般相互遠(yuǎn)離并且通常通過通信網(wǎng)絡(luò)交互?？蛻舳撕头?wù)器的關(guān)系借助在相應(yīng)計(jì)算機(jī)上運(yùn)行并且相互具有客戶端-服務(wù)器關(guān)系的計(jì)算機(jī)程序而產(chǎn)生。\n[0105] 盡管本說明書包含許多具體實(shí)現(xiàn)方式細(xì)節(jié)，但是不應(yīng)將這些解釋為限制可以要求保護(hù)的內(nèi)容的范圍，而是解釋為對(duì)具體實(shí)現(xiàn)方式特有的特征的解釋。在本說明書中在分開的實(shí)施例的背景中描述的某些特征也可以在單個(gè)實(shí)施例中被組合實(shí)施。相反地，在單個(gè)實(shí)施例的背景中描述的各種特征也可以在多個(gè)實(shí)施例中分開地或者在任何適當(dāng)子組合中被實(shí)施。另外，雖然上文可以將特征描述為在某些組合中動(dòng)作并且甚至起初這樣要求保護(hù)，但是來自要求保護(hù)的組合的一個(gè)或者多個(gè)特征可以在一些情況下從該組合中被刪除，并且要求保護(hù)的組合可以涉及子組合或者子組合的變型。\n[0106] 類似地，盡管在附圖中以特定順序描繪操作，但是這不應(yīng)被理解為要求以所示特定順序或者以依次順序執(zhí)行這樣的操作或者執(zhí)行所有所示操作以實(shí)現(xiàn)希望的結(jié)果。在某些境況中，多任務(wù)和并行處理可以是有利的。另外，在上文描述的實(shí)施例中的各種系統(tǒng)部件的分離不應(yīng)被理解為在所有實(shí)施例中要求這樣的分離，并且應(yīng)當(dāng)理解描述的程序組件和系統(tǒng)一般可以一起集成于單個(gè)軟件產(chǎn)品中或者被封裝到多個(gè)軟件產(chǎn)品中。\n[0107] 家庭自動(dòng)化系統(tǒng)是將房中的電子設(shè)備互相集成的軟件、固件和/或硬件系統(tǒng)。家庭自動(dòng)化可以包括照明、HVAC(加熱，通風(fēng)和空調(diào))、電器和其他系統(tǒng)的集中控制。家庭自動(dòng)化系統(tǒng)還可以控制家中的活動(dòng)，例如家庭娛樂系統(tǒng)、室內(nèi)植物和院內(nèi)澆水、寵物喂食和/或家中機(jī)器人。家中的設(shè)備可以通過計(jì)算機(jī)網(wǎng)絡(luò)連接以允許處理系統(tǒng)的控制，并可以允許來自因特網(wǎng)的遠(yuǎn)程訪問。\n[0108] 描述了主題的具體實(shí)施例。其他實(shí)現(xiàn)方式在所附權(quán)利要求的范圍內(nèi)。例如，在權(quán)利要求中記載的動(dòng)作可以按不同順序被執(zhí)行而仍然實(shí)現(xiàn)希望的結(jié)果。作為一個(gè)示例，在附圖中描繪的過程未必需要所示特定順序或者依次順序以實(shí)現(xiàn)希望的結(jié)果。在某些實(shí)現(xiàn)方式中，多任務(wù)和并行處理可以是有利的?？梢蕴峁┗蛘叱ド鲜鲞^程中的其他步驟。因此，其他實(shí)現(xiàn)方式也在所附權(quán)利要求的范圍之內(nèi)。

我瀏覽過的專利

專利服務(wù)由北京酷愛智慧知識(shí)產(chǎn)權(quán)代理公司提供