基礎(chǔ)信息
權(quán)利要求
說明書
PDF全文
法律信息
引證文獻
著錄項信息
專利名稱 | 網(wǎng)絡(luò)信息推薦、建立網(wǎng)絡(luò)資源索引的方法及系統(tǒng) |
申請?zhí)?/td> | CN200910236867.6 | 申請日期 | 2009-11-04 |
法律狀態(tài) | 授權(quán) | 申報國家 | 中國 |
公開/公告日 | 2011-05-11 | 公開/公告號 | CN102054003A |
優(yōu)先權(quán) | 暫無 | 優(yōu)先權(quán)號 | 暫無 |
主分類號 | G06F17/30 | IPC分類號 | G;0;6;F;1;7;/;3;0查看分類表>
|
申請人 | 北京搜狗科技發(fā)展有限公司 | 申請人地址 | 北京市海淀區(qū)中關(guān)村東路1號院9號樓搜狐網(wǎng)絡(luò)大廈9層01房間
變更
專利地址、主體等相關(guān)變化,請及時變更,防止失效 |
權(quán)利人 | 北京搜狗科技發(fā)展有限公司 | 當(dāng)前權(quán)利人 | 北京搜狗科技發(fā)展有限公司 |
發(fā)明人 | 高志;茹立云;佟子健;李毅 |
代理機構(gòu) | 北京集佳知識產(chǎn)權(quán)代理有限公司 | 代理人 | 逯長明;王寶筠 |
摘要
本發(fā)明公開了網(wǎng)絡(luò)信息推薦、建立網(wǎng)絡(luò)資源索引的方法及系統(tǒng),其中,所述網(wǎng)絡(luò)信息推薦方法包括:獲得用戶訪問網(wǎng)絡(luò)資源的資源訪問記錄;將所述用戶的資源訪問記錄中的網(wǎng)絡(luò)資源拆分為網(wǎng)絡(luò)資源訪問對,每一網(wǎng)絡(luò)資源訪問對包含所述資源訪問記錄中的兩個網(wǎng)絡(luò)資源信息;匯集各用戶的網(wǎng)絡(luò)資源對,獲得網(wǎng)絡(luò)資源二維關(guān)系;當(dāng)需要為用戶進行推薦時,根據(jù)所述網(wǎng)絡(luò)資源二維關(guān)系為用戶推薦相關(guān)的網(wǎng)絡(luò)資源。通過本發(fā)明,能夠擴大用戶獲得信息的范圍,提高信息的利用率,降低了用戶獲得有用信息的難度。
1.一種網(wǎng)絡(luò)信息推薦的方法,其特征在于,包括:
獲得用戶訪問網(wǎng)絡(luò)資源的資源訪問記錄;
將所述用戶的資源訪問記錄中的網(wǎng)絡(luò)資源拆分為網(wǎng)絡(luò)資源訪問對,每一網(wǎng)絡(luò)資源訪問對包含所述資源訪問記錄中的兩個網(wǎng)絡(luò)資源信息;所述資源訪問記錄中記錄了用戶訪問過的網(wǎng)絡(luò)資源集合,所述拆分的方式為:將所述網(wǎng)絡(luò)資源集合中的網(wǎng)絡(luò)資源兩兩組成網(wǎng)絡(luò)資源訪問對;
對各用戶拆分后產(chǎn)生的網(wǎng)絡(luò)資源訪問對進行聚類以匯集各用戶的網(wǎng)絡(luò)資源訪問對,獲得網(wǎng)絡(luò)資源二維關(guān)系,所述網(wǎng)絡(luò)資源二維關(guān)系表示網(wǎng)絡(luò)資源兩兩之間的關(guān)系,所述二維中的一維是網(wǎng)頁,另一維也是網(wǎng)頁,所述網(wǎng)絡(luò)資源二維關(guān)系為網(wǎng)絡(luò)資源兩兩之間的相關(guān)性或相關(guān)度,所述相關(guān)性是非有即無的關(guān)系,所述相關(guān)度為不同的網(wǎng)絡(luò)資源之間的相關(guān)性的強弱;
當(dāng)需要為用戶進行推薦時,根據(jù)所述網(wǎng)絡(luò)資源二維關(guān)系所體現(xiàn)的網(wǎng)絡(luò)資源相關(guān)性或相關(guān)度為用戶推薦相關(guān)的網(wǎng)絡(luò)資源?!?br/>2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述網(wǎng)絡(luò)資源二維關(guān)系所體現(xiàn)的網(wǎng)絡(luò)資源相關(guān)性或相關(guān)度為用戶推薦相關(guān)的網(wǎng)絡(luò)資源包括:
根據(jù)所述網(wǎng)絡(luò)資源二維關(guān)系所體現(xiàn)的網(wǎng)絡(luò)資源相關(guān)性或相關(guān)度為用戶推薦與當(dāng)前訪問的網(wǎng)絡(luò)資源相關(guān)的網(wǎng)絡(luò)資源。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述網(wǎng)絡(luò)資源二維關(guān)系所體現(xiàn)的網(wǎng)絡(luò)資源相關(guān)性或相關(guān)度為用戶推薦相關(guān)的網(wǎng)絡(luò)資源包括:
根據(jù)所述網(wǎng)絡(luò)資源二維關(guān)系所體現(xiàn)的網(wǎng)絡(luò)資源相關(guān)性或相關(guān)度獲得相關(guān)的網(wǎng)絡(luò)資源集合,根據(jù)所述網(wǎng)絡(luò)資源集合向用戶推薦網(wǎng)絡(luò)資源。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,還包括:獲得各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源之間的相關(guān)度;在所述根據(jù)所述網(wǎng)絡(luò)資源二維關(guān)系所體現(xiàn)的網(wǎng)絡(luò)資源相關(guān)性或相關(guān)度獲得相關(guān)的網(wǎng)絡(luò)資源集合之后還包括:
根據(jù)各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源之間的相關(guān)度,對所述集合中的網(wǎng)絡(luò)資源進行排序。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,通過以下方式獲得各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源之間的相關(guān)度:
將相同的網(wǎng)絡(luò)資源對進行合并;根據(jù)網(wǎng)絡(luò)資源對的合并次數(shù),獲得各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源之間的相關(guān)度;
和/或,
根據(jù)網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源之間的訪問間隔時間,獲得各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源之間的相關(guān)度;
和/或,
通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,利用各網(wǎng)絡(luò)資源的特征向量獲得各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源之間的相關(guān)度;所述網(wǎng)絡(luò)資源特征向量用于描述網(wǎng)絡(luò)資源屬于各類別的置信度。
6.根據(jù)權(quán)利要求4所述的方法,其特征在于,還包括,通過以下方式對所述相關(guān)度進行修正:
將相同的網(wǎng)絡(luò)資源對進行合并;根據(jù)網(wǎng)絡(luò)資源對的合并次數(shù),對所述相關(guān)度進行修正;
和/或,
根據(jù)網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源之間的訪問間隔時間,對所述相關(guān)度進行修正; 和/或,
通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,利用各網(wǎng)絡(luò)資源的特征向量對所述相關(guān)度進行修正;所述網(wǎng)絡(luò)資源特征向量用于描述網(wǎng)絡(luò)資源屬于各類別的置信度;
和/或,
通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,所述網(wǎng)絡(luò)資源特征向量用于描述網(wǎng)絡(luò)資源屬于各類別的置信度;根據(jù)用戶的訪問歷史獲知用戶最可能訪問的網(wǎng)絡(luò)資源;將所述用戶最可能訪問的網(wǎng)絡(luò)資源的特征向量合并,得到各用戶的興趣向量;利用各用戶的興趣向量對所述相關(guān)度進行修正;所述興趣向量用于描述用戶對各類別的感興趣程度。
7.根據(jù)權(quán)利要求3或4所述的方法,其特征在于,所述網(wǎng)絡(luò)資源二維關(guān)系為核心索引,還包括:
根據(jù)輔助索引對所述集合中的網(wǎng)絡(luò)資源進行排序,所述輔助索引包括網(wǎng)絡(luò)資源的特征向量或用戶的興趣向量,其中,網(wǎng)絡(luò)資源的特征向量通過如下方式獲得:通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,所述網(wǎng)絡(luò)資源特征向量用于描述所述網(wǎng)絡(luò)資源屬于各類別的置信度;所述用戶的興趣向量通過如下方式獲得:根據(jù)用戶的訪問歷史獲知用戶最可能訪問的網(wǎng)絡(luò)資源;將所述用戶最可能訪問的網(wǎng)絡(luò)資源的特征向量合并,得到各用戶的興趣向量?!?br/>8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述根據(jù)輔助索引對所述集合中的網(wǎng)絡(luò)資源進行排序包括:
通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,所述網(wǎng)絡(luò)資源特征向量用于描述網(wǎng)絡(luò)資源屬于各類別的置信度;分別將各所述相關(guān)網(wǎng)絡(luò)資源的特征向量與用戶當(dāng)前訪問的網(wǎng)絡(luò)資源的特征向量進行內(nèi)積計算,并根據(jù)內(nèi)積計算的結(jié)果對各網(wǎng)絡(luò)資源進行排序;
或者,
通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,所述網(wǎng)絡(luò)資源特征向量用于描述網(wǎng)絡(luò)資源屬于各類別的置信度;根據(jù)用戶的訪問歷史獲知用戶最可能訪問的網(wǎng)絡(luò)資源;將所述用戶最可能訪問的網(wǎng)絡(luò)資源的特征向量合并,得到各用戶的興趣向量;所述興趣向量用于描述用戶對各類別的感興趣程度;分別將各所述相關(guān)網(wǎng)絡(luò)資源的特征向量與該用戶的興趣向量進行內(nèi)積計算,并根據(jù)內(nèi)積計算的結(jié)果對各網(wǎng)絡(luò)資源進行排序?!?br/>9.根據(jù)權(quán)利要求1至6、8任一項所述的方法,其特征在于,所述資源訪問記錄為資源訪問序列?!?br/>10.一種網(wǎng)絡(luò)信息推薦的系統(tǒng),其特征在于,包括:
資源訪問記錄獲得單元,用于獲得用戶訪問網(wǎng)絡(luò)資源的資源訪問記錄; 網(wǎng)絡(luò)資源拆分單元,用于將所述用戶的資源訪問記錄中的網(wǎng)絡(luò)資源拆分為網(wǎng)絡(luò)資源訪問對,每一網(wǎng)絡(luò)資源訪問對包含所述資源訪問記錄中的兩個網(wǎng)絡(luò)資源信息;所述資源訪問記錄中記錄了用戶訪問過的網(wǎng)絡(luò)資源集合,所述拆分的方式為:將所述網(wǎng)絡(luò)資源集合中的網(wǎng)絡(luò)資源兩兩組成網(wǎng)絡(luò)資源訪問對;
網(wǎng)絡(luò)資源對匯集單元,用于對各用戶拆分后產(chǎn)生的網(wǎng)絡(luò)資源訪問對進行聚類以匯集各用戶的網(wǎng)絡(luò)資源訪問對,獲得網(wǎng)絡(luò)資源二維關(guān)系,所述網(wǎng)絡(luò)資源二維關(guān)系表示網(wǎng)絡(luò)資源兩兩之間的關(guān)系,所述二維中的一維是網(wǎng)頁,另一維也是網(wǎng)頁,所述網(wǎng)絡(luò)資源二維關(guān)系為網(wǎng)絡(luò)資源兩兩之間的相關(guān)性或相關(guān)度,所述相關(guān)性是非有即無的關(guān)系,所述相關(guān)度為不同的網(wǎng)絡(luò)資源之間的相關(guān)性的強弱;
網(wǎng)絡(luò)資源推薦單元,用于當(dāng)需要為用戶進行推薦時,根據(jù)所述網(wǎng)絡(luò)資源二維關(guān)系所體現(xiàn)的網(wǎng)絡(luò)資源相關(guān)性或相關(guān)度為用戶推薦相關(guān)的網(wǎng)絡(luò)資源?!?br/>11.根據(jù)權(quán)利要求10所述的系統(tǒng),其特征在于,所述網(wǎng)絡(luò)資源推薦單元包括: 第一網(wǎng)絡(luò)資源推薦子單元,用于根據(jù)所述網(wǎng)絡(luò)資源二維關(guān)系所體現(xiàn)的網(wǎng)絡(luò)資源相關(guān)性或相關(guān)度為用戶推薦與當(dāng)前訪問的網(wǎng)絡(luò)資源相關(guān)的網(wǎng)絡(luò)資源?!?br/>12.根據(jù)權(quán)利要求10所述的系統(tǒng),其特征在于,所述網(wǎng)絡(luò)資源推薦單元包括: 網(wǎng)絡(luò)資源集合獲得子單元,用于根據(jù)所述網(wǎng)絡(luò)資源二維關(guān)系所體現(xiàn)的網(wǎng)絡(luò)資源相關(guān)性或相關(guān)度獲得與當(dāng)前訪問的網(wǎng)絡(luò)資源相關(guān)的網(wǎng)絡(luò)資源集合;
第二網(wǎng)絡(luò)資源推薦子單元,用于根據(jù)所述集合向用戶推薦網(wǎng)絡(luò)資源?!?br/>13.根據(jù)權(quán)利要求12所述的系統(tǒng),其特征在于,還包括:
網(wǎng)絡(luò)資源相關(guān)度獲得單元,用于獲得各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源之間的相關(guān)度; 所述網(wǎng)絡(luò)資源推薦單元還包括:
第一排序子單元,用于根據(jù)所述網(wǎng)絡(luò)資源二維關(guān)系所體現(xiàn)的網(wǎng)絡(luò)資源相關(guān)性或相關(guān)度獲得與當(dāng)前訪問的網(wǎng)絡(luò)資源相關(guān)的網(wǎng)絡(luò)資源集合之后,根據(jù)各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源之間的相關(guān)度,對所述集合中的網(wǎng)絡(luò)資源進行排序?!?br/>14.根據(jù)權(quán)利要求13所述的系統(tǒng),其特征在于,所述網(wǎng)絡(luò)資源相關(guān)度獲得單元包括: 第一網(wǎng)絡(luò)資源相關(guān)度獲得子單元,用于將相同的網(wǎng)絡(luò)資源對進行合并;根據(jù)網(wǎng)絡(luò)資源對的合并次數(shù),為各個網(wǎng)絡(luò)資源對進行評分,得到各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源之間的相關(guān)度;
和/或,
第二網(wǎng)絡(luò)資源相關(guān)度獲得子單元,用于根據(jù)網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源之間的訪問間隔時間,為各個網(wǎng)絡(luò)資源對進行評分,得到各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源之間的相關(guān)度; 和/或,
第三網(wǎng)絡(luò)資源相關(guān)度獲得子單元,用于通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,利用各網(wǎng)絡(luò)資源的特征向量獲得各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源之間的相關(guān)度;
所述網(wǎng)絡(luò)資源特征向量用于描述網(wǎng)絡(luò)資源屬于各類別的置信度?!?br/>15.根據(jù)權(quán)利要求12或13所述的系統(tǒng),其特征在于,所述網(wǎng)絡(luò)資源二維關(guān)系為核心索引,所述網(wǎng)絡(luò)資源推薦單元還包括:
第二排序子單元,用于根據(jù)輔助索引對所述集合中的網(wǎng)絡(luò)資源進行排序,所述輔助索引包括網(wǎng)絡(luò)資源的特征向量或用戶的興趣向量,其中,網(wǎng)絡(luò)資源的特征向量通過如下方式獲得:通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,所述網(wǎng)絡(luò)資源特征向量用于描述所述網(wǎng)絡(luò)資源屬于各類別的置信度;所述用戶的興趣向量通過如下方式獲得:根據(jù)用戶的訪問歷史獲知用戶最可能訪問的網(wǎng)絡(luò)資源;將所述用戶最可能訪問的網(wǎng)絡(luò)資源的特征向量合并,得到各用戶的興趣向量。
16.根據(jù)權(quán)利要求15所述的系統(tǒng),其特征在于:
所述第二排序子單元包括:
特征向量生成子單元,用于通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,所述網(wǎng)絡(luò)資源特征向量用于描述網(wǎng)絡(luò)資源屬于各類別的置信度;第一計算子單元,用于分別將各所述相關(guān)網(wǎng)絡(luò)資源的特征向量與用戶當(dāng)前訪問的網(wǎng)絡(luò)資源的特征向量進行內(nèi)積計算,并根據(jù)內(nèi)積計算的結(jié)果對各網(wǎng)絡(luò)資源進行排序;
或者,
所述第二排序子單元包括:
興趣向量生成子單元,用于通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,所述網(wǎng)絡(luò)資源特征向量用于描述網(wǎng)絡(luò)資源屬于各類別的置信度;根據(jù)用戶的訪問歷史獲知用戶最可能訪問的網(wǎng)絡(luò)資源;將所述用戶最可能訪問的網(wǎng)絡(luò)資源的特征向量合并,得到各用戶的興趣向量;所述興趣向量用于描述用戶對各類別的感興趣程度;第二計算子單元,用于分別將各所述相關(guān)網(wǎng)絡(luò)資源的特征向量與該用戶的興趣向量進行內(nèi)積計算,并根據(jù)內(nèi)積計算的結(jié)果對各網(wǎng)絡(luò)資源進行排序?!?br/>17.根據(jù)權(quán)利要求10所述的系統(tǒng),其特征在于,還包括:
過濾單元,用于過濾掉無效的網(wǎng)絡(luò)資源對,所述無效的網(wǎng)絡(luò)資源對包括:內(nèi)容不相關(guān)的網(wǎng)絡(luò)資源對、訪問時間間隔超過預(yù)置閾值的網(wǎng)絡(luò)資源對或者包含有廣告導(dǎo)航頁的網(wǎng)絡(luò)資源對?!?br/>18.一種建立網(wǎng)絡(luò)資源索引的方法,其特征在于,包括:
獲得用戶訪問網(wǎng)絡(luò)資源的資源訪問記錄;
將所述用戶的資源訪問記錄中的網(wǎng)絡(luò)資源拆分為網(wǎng)絡(luò)資源訪問對,每一網(wǎng)絡(luò)資源訪問對包含所述資源訪問記錄中的兩個網(wǎng)絡(luò)資源信息;所述資源訪問記錄中記錄了用戶訪問過的網(wǎng)絡(luò)資源集合,所述拆分的方式為:將所述網(wǎng)絡(luò)資源集合中的網(wǎng)絡(luò)資源兩兩組成網(wǎng)絡(luò)資源訪問對;
對各用戶拆分后產(chǎn)生的網(wǎng)絡(luò)資源訪問對進行聚類以匯集各用戶的網(wǎng)絡(luò)資源訪問對,獲得網(wǎng)絡(luò)資源二維關(guān)系,建立起網(wǎng)絡(luò)資源索引;所述網(wǎng)絡(luò)資源二維關(guān)系表示網(wǎng)絡(luò)資源兩兩之間的關(guān)系,所述二維中的一維是網(wǎng)頁,另一維也是網(wǎng)頁,所述網(wǎng)絡(luò)資源二維關(guān)系為網(wǎng)絡(luò)資源兩兩之間的相關(guān)性或相關(guān)度,所述相關(guān)性是非有即無的關(guān)系,所述相關(guān)度為不同的網(wǎng)絡(luò)資源之間的相關(guān)性的強弱?!?br/>19.根據(jù)權(quán)利要求18所述的方法,其特征在于,還包括:獲得各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源之間的相關(guān)度,以便根據(jù)所述相關(guān)度對所述網(wǎng)絡(luò)資源進行排序。
20.根據(jù)權(quán)利要求19所述的方法,其特征在于,通過以下方式獲得各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源之間的相關(guān)度:
將相同的網(wǎng)絡(luò)資源對進行合并;根據(jù)網(wǎng)絡(luò)資源對的合并次數(shù),獲得各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源之間的相關(guān)度;
和/或,
根據(jù)網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源之間的訪問間隔時間,獲得各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源之間的相關(guān)度;
和/或,
通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,利用各網(wǎng)絡(luò)資源的特征向量獲得各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源之間的相關(guān)度;所述網(wǎng)絡(luò)資源特征向量用于描述網(wǎng)絡(luò)資源屬于各類別的置信度?!?br/>21.一種建立網(wǎng)絡(luò)資源索引的系統(tǒng),其特征在于,包括:
資源訪問記錄獲得單元,用于獲得用戶訪問網(wǎng)絡(luò)資源的資源訪問記錄; 網(wǎng)絡(luò)資源拆分單元,用于將所述用戶的資源訪問記錄中的網(wǎng)絡(luò)資源拆分為網(wǎng)絡(luò)資源訪問對,每一網(wǎng)絡(luò)資源訪問對包含所述資源訪問記錄中的兩個網(wǎng)絡(luò)資源信息;所述資源訪問記錄中記錄了用戶訪問過的網(wǎng)絡(luò)資源集合,所述拆分的方式為:將所述網(wǎng)絡(luò)資源集合中的網(wǎng)絡(luò)資源兩兩組成網(wǎng)絡(luò)資源訪問對;
網(wǎng)絡(luò)資源對匯集單元,用于對各用戶拆分后產(chǎn)生的網(wǎng)絡(luò)資源訪問對進行聚類以匯集各用戶的網(wǎng)絡(luò)資源對,獲得網(wǎng)絡(luò)資源二維關(guān)系,建立起網(wǎng)絡(luò)資源索引,所述網(wǎng)絡(luò)資源二維關(guān)系表示網(wǎng)絡(luò)資源兩兩之間的關(guān)系,所述二維中的一維是網(wǎng)頁,另一維也是網(wǎng)頁,所述網(wǎng)絡(luò)資源二維關(guān)系為網(wǎng)絡(luò)資源兩兩之間的相關(guān)性或相關(guān)度,所述相關(guān)性是非有即無的關(guān)系,所述相關(guān)度為不同的網(wǎng)絡(luò)資源之間的相關(guān)性的強弱?!?br/>22.根據(jù)權(quán)利要求21所述的系統(tǒng),其特征在于,還包括:
網(wǎng)絡(luò)資源相關(guān)度獲得單元,用于獲得各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源之間的相關(guān)度,以便根據(jù)所述相關(guān)度對所述網(wǎng)絡(luò)資源進行排序?!?br/>23.根據(jù)權(quán)利要求22所述的系統(tǒng),其特征在于,所述網(wǎng)絡(luò)資源相關(guān)度獲得單元包括: 第一網(wǎng)絡(luò)資源相關(guān)度獲得子單元,用于將相同的網(wǎng)絡(luò)資源對進行合并;根據(jù)網(wǎng)絡(luò)資源對的合并次數(shù),獲得各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源之間的相關(guān)度;
和/或,
第二網(wǎng)絡(luò)資源相關(guān)度獲得子單元,用于根據(jù)網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源之間的訪問間隔時間,獲得各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源之間的相關(guān)度;
和/或,
第三網(wǎng)絡(luò)資源相關(guān)度獲得子單元,用于通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,利用各網(wǎng)絡(luò)資源的特征向量獲得各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源之間的相關(guān)度;
所述網(wǎng)絡(luò)資源特征向量用于描述網(wǎng)絡(luò)資源屬于各類別的置信度?!?br/>24.根據(jù)權(quán)利要求22所述的系統(tǒng),其特征在于,還包括:
第一網(wǎng)絡(luò)資源相關(guān)度修正單元,用于將相同的網(wǎng)絡(luò)資源對進行合并;根據(jù)網(wǎng)絡(luò)資源對的合并次數(shù),對所述相關(guān)度進行修正;
和/或,
第二網(wǎng)絡(luò)資源相關(guān)度修正單元,用于根據(jù)網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源之間的訪問間隔時間,對所述相關(guān)度進行修正;
和/或,
第三網(wǎng)絡(luò)資源相關(guān)度修正單元,用于通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,利用各網(wǎng)絡(luò)資源的特征向量對所述相關(guān)度進行修正;所述網(wǎng)絡(luò)資源特征向量用于描述網(wǎng)絡(luò)資源屬于各類別的置信度;
和/或,
第四網(wǎng)絡(luò)資源相關(guān)度修正單元,通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,所述網(wǎng)絡(luò)資源特征向量用于描述網(wǎng)絡(luò)資源屬于各類別的置信度;根據(jù)用戶的訪問歷史獲知用戶最可能訪問的網(wǎng)絡(luò)資源;將所述用戶最可能訪問的網(wǎng)絡(luò)資源的特征向量合并,得到各用戶的興趣向量;利用各用戶的興趣向量對所述相關(guān)度進行修正;所述興趣向量用于描述用戶對各類別的感興趣程度。
25.一種網(wǎng)絡(luò)信息推薦的方法,其特征在于,包括:
獲得訪問同一網(wǎng)絡(luò)資源的用戶記錄;
將所述用戶記錄中的各用戶信息拆分為用戶對,每一用戶對包含所述用戶記錄中的兩個用戶信息;所述拆分的方式為:將所述各用戶信息兩兩組成用戶對; 對所述用戶對進行聚類以匯集各個網(wǎng)絡(luò)資源的用戶對,建立用戶二維關(guān)系,所述用戶二維關(guān)系表示用戶兩兩之間的關(guān)系,所述二維中的一維是用戶,另一維也是用戶,用戶二維關(guān)系為用戶兩兩之間的相關(guān)性或相關(guān)度,所述相關(guān)性是非有即無的關(guān)系,所述相關(guān)度為不同的用戶之間的相關(guān)性的強弱;
當(dāng)需要為用戶進行推薦時,根據(jù)所述用戶二維關(guān)系所體現(xiàn)的用戶相關(guān)性或相關(guān)度推薦相關(guān)的用戶信息?!?br/>26.根據(jù)權(quán)利要求25所述的方法,其特征在于,所述根據(jù)所述用戶二維關(guān)系所體現(xiàn)的用戶相關(guān)性或相關(guān)度推薦相關(guān)的用戶信息包括:
根據(jù)所述用戶二維關(guān)系所體現(xiàn)的用戶相關(guān)性或相關(guān)度推薦與當(dāng)前訪問的用戶相關(guān)的用戶信息?!?br/>27.根據(jù)權(quán)利要求25所述的方法,其特征在于,所述根據(jù)所述用戶二維關(guān)系所體現(xiàn)的用戶相關(guān)性或相關(guān)度推薦相關(guān)的用戶信息包括:根據(jù)所述用戶二維關(guān)系所體現(xiàn)的用戶相關(guān)性或相關(guān)度獲得相關(guān)的用戶集合,根據(jù)所述集合向用戶推薦相關(guān)的用戶信息; 所述方法還包括:獲得各用戶對中兩用戶之間的相關(guān)度,在所述根據(jù)所述用戶二維關(guān)系獲得相關(guān)的用戶集合之后還包括:根據(jù)各用戶對中兩用戶之間的相關(guān)度,對所述集合中的用戶進行排序?!?br/>28.根據(jù)權(quán)利要求27所述的方法,其特征在于,所述用戶二維關(guān)系為核心索引,還包括:
根據(jù)輔助索引對所述集合中的用戶進行排序,所述輔助索引包括網(wǎng)絡(luò)資源的特征向量或用戶的興趣向量,其中,網(wǎng)絡(luò)資源的特征向量通過如下方式獲得:通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,所述網(wǎng)絡(luò)資源特征向量用于描述所述網(wǎng)絡(luò)資源屬于各類別的置信度;所述用戶的興趣向量通過如下方式獲得:根據(jù)用戶的訪問歷史獲知用戶最可能訪問的網(wǎng)絡(luò)資源;將所述用戶最可能訪問的網(wǎng)絡(luò)資源的特征向量合并,得到各用戶的興趣向量。
29.一種網(wǎng)絡(luò)信息推薦的系統(tǒng),其特征在于,包括:
用戶記錄獲得單元,用于獲得訪問同一網(wǎng)絡(luò)資源的用戶記錄;
用戶拆分單元,用于將所述用戶記錄中的各用戶信息拆分為用戶對,每一用戶對包含所述用戶記錄中的兩個用戶信息;所述拆分的方式為:將所述各用戶信息兩兩組成用戶對;
用戶對匯集單元,用于對所述用戶對進行聚類以匯集各個網(wǎng)絡(luò)資源的用戶對,獲得用戶二維關(guān)系,所述用戶二維關(guān)系表示用戶兩兩之間的關(guān)系,所述二維中的一維是用戶,另一維也是用戶,用戶二維關(guān)系為用戶兩兩之間的相關(guān)性或相關(guān)度,所述相關(guān)性是非有即無的關(guān)系,所述相關(guān)度為不同的用戶之間的相關(guān)性的強弱;
用戶信息推薦單元,用于當(dāng)需要為用戶進行推薦時,根據(jù)所述用戶二維關(guān)系所體現(xiàn)的用戶相關(guān)性或相關(guān)度推薦相關(guān)的用戶信息?!?br/>30.根據(jù)權(quán)利要求29所述的系統(tǒng),其特征在于,所述用戶信息推薦單元包括: 第一用戶信息推薦子單元,用于根據(jù)所述用戶二維關(guān)系所體現(xiàn)的用戶相關(guān)性或相關(guān)度推薦與當(dāng)前訪問的用戶相關(guān)的用戶信息。
31.根據(jù)權(quán)利要求29所述的系統(tǒng),其特征在于,所述用戶信息推薦單元包括:用戶信息集合生成子單元,用于根據(jù)所述用戶二維關(guān)系所體現(xiàn)的用戶相關(guān)性或相關(guān)度獲得相關(guān)的用戶集合;第二用戶信息推薦子單元,用于根據(jù)所述集合向用戶推薦相關(guān)的用戶信息; 或者,
所述系統(tǒng)還包括:用戶相關(guān)度獲得單元,用于獲得各用戶對中兩用戶之間的相關(guān)度;
所述用戶信息推薦單元還包括:第一用戶排序子單元,用于根據(jù)各用戶對中兩用戶之間的相關(guān)度,對所述集合中的用戶進行排序?!?br/>32.根據(jù)權(quán)利要求31所述的系統(tǒng),其特征在于,所述用戶二維關(guān)系為核心索引,所述用戶信息推薦單元還包括:
第二用戶排序子單元,用于根據(jù)輔助索引對所述集合中的用戶進行排序,所述輔助索引包括網(wǎng)絡(luò)資源的特征向量或用戶的興趣向量,其中,網(wǎng)絡(luò)資源的特征向量通過如下方式獲得:通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,所述網(wǎng)絡(luò)資源特征向量用于描述所述網(wǎng)絡(luò)資源屬于各類別的置信度;所述用戶的興趣向量通過如下方式獲得:根據(jù)用戶的訪問歷史獲知用戶最可能訪問的網(wǎng)絡(luò)資源;將所述用戶最可能訪問的網(wǎng)絡(luò)資源的特征向量合并,得到各用戶的興趣向量?!?br/>33.一種建立用戶索引的方法,其特征在于,包括:
獲得訪問同一網(wǎng)絡(luò)資源的用戶記錄;
將所述用戶記錄中的各用戶拆分為用戶對,每一用戶對包含所述用戶記錄中的兩個用戶;所述拆分的方式為:將所述各用戶兩兩組成用戶對;
對所述用戶對進行聚類以匯集各個網(wǎng)絡(luò)資源的用戶對,獲得用戶二維關(guān)系,建立起用戶索引,所述用戶二維關(guān)系表示用戶兩兩之間的關(guān)系,所述二維中的一維是用戶,另一維也是用戶,用戶二維關(guān)系為用戶兩兩之間的相關(guān)性或相關(guān)度,所述相關(guān)性是非有即無的關(guān)系,所述相關(guān)度為不同的用戶之間的相關(guān)性的強弱?!?br/>34.根據(jù)權(quán)利要求33所述的方法,其特征在于,還包括:
獲得各用戶對中兩用戶之間的相關(guān)度?!?br/>35.根據(jù)權(quán)利要求34所述的方法,其特征在于,通過以下方式獲得各用戶對中兩用戶之間的相關(guān)度:
將相同的用戶對進行合并;根據(jù)用戶對的合并次數(shù),為各個用戶對進行評分,得到各用戶對中兩用戶之間的相關(guān)度;
和/或,
通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,根據(jù)用戶的訪問歷史獲知用戶最可能訪問的網(wǎng)絡(luò)資源;將所述用戶最可能訪問的網(wǎng)絡(luò)資源的特征向量合并,得到各用戶的興趣向量;根據(jù)所述用戶的興趣向量獲得各用戶對中兩用戶之間的相關(guān)度;所述網(wǎng)絡(luò)資源特征向量用于描述網(wǎng)絡(luò)資源屬于各類別的置信度;所述興趣向量用于描述用戶對各類別的感興趣程度。
36.一種建立用戶索引的系統(tǒng),其特征在于,包括:
用戶記錄獲得單元,用于獲得訪問同一網(wǎng)絡(luò)資源的用戶記錄;
用戶拆分單元,用于將所述用戶記錄中的各用戶信息拆分為用戶對,每一用戶對包含所述用戶記錄中的兩個用戶信息;所述拆分的方式為:將所述各用戶信息兩兩組成用戶對;
用戶對匯集單元,用于對所述用戶對進行聚類以匯集各個網(wǎng)絡(luò)資源的用戶對,獲得用戶二維關(guān)系,建立起用戶索引,所述用戶二維關(guān)系表示用戶兩兩之間的關(guān)系,所述二維中的一維是用戶,另一維也是用戶,用戶二維關(guān)系為用戶兩兩之間的相關(guān)性或相關(guān)度,所述相關(guān)性是非有即無的關(guān)系,所述相關(guān)度為不同的用戶之間的相關(guān)性的強弱?!?br/>37.根據(jù)權(quán)利要求36所述的系統(tǒng),其特征在于,還包括:
用戶相關(guān)度獲得單元,用于獲得各用戶對中兩用戶之間的相關(guān)度,以便根據(jù)所述相關(guān)度對用戶進行排序。
38.根據(jù)權(quán)利要求37所述的系統(tǒng),其特征在于,所述用戶相關(guān)度獲得單元包括: 第一用戶相關(guān)度獲得子單元,用于將相同的用戶對進行合并;根據(jù)用戶對的合并次數(shù),為各個用戶對進行評分,得到各用戶對中兩用戶之間的相關(guān)度;
和/或,
第二用戶相關(guān)度獲得子單元,用于通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,根據(jù)用戶的訪問歷史獲知用戶最可能訪問的網(wǎng)絡(luò)資源;將所述用戶最可能訪問的網(wǎng)絡(luò)資源的特征向量合并,得到各用戶的興趣向量;根據(jù)所述用戶的興趣向量獲得各用戶對中兩用戶之間的相關(guān)度;所述網(wǎng)絡(luò)資源特征向量用于描述網(wǎng)絡(luò)資源屬于各類別的置信度;所述興趣向量用于描述用戶對各類別的感興趣程度。
網(wǎng)絡(luò)信息推薦、建立網(wǎng)絡(luò)資源索引的方法及系統(tǒng)\n技術(shù)領(lǐng)域\n[0001] 本發(fā)明涉及瀏覽器技術(shù)領(lǐng)域,特別是涉及網(wǎng)絡(luò)信息推薦、建立網(wǎng)絡(luò)資源索引的方法及系統(tǒng)。\n背景技術(shù)\n[0002] 現(xiàn)在網(wǎng)絡(luò)技術(shù)飛速發(fā)展,互聯(lián)網(wǎng)上的信息量非常大,因此如何讓用戶快速找到自己想要或者適合自己的網(wǎng)絡(luò)信息則成為技術(shù)人員迫切需要解決的技術(shù)問題。\n[0003] 為了解決上述技術(shù)問題,出現(xiàn)了一種網(wǎng)絡(luò)信息推薦系統(tǒng)(Recommender system),該系統(tǒng)是信息過濾系統(tǒng)的一種。以網(wǎng)頁推薦為例,通常需要預(yù)先建立網(wǎng)頁索引,在需要給用戶進行推薦時,在網(wǎng)頁索引中檢索出可以推薦的網(wǎng)頁?,F(xiàn)有技術(shù)中的網(wǎng)頁索引通常是基于關(guān)鍵詞建立的,例如,可以預(yù)先提取各個網(wǎng)頁中具有代表性的關(guān)鍵詞,然后按照關(guān)鍵詞建立網(wǎng)頁索引;當(dāng)需要進行網(wǎng)頁推薦時,提取當(dāng)前網(wǎng)頁中具有代表性的關(guān)鍵詞作為檢索詞,然后在預(yù)先建立的索引中檢索具有該檢索詞的網(wǎng)頁,然后將檢索到的網(wǎng)頁推薦給相關(guān)用戶。\n[0004] 但是在基于這種索引方式的網(wǎng)絡(luò)信息推薦系統(tǒng)下,對于不包含檢索詞的網(wǎng)頁,就無法推薦給用戶,使得用戶獲得信息的范圍比較狹窄,既限制了信息的利用率,也增加了用戶獲得有用信息的難度。\n發(fā)明內(nèi)容\n[0005] 本發(fā)明提供了網(wǎng)絡(luò)信息推薦、建立網(wǎng)絡(luò)資源索引的方法及系統(tǒng),能夠提高網(wǎng)絡(luò)信息的利用率。\n[0006] 本發(fā)明提供了如下方案:\n[0007] 一種網(wǎng)絡(luò)信息推薦的方法,包括:\n[0008] 獲得用戶訪問網(wǎng)絡(luò)資源的資源訪問記錄;\n[0009] 將所述用戶的資源訪問記錄中的網(wǎng)絡(luò)資源拆分為網(wǎng)絡(luò)資源訪問對,每一網(wǎng)絡(luò)資源訪問對包含所述資源訪問記錄中的兩個網(wǎng)絡(luò)資源信息;所述資源訪問記錄中記錄了用戶訪問過的網(wǎng)絡(luò)資源集合,所述拆分的方式為:將所述網(wǎng)絡(luò)資源集合中的網(wǎng)絡(luò)資源兩兩組成網(wǎng)絡(luò)資源訪問對;\n[0010] 對各用戶拆分后產(chǎn)生的網(wǎng)絡(luò)資源訪問對進行聚類以匯集各用戶的網(wǎng)絡(luò)資源訪問對,獲得網(wǎng)絡(luò)資源二維關(guān)系,所述網(wǎng)絡(luò)資源二維關(guān)系表示網(wǎng)絡(luò)資源兩兩之間的關(guān)系,所述二維中的一維是網(wǎng)頁,另一維也是網(wǎng)頁;\n[0011] 當(dāng)需要為用戶進行推薦時,根據(jù)所述網(wǎng)絡(luò)資源二維關(guān)系所體現(xiàn)的網(wǎng)絡(luò)資源相關(guān)性為用戶推薦相關(guān)的網(wǎng)絡(luò)資源。\n[0012] 優(yōu)選的,所述根據(jù)所述網(wǎng)絡(luò)資源二維關(guān)系為用戶推薦相關(guān)的網(wǎng)絡(luò)資源包括:根據(jù)所述網(wǎng)絡(luò)資源二維關(guān)系為用戶推薦與當(dāng)前訪問的網(wǎng)絡(luò)資源相關(guān)的網(wǎng)絡(luò)資源。\n[0013] 優(yōu)選的,所述根據(jù)所述網(wǎng)絡(luò)資源二維關(guān)系為用戶推薦相關(guān)的網(wǎng)絡(luò)資源包括:\n[0014] 根據(jù)所述網(wǎng)絡(luò)資源二維關(guān)系獲得相關(guān)的網(wǎng)絡(luò)資源集合,根據(jù)所述網(wǎng)絡(luò)資源集合向用戶推薦網(wǎng)絡(luò)資源。\n[0015] 優(yōu)選的:獲得各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源的相關(guān)度;在所述根據(jù)所述網(wǎng)絡(luò)資源二維關(guān)系獲得相關(guān)的網(wǎng)絡(luò)資源集合之后還包括:\n[0016] 根據(jù)各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源的相關(guān)度,對所述集合中的網(wǎng)絡(luò)資源進行排序。\n[0017] 優(yōu)選的,通過以下方式獲得各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源的相關(guān)度:\n[0018] 將相同的網(wǎng)絡(luò)資源對進行合并;根據(jù)網(wǎng)絡(luò)資源對的合并次數(shù),獲得各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源的相關(guān)度;\n[0019] 和/或,\n[0020] 根據(jù)網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源之間的間隔時間,獲得各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源的相關(guān)度;\n[0021] 和/或,\n[0022] 通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,利用各網(wǎng)絡(luò)資源的特征向量獲得各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源的相關(guān)度;所述網(wǎng)絡(luò)資源特征向量用于描述網(wǎng)絡(luò)資源屬于各類別的置信度。\n[0023] 優(yōu)選的,通過以下方式對所述相關(guān)度進行修正:\n[0024] 將相同的網(wǎng)絡(luò)資源對進行合并;根據(jù)網(wǎng)絡(luò)資源對的合并次數(shù),對所述相關(guān)度進行修正;\n[0025] 和/或,\n[0026] 根據(jù)網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源之間的間隔時間,對所述相關(guān)度進行修正;\n[0027] 和/或,\n[0028] 通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,利用各網(wǎng)絡(luò)資源的特征向量對所述相關(guān)度進行修正;所述網(wǎng)絡(luò)資源特征向量用于描述網(wǎng)絡(luò)資源屬于各類別的置信度;\n[0029] 和/或,\n[0030] 通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,所述網(wǎng)絡(luò)資源特征向量用于描述網(wǎng)絡(luò)資源屬于各類別的置信度;根據(jù)用戶的訪問歷史獲知用戶最可能訪問的網(wǎng)絡(luò)資源;將所述用戶最可能訪問的網(wǎng)絡(luò)資源的特征向量合并,得到各用戶的興趣向量;利用各用戶的興趣向量對所述相關(guān)度進行修正;所述興趣向量用于描述用戶對各類別的感興趣程度。\n[0031] 優(yōu)選的,所述網(wǎng)絡(luò)資源二維關(guān)系為核心索引,還包括:\n[0032] 根據(jù)輔助索引對所述集合中的網(wǎng)絡(luò)資源進行排序。\n[0033] 優(yōu)選的,所述根據(jù)輔助索引對所述集合中的網(wǎng)絡(luò)資源進行排序包括:\n[0034] 通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,所述網(wǎng)絡(luò)資源特征向量用于描述網(wǎng)絡(luò)資源屬于各類別的置信度;分別將各所述相關(guān)網(wǎng)絡(luò)資源的特征向量與用戶當(dāng)前訪問的網(wǎng)絡(luò)資源的特征向量進行內(nèi)積計算,并根據(jù)內(nèi)積計算的結(jié)果對各網(wǎng)絡(luò)資源進行排序;\n[0035] 或者,\n[0036] 通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,所述網(wǎng)絡(luò)資源特征向量用于描述網(wǎng)絡(luò)資源屬于各類別的置信度;根據(jù)用戶的訪問歷史獲知用戶最可能訪問的網(wǎng)絡(luò)資源;將所述用戶最可能訪問的網(wǎng)絡(luò)資源的特征向量合并,得到各用戶的興趣向量;所述興趣向量用于描述用戶對各類別的感興趣程度;分別將各所述相關(guān)網(wǎng)絡(luò)資源的特征向量與該用戶的興趣向量進行內(nèi)積計算,并根據(jù)內(nèi)積計算的結(jié)果對各網(wǎng)絡(luò)資源進行排序。\n[0037] 優(yōu)選的,所述資源訪問記錄為資源訪問序列。\n[0038] 一種網(wǎng)絡(luò)信息推薦的系統(tǒng),包括:\n[0039] 資源訪問記錄獲得單元,用于獲得用戶訪問網(wǎng)絡(luò)資源的資源訪問記錄;\n[0040] 網(wǎng)絡(luò)資源拆分單元,用于將所述用戶的資源訪問記錄中的網(wǎng)絡(luò)資源拆分為網(wǎng)絡(luò)資源訪問對,每一網(wǎng)絡(luò)資源訪問對包含所述資源訪問記錄中的兩個網(wǎng)絡(luò)資源信息;所述資源訪問記錄中記錄了用戶訪問過的網(wǎng)絡(luò)資源集合,所述拆分的方式為:將所述網(wǎng)絡(luò)資源集合中的網(wǎng)絡(luò)資源兩兩組成網(wǎng)絡(luò)資源訪問對;\n[0041] 網(wǎng)絡(luò)資源對匯集單元,用于對各用戶拆分后產(chǎn)生的網(wǎng)絡(luò)資源訪問對進行聚類以匯集各用戶的網(wǎng)絡(luò)資源訪問對,獲得網(wǎng)絡(luò)資源二維關(guān)系,所述網(wǎng)絡(luò)資源二維關(guān)系表示網(wǎng)絡(luò)資源兩兩之間的關(guān)系,所述二維中的一維是網(wǎng)頁,另一維也是網(wǎng)頁;\n[0042] 網(wǎng)絡(luò)資源推薦單元,用于當(dāng)需要為用戶進行推薦時,根據(jù)所述網(wǎng)絡(luò)資源二維關(guān)系所體現(xiàn)的網(wǎng)絡(luò)資源相關(guān)性為用戶推薦相關(guān)的網(wǎng)絡(luò)資源。\n[0043] 優(yōu)選的,所述網(wǎng)絡(luò)資源推薦單元包括:\n[0044] 第一網(wǎng)絡(luò)資源推薦子單元,用于根據(jù)所述網(wǎng)絡(luò)資源二維關(guān)系為用戶推薦與當(dāng)前訪問的網(wǎng)絡(luò)資源相關(guān)的網(wǎng)絡(luò)資源。\n[0045] 優(yōu)選的,所述網(wǎng)絡(luò)資源推薦單元包括:\n[0046] 網(wǎng)絡(luò)資源集合獲得子單元,用于根據(jù)所述網(wǎng)絡(luò)資源二維關(guān)系獲得與當(dāng)前訪問的網(wǎng)絡(luò)資源相關(guān)的網(wǎng)絡(luò)資源集合;\n[0047] 第二網(wǎng)絡(luò)資源推薦子單元,用于根據(jù)所述集合向用戶推薦網(wǎng)絡(luò)資源。\n[0048] 優(yōu)選的,還包括:\n[0049] 網(wǎng)絡(luò)資源相關(guān)度獲得單元,用于獲得各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源的相關(guān)度;\n[0050] 所述網(wǎng)絡(luò)資源推薦單元還包括:\n[0051] 第一排序子單元,用于根據(jù)所述網(wǎng)絡(luò)資源二維關(guān)系獲得與當(dāng)前訪問的網(wǎng)絡(luò)資源相關(guān)的網(wǎng)絡(luò)資源集合之后,根據(jù)各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源的相關(guān)度,對所述集合中的網(wǎng)絡(luò)資源進行排序。\n[0052] 優(yōu)選的,所述網(wǎng)絡(luò)資源相關(guān)度獲得單元包括:\n[0053] 第一網(wǎng)絡(luò)資源相關(guān)度獲得子單元,用于將相同的網(wǎng)絡(luò)資源對進行合并;根據(jù)網(wǎng)絡(luò)資源對的合并次數(shù),為各個網(wǎng)絡(luò)資源對進行評分,得到各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源的相關(guān)度;\n[0054] 和/或,\n[0055] 第二網(wǎng)絡(luò)資源相關(guān)度獲得子單元,用于根據(jù)網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源之間的間隔時間,為各個網(wǎng)絡(luò)資源對進行評分,得到各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源的相關(guān)度;\n[0056] 和/或,\n[0057] 第三網(wǎng)絡(luò)資源相關(guān)度獲得子單元,用于通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,利用各網(wǎng)絡(luò)資源的特征向量獲得各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源的相關(guān)度;\n所述網(wǎng)絡(luò)資源特征向量用于描述網(wǎng)絡(luò)資源屬于各類別的置信度。\n[0058] 優(yōu)選的,所述網(wǎng)絡(luò)資源二維關(guān)系為核心索引,所述網(wǎng)絡(luò)資源推薦單元還包括:\n[0059] 第二排序子單元,用于根據(jù)輔助索引對所述集合中的網(wǎng)絡(luò)資源進行排序。\n[0060] 優(yōu)選的:\n[0061] 所述第二排序子單元包括:\n[0062] 特征向量生成子單元,用于通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,所述網(wǎng)絡(luò)資源特征向量用于描述網(wǎng)絡(luò)資源屬于各類別的置信度;第一計算子單元,用于分別將各所述相關(guān)網(wǎng)絡(luò)資源的特征向量與用戶當(dāng)前訪問的網(wǎng)絡(luò)資源的特征向量進行內(nèi)積計算,并根據(jù)內(nèi)積計算的結(jié)果對各網(wǎng)絡(luò)資源進行排序;\n[0063] 或者,\n[0064] 所述第二排序子單元包括:\n[0065] 興趣向量生成子單元,用于通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,所述網(wǎng)絡(luò)資源特征向量用于描述網(wǎng)絡(luò)資源屬于各類別的置信度;根據(jù)用戶的訪問歷史獲知用戶最可能訪問的網(wǎng)絡(luò)資源;將所述用戶最可能訪問的網(wǎng)絡(luò)資源的特征向量合并,得到各用戶的興趣向量;所述興趣向量用于描述用戶對各類別的感興趣程度;第二計算子單元,用于分別將各所述相關(guān)網(wǎng)絡(luò)資源的特征向量與該用戶的興趣向量進行內(nèi)積計算,并根據(jù)內(nèi)積計算的結(jié)果對各網(wǎng)絡(luò)資源進行排序。\n[0066] 優(yōu)選的,還包括:\n[0067] 過濾單元,用于過濾掉無效的網(wǎng)絡(luò)資源對,所述無效的網(wǎng)絡(luò)資源對包括:內(nèi)容不相關(guān)的網(wǎng)絡(luò)資源對、訪問時間間隔超過預(yù)置閾值的網(wǎng)絡(luò)資源對或者包含有廣告導(dǎo)航頁的網(wǎng)絡(luò)資源對。\n[0068] 一種建立網(wǎng)絡(luò)資源索引的方法,包括:\n[0069] 獲得用戶訪問網(wǎng)絡(luò)資源的資源訪問記錄;\n[0070] 將所述用戶的資源訪問記錄中的網(wǎng)絡(luò)資源拆分為網(wǎng)絡(luò)資源訪問對,每一網(wǎng)絡(luò)資源訪問對包含所述資源訪問記錄中的兩個網(wǎng)絡(luò)資源信息;所述資源訪問記錄中記錄了用戶訪問過的網(wǎng)絡(luò)資源集合,所述拆分的方式為:將所述網(wǎng)絡(luò)資源集合中的網(wǎng)絡(luò)資源兩兩組成網(wǎng)絡(luò)資源訪問對;\n[0071] 對各用戶拆分后產(chǎn)生的網(wǎng)絡(luò)資源訪問對進行聚類以匯集各用戶的網(wǎng)絡(luò)資源訪問對,獲得網(wǎng)絡(luò)資源二維關(guān)系,建立起網(wǎng)絡(luò)資源索引;所述網(wǎng)絡(luò)資源二維關(guān)系表示網(wǎng)絡(luò)資源兩兩之間的關(guān)系,所述二維中的一維是網(wǎng)頁,另一維也是網(wǎng)頁。\n[0072] 優(yōu)選的,還包括:獲得各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源的相關(guān)度,以便根據(jù)所述相關(guān)度對所述網(wǎng)絡(luò)資源進行排序。\n[0073] 優(yōu)選的,通過以下方式獲得各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源的相關(guān)度:\n[0074] 將相同的網(wǎng)絡(luò)資源對進行合并;根據(jù)網(wǎng)絡(luò)資源對的合并次數(shù),獲得各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源的相關(guān)度;\n[0075] 和/或,\n[0076] 根據(jù)網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源之間的間隔時間,獲得各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源的相關(guān)度;\n[0077] 和/或,\n[0078] 通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,利用各網(wǎng)絡(luò)資源的特征向量獲得各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源的相關(guān)度;所述網(wǎng)絡(luò)資源特征向量用于描述網(wǎng)絡(luò)資源屬于各類別的置信度。\n[0079] 一種建立網(wǎng)絡(luò)資源索引的系統(tǒng),包括:\n[0080] 資源訪問記錄獲得單元,用于獲得用戶訪問網(wǎng)絡(luò)資源的資源訪問記錄;\n[0081] 網(wǎng)絡(luò)資源拆分單元,用于將所述用戶的資源訪問記錄中的網(wǎng)絡(luò)資源拆分為網(wǎng)絡(luò)資源訪問對,每一網(wǎng)絡(luò)資源訪問對包含所述資源訪問記錄中的兩個網(wǎng)絡(luò)資源信息;所述資源訪問記錄中記錄了用戶訪問過的網(wǎng)絡(luò)資源集合,所述拆分的方式為:將所述網(wǎng)絡(luò)資源集合中的網(wǎng)絡(luò)資源兩兩組成網(wǎng)絡(luò)資源訪問對;\n[0082] 網(wǎng)絡(luò)資源對匯集單元,用于對各用戶拆分后產(chǎn)生的網(wǎng)絡(luò)資源訪問對進行聚類以匯集各用戶的網(wǎng)絡(luò)資源對,獲得網(wǎng)絡(luò)資源二維關(guān)系,建立起網(wǎng)絡(luò)資源索引,所述網(wǎng)絡(luò)資源二維關(guān)系表示網(wǎng)絡(luò)資源兩兩之間的關(guān)系,所述二維中的一維是網(wǎng)頁,另一維也是網(wǎng)頁。\n[0083] 優(yōu)選的,還包括:\n[0084] 網(wǎng)絡(luò)資源相關(guān)度獲得單元,用于獲得各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源的相關(guān)度,以便根據(jù)所述相關(guān)度對所述網(wǎng)絡(luò)資源進行排序。\n[0085] 優(yōu)選的,所述網(wǎng)絡(luò)資源相關(guān)度獲得單元包括:\n[0086] 第一網(wǎng)絡(luò)資源相關(guān)度獲得子單元,用于將相同的網(wǎng)絡(luò)資源對進行合并;根據(jù)網(wǎng)絡(luò)資源對的合并次數(shù),獲得各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源的相關(guān)度;\n[0087] 和/或,\n[0088] 第二網(wǎng)絡(luò)資源相關(guān)度獲得子單元,用于根據(jù)網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源之間的間隔時間,獲得各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源的相關(guān)度;\n[0089] 和/或,\n[0090] 第三網(wǎng)絡(luò)資源相關(guān)度獲得子單元,用于通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,利用各網(wǎng)絡(luò)資源的特征向量獲得各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源的相關(guān)度;\n所述網(wǎng)絡(luò)資源特征向量用于描述網(wǎng)絡(luò)資源屬于各類別的置信度。\n[0091] 優(yōu)選的,還包括:\n[0092] 第一網(wǎng)絡(luò)資源相關(guān)度修正單元,用于將相同的網(wǎng)絡(luò)資源對進行合并;根據(jù)網(wǎng)絡(luò)資源對的合并次數(shù),對所述相關(guān)度進行修正;\n[0093] 和/或,\n[0094] 第二網(wǎng)絡(luò)資源相關(guān)度修正單元,用于根據(jù)網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源之間的間隔時間,對所述相關(guān)度進行修正;\n[0095] 和/或,\n[0096] 第三網(wǎng)絡(luò)資源相關(guān)度修正單元,用于通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,利用各網(wǎng)絡(luò)資源的特征向量對所述相關(guān)度進行修正;所述網(wǎng)絡(luò)資源特征向量用于描述網(wǎng)絡(luò)資源屬于各類別的置信度;\n[0097] 和/或,\n[0098] 第四網(wǎng)絡(luò)資源相關(guān)度修正單元,通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,所述網(wǎng)絡(luò)資源特征向量用于描述網(wǎng)絡(luò)資源屬于各類別的置信度;根據(jù)用戶的訪問歷史獲知用戶最可能訪問的網(wǎng)絡(luò)資源;將所述用戶最可能訪問的網(wǎng)絡(luò)資源的特征向量合并,得到各用戶的興趣向量;利用各用戶的興趣向量對所述相關(guān)度進行修正;所述興趣向量用于描述用戶對各類別的感興趣程度。\n[0099] 一種網(wǎng)絡(luò)信息推薦的方法,包括:\n[0100] 獲得訪問同一網(wǎng)絡(luò)資源的用戶記錄;\n[0101] 將所述用戶記錄中的各用戶信息拆分為用戶對,每一用戶對包含所述用戶記錄中的兩個用戶信息;所述拆分的方式為:將所述各用戶信息兩兩組成用戶對;\n[0102] 對所述用戶對進行聚類以匯集各個網(wǎng)絡(luò)資源的用戶對,建立用戶二維關(guān)系,所述用戶二維關(guān)系表示用戶兩兩之間的關(guān)系,所述二維中的一維是用戶,另一維也是用戶;\n[0103] 當(dāng)需要為用戶進行推薦時,根據(jù)所述用戶二維關(guān)系所體現(xiàn)的用戶相關(guān)性推薦相關(guān)的用戶信息。\n[0104] 優(yōu)選的,所述根據(jù)所述用戶二維關(guān)系推薦相關(guān)的用戶信息包括:\n[0105] 根據(jù)所述用戶二維關(guān)系推薦與當(dāng)前訪問的用戶相關(guān)的用戶信息。\n[0106] 優(yōu)選的,所述根據(jù)所述用戶二維關(guān)系推薦相關(guān)的用戶信息包括:根據(jù)所述用戶二維關(guān)系獲得相關(guān)的用戶集合,根據(jù)所述集合向用戶推薦相關(guān)的用戶信息;\n[0107] 所述方法還包括:獲得各用戶對中兩用戶的相關(guān)度,在所述根據(jù)所述用戶二維關(guān)系獲得相關(guān)的用戶集合之后還包括:根據(jù)各用戶對中兩用戶的相關(guān)度,對所述集合中的用戶進行排序。\n[0108] 優(yōu)選的,所述用戶二維關(guān)系為核心索引,還包括:\n[0109] 根據(jù)輔助索引對所述集合中的用戶進行排序。\n[0110] 一種網(wǎng)絡(luò)信息推薦的系統(tǒng),包括:\n[0111] 用戶記錄獲得單元,用于獲得訪問同一網(wǎng)絡(luò)資源的用戶記錄;\n[0112] 用戶拆分單元,用于將所述用戶記錄中的各用戶信息拆分為用戶對,每一用戶對包含所述用戶記錄中的兩個用戶信息;所述拆分的方式為:將所述各用戶信息兩兩組成用戶對;\n[0113] 用戶對匯集單元,用于對所述用戶對進行聚類以匯集各個網(wǎng)絡(luò)資源的用戶對,獲得用戶二維關(guān)系,所述用戶二維關(guān)系表示用戶兩兩之間的關(guān)系,所述二維中的一維是用戶,另一維也是用戶;\n[0114] 用戶信息推薦單元,用于當(dāng)需要為用戶進行推薦時,根據(jù)所述用戶二維關(guān)系所體現(xiàn)的用戶相關(guān)性推薦相關(guān)的用戶信息。\n[0115] 優(yōu)選的,所述用戶信息推薦單元包括:\n[0116] 第一用戶信息推薦子單元,用于根據(jù)所述用戶二維關(guān)系推薦與當(dāng)前訪問的用戶相關(guān)的用戶信息。\n[0117] 優(yōu)選的,所述用戶信息推薦單元包括:用戶信息集合生成子單元,用于根據(jù)所述用戶二維關(guān)系獲得相關(guān)的用戶集合;第二用戶信息推薦子單元,用于根據(jù)所述集合向用戶推薦相關(guān)的用戶信息;\n[0118] 或者,\n[0119] 所述系統(tǒng)還包括:用戶相關(guān)度獲得單元,用于獲得各用戶對中兩用戶的相關(guān)度;\n所述用戶信息推薦單元還包括:第一用戶排序子單元,用于根據(jù)各用戶對中兩用戶的相關(guān)度,對所述集合中的用戶進行排序。\n[0120] 優(yōu)選的,所述用戶二維關(guān)系為核心索引,所述用戶信息推薦單元還包括:\n[0121] 第二用戶排序子單元,用于根據(jù)輔助索引對所述集合中的用戶進行排序。\n[0122] 一種建立用戶索引的方法,包括:\n[0123] 獲得訪問同一網(wǎng)絡(luò)資源的用戶記錄;\n[0124] 將所述用戶記錄中的各用戶拆分為用戶對,每一用戶對包含所述用戶記錄中的兩個用戶;所述拆分的方式為:將所述各用戶兩兩組成用戶對;\n[0125] 對所述用戶對進行聚類以匯集各個網(wǎng)絡(luò)資源的用戶對,獲得用戶二維關(guān)系,建立起用戶索引,所述用戶二維關(guān)系表示用戶兩兩之間的關(guān)系,所述二維中的一維是用戶,另一維也是用戶。\n[0126] 優(yōu)選的,還包括:\n[0127] 獲得各用戶對中兩用戶的相關(guān)度。\n[0128] 優(yōu)選的,通過以下方式獲得各用戶對中兩用戶的相關(guān)度:\n[0129] 將相同的用戶對進行合并;根據(jù)用戶對的合并次數(shù),為各個用戶對進行評分,得到各用戶對的相關(guān)度;\n[0130] 和/或,\n[0131] 通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,根據(jù)用戶的訪問歷史獲知用戶最可能訪問的網(wǎng)絡(luò)資源;將所述用戶最可能訪問的網(wǎng)絡(luò)資源的特征向量合并,得到各用戶的興趣向量;根據(jù)所述用戶的興趣向量獲得各用戶對中兩用戶的相關(guān)度;所述網(wǎng)絡(luò)資源特征向量用于描述網(wǎng)絡(luò)資源屬于各類別的置信度;所述興趣向量用于描述用戶對各類別的感興趣程度。\n[0132] 一種建立用戶索引的系統(tǒng),包括:\n[0133] 用戶記錄獲得單元,用于獲得訪問同一網(wǎng)絡(luò)資源的用戶記錄;\n[0134] 用戶拆分單元,用于將所述用戶記錄中的各用戶信息拆分為用戶對,每一用戶對包含所述用戶記錄中的兩個用戶信息;所述拆分的方式為:將所述各用戶信息兩兩組成用戶對;\n[0135] 用戶對匯集單元,用于對所述用戶對進行聚類以匯集各個網(wǎng)絡(luò)資源的用戶對,獲得用戶二維關(guān)系,建立起用戶索引,所述用戶二維關(guān)系表示用戶兩兩之間的關(guān)系,所述二維中的一維是用戶,另一維也是用戶。\n[0136] 優(yōu)選的,還包括:\n[0137] 用戶相關(guān)度獲得單元,用于獲得各用戶對中兩用戶的相關(guān)度,以便根據(jù)所述相關(guān)度對用戶進行排序。\n[0138] 優(yōu)選的,所述用戶相關(guān)度獲得單元包括:\n[0139] 第一用戶相關(guān)度獲得子單元,用于將相同的用戶對進行合并;根據(jù)用戶對的合并次數(shù),為各個用戶對進行評分,得到各用戶對的相關(guān)度;\n[0140] 和/或,\n[0141] 第二用戶相關(guān)度獲得子單元,用于通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,根據(jù)用戶的訪問歷史獲知用戶最可能訪問的網(wǎng)絡(luò)資源;將所述用戶最可能訪問的網(wǎng)絡(luò)資源的特征向量合并,得到各用戶的興趣向量;根據(jù)所述用戶的興趣向量獲得各用戶對中兩用戶的相關(guān)度;所述網(wǎng)絡(luò)資源特征向量用于描述網(wǎng)絡(luò)資源屬于各類別的置信度;所述興趣向量用于描述用戶對各類別的感興趣程度。\n[0142] 根據(jù)本發(fā)明提供的具體實施例,本發(fā)明公開了以下技術(shù)效果:\n[0143] 本發(fā)明將用戶的訪問序列拆分為網(wǎng)絡(luò)資源對;獲得用戶訪問網(wǎng)絡(luò)資源的資源訪問記錄;將所述用戶的資源訪問記錄中的網(wǎng)絡(luò)資源拆分為網(wǎng)絡(luò)資源訪問對,每一網(wǎng)絡(luò)資源訪問對包含所述資源訪問記錄中的兩個網(wǎng)絡(luò)資源信息;匯集各用戶的網(wǎng)絡(luò)資源對,獲得網(wǎng)絡(luò)資源二維關(guān)系;當(dāng)需要為用戶進行推薦時,根據(jù)所述網(wǎng)絡(luò)資源二維關(guān)系為用戶推薦相關(guān)的網(wǎng)絡(luò)資源。由于可以基于所有用戶的訪問序列建立網(wǎng)絡(luò)資源二維關(guān)系,而眾多用戶的訪問行為通??梢员榧叭W(wǎng),因此,不會局限在特定數(shù)據(jù)集中,而是可以在全網(wǎng)范圍內(nèi)建立二維的網(wǎng)絡(luò)資源索引,因此,可以便于在全網(wǎng)范圍內(nèi)進行相關(guān)檢索。如果推薦系統(tǒng)中應(yīng)用本發(fā)明實施例所建立的二維索引結(jié)構(gòu),則進行信息推薦時,可以在全網(wǎng)范圍內(nèi)向用戶進行推薦,因此,能夠擴大用戶獲得信息的范圍,提高信息的利用率,降低了用戶獲得有用信息的難度。\n[0144] 另外,還可以通過生成網(wǎng)絡(luò)資源的特征向量及用戶的興趣向量,來建立輔助索引,以便于優(yōu)化檢索結(jié)果,還可以對二維網(wǎng)絡(luò)資源索引進行修正。\n附圖說明\n[0145] 圖1是本發(fā)明實施例提供的建立網(wǎng)絡(luò)信息索引方法的流程圖;\n[0146] 圖2是本發(fā)明實施例提供的網(wǎng)絡(luò)信息推薦方法的流程圖;\n[0147] 圖3是本發(fā)明實施例提供的建立用戶索引方法的流程圖;\n[0148] 圖4是本發(fā)明實施例提供的另一網(wǎng)絡(luò)信息推薦方法的流程圖;\n[0149] 圖5是本發(fā)明實施例提供的網(wǎng)絡(luò)信息推薦系統(tǒng)的示意圖;\n[0150] 圖6是本發(fā)明實施例提供的另一網(wǎng)絡(luò)信息推薦系統(tǒng)的示意圖;\n[0151] 圖7是本發(fā)明實施例提供的建立網(wǎng)絡(luò)信息索引系統(tǒng)的示意圖;\n[0152] 圖8是本發(fā)明實施例提供的建立用戶索引系統(tǒng)的示意圖。\n具體實施方式\n[0153] 為使本發(fā)明的上述目的、特征和優(yōu)點能夠更加明顯易懂,下面結(jié)合附圖和具體實施方式對本發(fā)明作進一步詳細的說明。\n[0154] 實施例一、為了擴大用戶獲得信息的范圍,提高信息的利用率,在該實施例中,首先提供了一種建立網(wǎng)絡(luò)資源索引的方法,參見圖1,本發(fā)明實施例提供的建立網(wǎng)絡(luò)資源索引的方法包括以下步驟:\n[0155] S101:獲得用戶訪問網(wǎng)絡(luò)資源的資源訪問記錄;\n[0156] 其中,本發(fā)明實施例中提到的網(wǎng)絡(luò)資源可以一個網(wǎng)頁,也可以是網(wǎng)絡(luò)中的一個視頻、音頻或圖片等等,只要是互聯(lián)網(wǎng)上能夠展現(xiàn)給用戶的信息,都屬于本發(fā)明限定的網(wǎng)絡(luò)資源范疇。所述網(wǎng)頁就是通常在網(wǎng)頁瀏覽器(IE等)中打開的網(wǎng)頁,其內(nèi)容可能包括視頻、音頻、圖片、文字、flash等多種元素;同時,所述網(wǎng)絡(luò)資源也可以是不依附于網(wǎng)頁而獨立存在的視頻、音頻、圖片、文字、flash等。\n[0157] 首先需要說明的是,本發(fā)明實施例可以由瀏覽器的服務(wù)器來完成建立網(wǎng)絡(luò)資源索引的過程。由于,用戶通常是通過瀏覽器訪問網(wǎng)絡(luò)資源,因此,瀏覽器能夠記錄大多數(shù)用戶的訪問日志,包括用戶通過瀏覽器瀏覽所有網(wǎng)絡(luò)資源的URL、訪問時間、停留時間等等。\n[0158] S102:將所述用戶的資源訪問記錄中的網(wǎng)絡(luò)資源拆分為網(wǎng)絡(luò)資源訪問對,每一網(wǎng)絡(luò)資源訪問對包含所述資源訪問記錄中的兩個網(wǎng)絡(luò)資源信息;\n[0159] 所述資源訪問記錄中記錄了用戶訪問過的網(wǎng)絡(luò)資源集合,將該集合中的網(wǎng)絡(luò)資源兩兩組成網(wǎng)絡(luò)資源對即可。\n[0160] 由于用戶在訪問網(wǎng)絡(luò)資源時,會有一定的時序關(guān)系,瀏覽器能夠記錄這種時序關(guān)系(根據(jù)訪問時間),因此可以產(chǎn)生訪問序列,該訪問序列中的各網(wǎng)絡(luò)資源不一定具有鏈接關(guān)系,但都體現(xiàn)著用戶的興趣,彼此之間通過用戶的興趣產(chǎn)生聯(lián)系,因此,在本發(fā)明實施例中,所述資源訪問記錄可以是資源訪問序列,拆分網(wǎng)絡(luò)資源對時,可以依據(jù)資源訪問序列進行拆分。例如,用戶A依次訪問了網(wǎng)絡(luò)資源1、網(wǎng)絡(luò)資源2、網(wǎng)絡(luò)資源3、網(wǎng)絡(luò)資源4,則可以將該用戶的訪問序列拆分為<網(wǎng)絡(luò)資源1,網(wǎng)絡(luò)資源2>、<網(wǎng)絡(luò)資源2,網(wǎng)絡(luò)資源3>、<網(wǎng)絡(luò)資源1,網(wǎng)絡(luò)資源3>、<網(wǎng)絡(luò)資源2,網(wǎng)絡(luò)資源4>等等。當(dāng)然,在根據(jù)資源訪問序列進行拆分時,不一定是序列中的每兩個網(wǎng)絡(luò)資源都拆分成網(wǎng)絡(luò)資源對,例如,如果兩個網(wǎng)絡(luò)資源之間的時間間隔很長,則可以認為其不具有明顯的相關(guān)性,因此可以把這種網(wǎng)絡(luò)資源對過濾掉。\n[0161] 需要說明的是,資源訪問記錄中的各網(wǎng)絡(luò)資源不一定具有鏈接關(guān)系是指,用戶不一定是在訪問網(wǎng)絡(luò)資源1(比如是網(wǎng)頁A)時,通過在網(wǎng)頁A中點擊某鏈接的方式來訪問網(wǎng)絡(luò)資源2,而是可以各種訪問方式都可以。例如,用戶可以首先訪問網(wǎng)絡(luò)資源1,然后在地址欄中輸入網(wǎng)絡(luò)資源2的URL,來訪問網(wǎng)絡(luò)資源2;或者,首先訪問網(wǎng)絡(luò)資源1,然后新建標(biāo)簽頁來訪問網(wǎng)絡(luò)資源2等等。也就是說,在本發(fā)明實施例中,用戶所有的訪問行為都會被記錄下來,用于建立索引結(jié)構(gòu)。\n[0162] 當(dāng)然,也可以根據(jù)實際情況需要,將用于建立網(wǎng)絡(luò)資源索引的訪問序列限定為內(nèi)部各網(wǎng)絡(luò)資源具有鏈接關(guān)系的訪問序列。換而言之,就是只收集那些內(nèi)部各網(wǎng)絡(luò)資源之間具有鏈接關(guān)系的訪問序列,利用這些訪問序列建立網(wǎng)絡(luò)資源索引。\n[0163] S103:匯集各用戶的網(wǎng)絡(luò)資源對,獲得網(wǎng)絡(luò)資源二維關(guān)系,建立起網(wǎng)絡(luò)資源索引。\n[0164] 可以按照用戶的ID將各用戶拆分后產(chǎn)生的網(wǎng)絡(luò)資源對進行聚類,聚類的目的就是將所有用戶的網(wǎng)絡(luò)資源對匯集在一起,可選的,還將相同的網(wǎng)絡(luò)資源對進行合并。例如,用戶A和用戶B的訪問序列拆分后都包括<網(wǎng)絡(luò)資源1,網(wǎng)絡(luò)資源2>,則可以合并,這樣,不會出現(xiàn)重復(fù)的網(wǎng)絡(luò)資源對。\n[0165] 其中,所述網(wǎng)絡(luò)資源二維關(guān)系就是指網(wǎng)絡(luò)資源兩兩之間的關(guān)系,所述二維中的一維是網(wǎng)頁,另一維也是網(wǎng)頁,因此,相當(dāng)于建立了網(wǎng)絡(luò)資源相關(guān)矩陣,通過該矩陣來記錄網(wǎng)絡(luò)資源的相關(guān)性。同時,通過該網(wǎng)絡(luò)資源二維關(guān)系就可以建立起網(wǎng)絡(luò)資源索引。\n[0166] 按照實施例一的方法建立網(wǎng)絡(luò)資源二維關(guān)系時,兩個網(wǎng)絡(luò)資源之間的相關(guān)性是非有即無的關(guān)系,因此,在矩陣中,可以用“1”表示兩個網(wǎng)絡(luò)資源之間具有相關(guān)性,用“0”表示兩個網(wǎng)絡(luò)資源之間不相關(guān)。如果在推薦系統(tǒng)中使用該網(wǎng)絡(luò)資源二維關(guān)系,則推薦的各網(wǎng)絡(luò)資源之間將是無差別的。\n[0167] 但實際上不同的網(wǎng)絡(luò)資源之間的相關(guān)性有強弱之分,因此,還可以對網(wǎng)絡(luò)資源二維關(guān)系中的各網(wǎng)絡(luò)資源對進行評分,獲得網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源之間的相關(guān)度,這樣,在推薦系統(tǒng)中應(yīng)用該二維關(guān)系時,就可以根據(jù)網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源之間的相關(guān)度進行排序,將分數(shù)高的進行優(yōu)先推薦。\n[0168] 具體在獲得網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源之間的相關(guān)度時,可以有多種方法,下面分別進行介紹:\n[0169] 方法1:以網(wǎng)絡(luò)資源對的合并次數(shù)為依據(jù)獲得網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源之間的相關(guān)度。即可以將相同的網(wǎng)絡(luò)資源對進行合并,然后根據(jù)網(wǎng)絡(luò)資源對的合并次數(shù),為各個網(wǎng)絡(luò)資源對進行評分,得到各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源的相關(guān)度。具體而言,可以網(wǎng)絡(luò)資源對進行匯集的過程中,將相同的網(wǎng)絡(luò)資源對進行合并,記錄合并網(wǎng)絡(luò)資源對的次數(shù),發(fā)生合并的次數(shù)越多,則證明該網(wǎng)絡(luò)資源對之間的相關(guān)性就越大。\n[0170] 例如,在網(wǎng)絡(luò)資源二維關(guān)系中,網(wǎng)絡(luò)資源1分別與網(wǎng)絡(luò)資源2和網(wǎng)絡(luò)資源3相關(guān),有100個用戶的訪問序列中拆分出了<網(wǎng)絡(luò)資源1,網(wǎng)絡(luò)資源2>,有10個用戶的訪問序列中拆分出了<網(wǎng)絡(luò)資源1,網(wǎng)絡(luò)資源3>,則<網(wǎng)絡(luò)資源1,網(wǎng)絡(luò)資源2>的分數(shù)將比<網(wǎng)絡(luò)資源1,網(wǎng)絡(luò)資源3>的分數(shù)高,當(dāng)某用戶正在訪問網(wǎng)絡(luò)資源1時,如果需要向用戶推薦其他的網(wǎng)絡(luò)資源,則可以優(yōu)先推薦網(wǎng)絡(luò)資源2,或者將網(wǎng)絡(luò)資源2排在網(wǎng)絡(luò)資源3之前推薦給用戶。\n[0171] 方法2:可以根據(jù)網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源之間的間隔時間,為各個網(wǎng)絡(luò)資源對進行評分,得到各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源的相關(guān)度。由于訪問日志中能夠記錄訪問時間信息,因此,同一用戶的訪問記錄中的各網(wǎng)絡(luò)資源兩兩之間的間隔時間是可以獲知的,由此也可以獲知網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源之間的間隔時間。如果多個用戶的資源訪問記錄中都拆分出了同樣的網(wǎng)絡(luò)資源對,則可以取時間間隔的平均值,然后據(jù)此確定各網(wǎng)絡(luò)資源對的相關(guān)度。\n[0172] 方法3:通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,利用各網(wǎng)絡(luò)資源的特征向量獲得各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源的相關(guān)度;所述網(wǎng)絡(luò)資源特征向量用于描述網(wǎng)絡(luò)資源屬于各類別的置信度。該方法主要從網(wǎng)頁的內(nèi)容角度,建立網(wǎng)絡(luò)資源之間的相關(guān)度。關(guān)于網(wǎng)絡(luò)資源特征向量,后文中會有更加詳細的描述。\n[0173] 當(dāng)然,也可以將上述各種方法相結(jié)合,考慮多方面因素來獲得網(wǎng)絡(luò)資源之間的相關(guān)度,這樣便于提高相關(guān)度的有效性及準(zhǔn)確性。\n[0174] 此外,在獲得到網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源之間的相關(guān)度之后,還可以對該相關(guān)度進行修正。具體進行修正時,可以采用以下方法:\n[0175] 方法4:將相同的網(wǎng)絡(luò)資源對進行合并;根據(jù)網(wǎng)絡(luò)資源對的合并次數(shù),對所述相關(guān)度進行修正;\n[0176] 方法5:根據(jù)網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源之間的間隔時間,對所述相關(guān)度進行修正;\n[0177] 方法6:通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,利用各網(wǎng)絡(luò)資源的特征向量對所述相關(guān)度進行修正;所述網(wǎng)絡(luò)資源特征向量用于描述網(wǎng)絡(luò)資源屬于各類別的置信度;\n[0178] 方法7:通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,所述網(wǎng)絡(luò)資源特征向量用于描述網(wǎng)絡(luò)資源屬于各類別的置信度;根據(jù)用戶的訪問歷史獲知用戶最可能訪問的網(wǎng)絡(luò)資源;將所述用戶最可能訪問的網(wǎng)絡(luò)資源的特征向量合并,得到各用戶的興趣向量;利用各用戶的興趣向量對所述相關(guān)度進行修正;所述興趣向量用于描述用戶對各類別的感興趣程度。\n[0179] 上述獲得相關(guān)度的方法可以與修正方法配合使用,保證獲得相關(guān)度與修正相關(guān)度使用的參數(shù)不同即可,例如,如果使用方法1獲得相關(guān)度,則可以利用方法5和/或方法6對相關(guān)度進行修正;如果使用方法2獲得相關(guān)度,則可以利用方法4和/或方法6對相關(guān)度進行修正;如果使用方法1和方法2獲得相關(guān)度,則可以使用方法6對相關(guān)度進行修正,等等。關(guān)于使用網(wǎng)絡(luò)資源特征向量進行修正的具體方法,后文會有詳細地介紹。\n[0180] 此外,在對相關(guān)度進行修正時,還可以考慮用戶的因素。具體的,可以根據(jù)用戶的訪問歷史獲知用戶最可能訪問的網(wǎng)絡(luò)資源;將所述用戶最可能訪問的網(wǎng)絡(luò)資源的特征向量合并,得到各用戶的興趣向量;利用各用戶的興趣向量對所述相關(guān)度進行修正;所述興趣向量用于描述用戶對各類別的感興趣程度。使用上述任意種方法獲得相關(guān)度時,都可以使用用戶的興趣向量對相關(guān)度進行修正。關(guān)于用戶的興趣向量及其修正方法,后文中會有更加詳細的描述。\n[0181] 實施例二、當(dāng)需要檢索與某網(wǎng)絡(luò)資源相關(guān)的網(wǎng)絡(luò)資源時,利用實施例一建立的網(wǎng)絡(luò)資源二維關(guān)系中進行查找即可。例如,在推薦系統(tǒng)中,本發(fā)明實施例二還提供了一種網(wǎng)絡(luò)信息推薦的方法,參見圖2,該方法包括:\n[0182] S201:獲得用戶訪問網(wǎng)絡(luò)資源的資源訪問記錄;\n[0183] S202:將所述用戶的資源訪問記錄中的網(wǎng)絡(luò)資源拆分為網(wǎng)絡(luò)資源訪問對,每一網(wǎng)絡(luò)資源訪問對包含所述資源訪問記錄中的兩個網(wǎng)絡(luò)資源信息;\n[0184] S203:匯集各用戶的網(wǎng)絡(luò)資源對,獲得網(wǎng)絡(luò)資源二維關(guān)系;\n[0185] S204:當(dāng)需要為用戶進行推薦時,根據(jù)所述網(wǎng)絡(luò)資源二維關(guān)系為用戶推薦相關(guān)的網(wǎng)絡(luò)資源。\n[0186] 例如,假設(shè)當(dāng)前用戶正在訪問網(wǎng)絡(luò)資源1,此時,就可以在網(wǎng)絡(luò)資源二維關(guān)系中查找,假設(shè)發(fā)現(xiàn)網(wǎng)絡(luò)資源1分別與網(wǎng)絡(luò)資源2和網(wǎng)絡(luò)資源3相關(guān),則可以將網(wǎng)絡(luò)資源2和網(wǎng)絡(luò)資源3推薦給該用戶。\n[0187] 其中,所述相關(guān)的網(wǎng)絡(luò)資源可以是:與用戶當(dāng)前訪問的網(wǎng)絡(luò)資源相關(guān)的網(wǎng)絡(luò)資源。\n具體在根據(jù)所述網(wǎng)絡(luò)資源二維關(guān)系推薦與當(dāng)前訪問的網(wǎng)絡(luò)資源相關(guān)的網(wǎng)絡(luò)資源時,可以首先根據(jù)所述網(wǎng)絡(luò)資源二維關(guān)系獲得與當(dāng)前訪問的網(wǎng)絡(luò)資源相關(guān)的網(wǎng)絡(luò)資源集合,根據(jù)所述集合向用戶推薦相關(guān)的網(wǎng)絡(luò)資源。\n[0188] 如果建立的網(wǎng)絡(luò)資源二維關(guān)系中,包括各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源的相關(guān)度信息,則在在所述根據(jù)所述網(wǎng)絡(luò)資源二維關(guān)系獲得相關(guān)的網(wǎng)絡(luò)資源集合之后,還可以根據(jù)各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源的相關(guān)度,對所述集合中的網(wǎng)絡(luò)資源進行排序。具體獲取所述相關(guān)度的方法可以參見實施例一中的具體描述。\n[0189] 可見,在本發(fā)明實施例中,假設(shè)了訪問序列中網(wǎng)絡(luò)資源之間的傳遞性,如果兩個網(wǎng)絡(luò)資源出現(xiàn)在同一用戶的訪問序列中,則意味著這兩個網(wǎng)絡(luò)資源具有某種程度上的相關(guān)性,由此,建立起網(wǎng)絡(luò)資源二維關(guān)系,用于對網(wǎng)絡(luò)資源進行檢索。由于可以基于所有用戶的訪問序列建立網(wǎng)絡(luò)資源二維關(guān)系,而眾多用戶的訪問行為通常可以遍及全網(wǎng),因此,不會局限在特定數(shù)據(jù)集中,而是可以在全網(wǎng)范圍內(nèi)建立二維的網(wǎng)絡(luò)資源索引,因此,可以便于在全網(wǎng)范圍內(nèi)進行相關(guān)檢索,有利于擴大用戶獲得信息的范圍,提高信息的利用率。\n[0190] 需要說明的是,由于隨著用戶訪問行為的發(fā)生,用戶的訪問歷史是實時更新的,因此,上述建立網(wǎng)絡(luò)資源索引的過程可以實時進行的,當(dāng)然也可以是定期更新。\n[0191] 另外需要說明的是,用戶可能會由于誤操作等原因訪問了廣告導(dǎo)航頁,但是在用戶的訪問日志中,仍然會記載該廣告導(dǎo)航頁,而本發(fā)明實施例是根據(jù)用戶的訪問日志獲得網(wǎng)絡(luò)資源對的,因此,該廣告導(dǎo)航頁頁會出現(xiàn)在網(wǎng)絡(luò)資源對中,進行推薦時,可能會將該廣告導(dǎo)航頁推薦給用戶,但是實際上這種網(wǎng)絡(luò)資源通常是不應(yīng)該向用戶推薦的。因此,為了避免這種情況的出現(xiàn),在本發(fā)明實施例中,還可以對網(wǎng)絡(luò)資源對進行過濾,過濾掉無效的網(wǎng)絡(luò)資源對,這些無效的網(wǎng)絡(luò)資源對包括包含有廣告導(dǎo)航頁的網(wǎng)絡(luò)資源對。\n[0192] 此外,所述無效的網(wǎng)絡(luò)資源對還可以包括內(nèi)容不相關(guān)的網(wǎng)絡(luò)資源對,以及訪問時間間隔超過預(yù)置閾值的網(wǎng)絡(luò)資源對,等等。\n[0193] 其中,為了便于進行網(wǎng)絡(luò)資源對的過濾,可以根據(jù)在拆分訪問序列獲得網(wǎng)絡(luò)資源對時,將網(wǎng)絡(luò)資源的一些信息作為網(wǎng)絡(luò)資源對的屬性進行保存。這些信息包括訪問時間、停留時間等等。這樣,由于如果用戶不小心打開了廣告導(dǎo)航頁,則通常在該網(wǎng)頁上的停留時間會非常短,因此,根據(jù)停留時間可以判斷是否為廣告導(dǎo)航頁,當(dāng)然還可以根據(jù)經(jīng)驗建立廣告導(dǎo)航頁的黑名單,根據(jù)黑名單對廣告導(dǎo)航頁進行過濾。同時,還可以根據(jù)各網(wǎng)絡(luò)資源的訪問時間,來計算網(wǎng)絡(luò)資源之間的訪問時間間隔。\n[0194] 由于矩陣通過使用二維數(shù)組表示,二維數(shù)組的大小與使用的存儲器空間成正比,如果多數(shù)的元素沒有數(shù)據(jù),則會造成存儲器空間的浪費,為此,可以設(shè)計稀疏矩陣的陣列儲存方式,利用較少的存儲器空間儲存完整的矩陣數(shù)據(jù)。即,假設(shè)二維數(shù)組Amn中有N個非零元素,若N<
,則某網(wǎng)絡(luò)資源的特征向量可以為<0.85,0.1,0.05......>,這就代表該網(wǎng)絡(luò)資源屬于新聞類的置信度為0.85,屬于體育類的置信度為0.1,屬于財經(jīng)類的置信度為0.05,等等。\n[0201] 實際應(yīng)用中,對網(wǎng)絡(luò)知識的分類可能會很細,例如,可能并不會籠統(tǒng)地分為體育類、新聞類等,而是分為NBA、足球、體彩等等,這就使得特征向量的維度非常大,如果對于每一個網(wǎng)絡(luò)資源,都分別計算屬于各個類別的置信度,則工作量會非常大,對于系統(tǒng)的計算及存儲性能都有較高的要求。\n[0202] 因此,為了便于生成網(wǎng)絡(luò)資源的特征向量,在本發(fā)明實施例中,可以首先將網(wǎng)絡(luò)知識分成一定數(shù)目(例如40個)的大類,再將每個大類進行細分,稱為一定數(shù)目(例如400個)的小類,這樣,就相當(dāng)于將網(wǎng)絡(luò)知識分成了40個一級分類,400個二級分類,在生成網(wǎng)絡(luò)資源特征向量時,可以首先計算網(wǎng)絡(luò)資源屬于各一級分類的置信度,如果在某一級分類下的置信度較高,則分別計算屬于該一級分類下各二級分類的置信度;否則,如果在某一級分類下的置信度非常低甚至為0,則不再計算屬于該一級分類下各二級分類的置信度,這樣可以大大降低計算的工作量。\n[0203] 需要說明的是,本領(lǐng)域技術(shù)人員可以采用現(xiàn)有貝葉斯的方法計算網(wǎng)絡(luò)資源在某類別下的置信度,這里不再贅述。\n[0204] 生成網(wǎng)絡(luò)資源的特征向量之后,可以有助于進行優(yōu)化檢索結(jié)果。例如,當(dāng)推薦網(wǎng)頁時,可以首先使用所述二維索引結(jié)構(gòu)檢索出與當(dāng)前網(wǎng)頁相關(guān)的所有網(wǎng)頁,然后再利用網(wǎng)頁的特征向量對網(wǎng)頁進行排序,這樣就可以相關(guān)度更高的網(wǎng)頁排在更加靠前的位置推薦給用戶。具體的,可以首先從數(shù)據(jù)庫中取出用戶當(dāng)前瀏覽的網(wǎng)頁的特征向量,以及與該網(wǎng)頁相關(guān)的各網(wǎng)頁的特征向量,然后用所述與該網(wǎng)頁相關(guān)的各網(wǎng)頁的特征向量分別于當(dāng)前瀏覽的網(wǎng)頁的特征向量做內(nèi)積,所得的值越大,則證明網(wǎng)頁的相關(guān)度越高。\n[0205] 當(dāng)然,在獲得到網(wǎng)絡(luò)資源相關(guān)度的情況下,也可以首先使用所述二維索引結(jié)構(gòu)檢索出與當(dāng)前網(wǎng)頁相關(guān)的所有網(wǎng)頁,利用網(wǎng)頁對中兩網(wǎng)頁的相關(guān)度進行排序,然后再利用網(wǎng)頁的特征向量對網(wǎng)頁進行重新排序。\n[0206] 此外,生成的網(wǎng)絡(luò)資源的特征向量也可以用于修正已經(jīng)建立的二維索引結(jié)構(gòu),即可以結(jié)合各網(wǎng)絡(luò)資源的特征向量及網(wǎng)絡(luò)資源對的合并次數(shù),為各個網(wǎng)絡(luò)資源對進行評分,得到各網(wǎng)絡(luò)資源對的相關(guān)度。因為網(wǎng)絡(luò)資源對之間的相關(guān)度不僅與同時被用戶訪問的次數(shù)有關(guān),還與網(wǎng)絡(luò)資源自身的特征有關(guān)。因此,可以在根據(jù)同時被用戶訪問的次數(shù)計算網(wǎng)絡(luò)資源對置信度時,用兩個網(wǎng)絡(luò)資源的特征向量做內(nèi)積,用所得結(jié)果作為置信度的權(quán)重,如果所得結(jié)果非常低或者為0,則可以將該網(wǎng)絡(luò)資源對視為無效而過濾掉。\n[0207] 下面對特征向量的內(nèi)積進行簡單的介紹。假設(shè)有特征向量和,則這兩個特征向量內(nèi)積為a1*b1+a2*b2+a3*b3,所得結(jié)果為一個標(biāo)量,該標(biāo)量值越大,則證明兩個特征向量的相關(guān)度越高;體現(xiàn)在實際應(yīng)用中,如果兩個網(wǎng)絡(luò)資源的特征向量做內(nèi)積的值很大,則如果用戶對其中一個網(wǎng)絡(luò)資源感興趣,則對另一個網(wǎng)絡(luò)資源也敢興趣的概率較高。\n[0208] (二)可以將用戶的因素考慮進來,統(tǒng)計用戶的行為特征,生成用戶的興趣向量,將用戶的興趣向量也作為一種輔助索引,以便于實現(xiàn)個性化檢索,從符合用戶個性化需求角度優(yōu)化檢索結(jié)果。\n[0209] 具體而言,可以在生成了所述網(wǎng)絡(luò)資源特征向量的基礎(chǔ)上,根據(jù)用戶的訪問歷史獲知用戶最可能訪問的網(wǎng)絡(luò)資源;將所述用戶最可能訪問的網(wǎng)絡(luò)資源的特征向量合并,得到各用戶的興趣向量;所述興趣向量用于描述用戶對各類別的感興趣程度;分別將各所述相關(guān)網(wǎng)絡(luò)資源的特征向量與該用戶的興趣向量進行內(nèi)積計算,并根據(jù)內(nèi)積計算的結(jié)果對各網(wǎng)絡(luò)資源進行排序。\n[0210] 在生成用戶的興趣向量時,可以利用(一)中計算得到的網(wǎng)絡(luò)資源的特征向量。具體的,可以統(tǒng)計用戶的訪問歷史,利用貝葉斯方法計算用戶最可能訪問的網(wǎng)絡(luò)資源,然后將這些網(wǎng)絡(luò)資源的特征向量合并,即可將合并后的結(jié)果作為該用戶的興趣向量。\n[0211] 例如,假設(shè)計算出用戶最可能訪問的網(wǎng)絡(luò)資源包括網(wǎng)絡(luò)資源1和網(wǎng)絡(luò)資源2,其中網(wǎng)絡(luò)資源1的特征向量為,網(wǎng)絡(luò)資源2的特征向量為,則將特征向量和合并,就可以得到該用戶的興趣向量。其中,具體在合并時,可以直接采用向量相加的方式,或者根據(jù)用戶的感興趣程度為各網(wǎng)絡(luò)資源賦予權(quán)重,然后根據(jù)權(quán)重將特征向量相加,得到用戶的興趣向量。\n[0212] 需要說明的是,由于用戶的興趣向量是由網(wǎng)絡(luò)資源的特征向量合并而成的,因此,用戶的興趣向量與網(wǎng)絡(luò)資源的特征向量具有相同的向量空間,因此,可以方便所述興趣向量與特征向量之間進行內(nèi)積運算。\n[0213] 生成用戶的興趣向量之后,可以有助于進行優(yōu)化檢索結(jié)果。例如,當(dāng)推薦網(wǎng)頁時,可以首先使用所述二維索引結(jié)構(gòu)檢索出與當(dāng)前網(wǎng)頁相關(guān)的所有網(wǎng)頁,此時,對所有用戶推薦的結(jié)果都是相同的。例如,用戶A和用戶B都在瀏覽網(wǎng)頁1,則向用戶A和用戶B推薦的都是與網(wǎng)頁1相關(guān)的網(wǎng)絡(luò)資源,展現(xiàn)給用戶的推薦結(jié)果是相同的。此時就可以使用用戶的興趣向量,針對不同的用戶對推薦結(jié)果進行重新排序,實現(xiàn)對不同用戶的個性化推薦。\n[0214] 具體的,當(dāng)向用戶進行網(wǎng)頁推薦時,還需要與網(wǎng)頁的特征向量相結(jié)合,可以包括以下步驟:\n[0215] 步驟1:從二維索引結(jié)構(gòu)中找出與當(dāng)前網(wǎng)頁相關(guān)的相關(guān)網(wǎng)頁集;\n[0216] 步驟2:獲得相關(guān)網(wǎng)頁集中各網(wǎng)頁的特征向量以及用戶的興趣向量;具體在獲得網(wǎng)頁的特征向量及用戶的興趣向量時,可以是從預(yù)先生成的數(shù)據(jù)庫中查詢得到,也可以在線計算得到;\n[0217] 步驟3:將相關(guān)網(wǎng)頁集中各網(wǎng)頁的特征向量分別與用戶的興趣向量進行內(nèi)積計算,所得結(jié)果越高,則證明網(wǎng)頁與用戶興趣的相關(guān)度越高;\n[0218] 步驟4:利用所得結(jié)果,對相關(guān)網(wǎng)頁集中的各網(wǎng)頁進行排序,生成展現(xiàn)結(jié)果。\n[0219] 當(dāng)然,在獲得到網(wǎng)絡(luò)資源相關(guān)度的情況下,也可以首先使用所述二維索引結(jié)構(gòu)檢索出與當(dāng)前網(wǎng)頁相關(guān)的所有網(wǎng)頁,利用網(wǎng)頁對中兩網(wǎng)頁的相關(guān)度進行排序,然后再利用用戶的興趣向量對網(wǎng)頁進行重新排序。\n[0220] 這樣,利用用戶的興趣向量及網(wǎng)絡(luò)資源的特征向量,就可以實現(xiàn)針對不同用戶的個性化推薦。例如,三個用戶都在瀏覽某條關(guān)于巴西足球的消息,分別為足球教練、球迷及商家,則這三個用戶對這條消息的關(guān)注點可能是不同的,因此向這三個用戶推薦的網(wǎng)絡(luò)資源也應(yīng)有所不同。這樣,利用用戶的興趣向量,推薦的結(jié)果就會具有個性化的特征。例如,向教練推薦時,某對該賽事進行分析的網(wǎng)頁鏈接會排在靠前的位置;向球迷推薦時,會更多地推薦其他賽事的鏈接;而對于商家,可能會將關(guān)于商機的網(wǎng)絡(luò)資源推薦給該用戶。\n[0221] 需要說明的是,由于二維索引結(jié)構(gòu)中的網(wǎng)絡(luò)資源對是從用戶的訪問序列中拆分出來的,以此作為網(wǎng)絡(luò)資源對中的兩個網(wǎng)絡(luò)資源具有一定的相關(guān)性的依據(jù),但是從不同用戶的訪問序列中拆分出來的網(wǎng)頁資源對,對網(wǎng)絡(luò)資源相關(guān)性的貢獻可能是不同的。因此,用戶的因素也可能會影響到二維索引結(jié)構(gòu)的建立。例如,用戶A的訪問序列中拆分出了<網(wǎng)絡(luò)資源1,網(wǎng)絡(luò)資源2>,并且用戶對該網(wǎng)絡(luò)資源1及網(wǎng)絡(luò)資源2都感興趣;而用戶B的訪問序列中也拆分出了<網(wǎng)絡(luò)資源1,網(wǎng)絡(luò)資源2>,但是其中的網(wǎng)絡(luò)資源1與用戶興趣的相關(guān)度非常低;此時,用戶A和用戶B的訪問序列中都拆分出了<網(wǎng)絡(luò)資源1,網(wǎng)絡(luò)資源2>,但是用戶A的置信度可能高于用戶2的置信度。\n[0222] 為此,與網(wǎng)絡(luò)資源的特征向量類似,用戶的興趣向量也可以用于修正二維索引結(jié)構(gòu),即,可以結(jié)合各用戶的興趣向量及網(wǎng)絡(luò)資源對的合并次數(shù),為各個網(wǎng)絡(luò)資源對進行評分,得到各網(wǎng)絡(luò)資源對的相關(guān)度。\n[0223] 具體在利用用戶的興趣向量對相關(guān)度進行修正時,可以首先將網(wǎng)絡(luò)資源對中的兩個網(wǎng)絡(luò)資源的特征向量相加,然后再將相加后得到的特征向量與用戶的興趣向量做內(nèi)積,再根據(jù)內(nèi)積所得的結(jié)果為各用戶賦予相應(yīng)的權(quán)重,根據(jù)用戶在該網(wǎng)絡(luò)資源對下的權(quán)重進行合并。這樣,相當(dāng)于使得各用戶對網(wǎng)絡(luò)資源相關(guān)性的貢獻是不同的。通俗地講,用戶A的訪問序列中如果拆分出了<網(wǎng)絡(luò)資源1,網(wǎng)絡(luò)資源2>,則相當(dāng)于用戶A為該網(wǎng)絡(luò)資源對投了票;在不利用用戶的興趣向量進行修正的情況下,則直接記錄為用戶A為該網(wǎng)絡(luò)資源對投票一次,其他用戶也是同樣,每拆分出一次,都相當(dāng)于投票一次。而如果利用用戶的興趣向量進行修正,則用戶拆分出一次該網(wǎng)絡(luò)資源對時,則不一定會被記為一票,可能是多于或少于一票。\n[0224] 也可以直接利用用戶的興趣向量來獲得網(wǎng)絡(luò)資源之間的相關(guān)度,具體的,同樣可以首先將網(wǎng)絡(luò)資源對中的兩個網(wǎng)絡(luò)資源的特征向量相加,再將相加后得到的特征向量與用戶的興趣向量做內(nèi)積,然后可以直接將該內(nèi)積的結(jié)果作為所述相關(guān)度。\n[0225] 此外,生成二維索引結(jié)構(gòu)時,還可以首先將用戶的興趣向量與訪問序列中各網(wǎng)絡(luò)資源的特征向量進行內(nèi)積,將所得結(jié)果非常低的網(wǎng)絡(luò)資源賦予較低的權(quán)重,計算網(wǎng)絡(luò)資源對的相關(guān)度時將該權(quán)重作為一個因素進行計算;另外,還可以直接將結(jié)果為0的網(wǎng)絡(luò)資源其從訪問序列中刪除。\n[0226] 上述各實施例介紹了如何建立網(wǎng)絡(luò)資源的索引結(jié)構(gòu),在實際應(yīng)用中,由于需要在全網(wǎng)范圍內(nèi)進行計算,因此存儲量及運算量都非常大。為了解決該問題,本發(fā)明實施例可以采用集群的方法來實現(xiàn)。\n[0227] 具體的,可以將系統(tǒng)分為以下幾個集群:\n[0228] 索引集群:負責(zé)存儲索引信息,計算檢索結(jié)果,定期的網(wǎng)絡(luò)資源對生成計算;\n[0229] Cache集群:負責(zé)結(jié)果收集計算,再排序計算,網(wǎng)絡(luò)資源顯示計算及緩存;\n[0230] 增量加載集群:用于實時處理用戶的訪問請求,對新增的訪問序列進行網(wǎng)絡(luò)資源對生成計算,插入索引集群;\n[0231] 網(wǎng)頁存儲集群:用于存儲doc信息。\n[0232] 本領(lǐng)域普通技術(shù)人員可以理解實現(xiàn)上述實施例方法中的全部或部分步驟是可以通過程序來指令相關(guān)的硬件來完成,所述的程序可以存儲于一計算機可讀取存儲介質(zhì)中,該程序在執(zhí)行時,包括如下步驟:獲得用戶訪問網(wǎng)絡(luò)資源的資源訪問記錄;將所述用戶的資源訪問記錄中的網(wǎng)絡(luò)資源拆分為網(wǎng)絡(luò)資源訪問對,每一網(wǎng)絡(luò)資源訪問對包含所述資源訪問記錄中的兩個網(wǎng)絡(luò)資源信息;匯集各用戶的網(wǎng)絡(luò)資源對,獲得網(wǎng)絡(luò)資源二維關(guān)系;當(dāng)需要為用戶進行推薦時,根據(jù)所述網(wǎng)絡(luò)資源二維關(guān)系為用戶推薦相關(guān)的網(wǎng)絡(luò)資源。所述的存儲介質(zhì),如:ROM/RAM、磁碟、光盤等。\n[0233] 實施例三、前文所述建立了網(wǎng)絡(luò)資源的二維索引結(jié)構(gòu),因此,可以利用該二維索引結(jié)構(gòu)向用戶推薦網(wǎng)絡(luò)資源。在本發(fā)明的實施例三中,還可以建立用戶之間的二維索引結(jié)構(gòu),并利用該索引結(jié)構(gòu)向用戶推薦其他的相關(guān)用戶,這樣,可以方便用戶交友、擴展圈子等。\n[0234] 參見圖3,本發(fā)明實施例提供的建立用戶索引的方法包括以下步驟:\n[0235] S301:獲得訪問同一網(wǎng)絡(luò)資源的用戶記錄;\n[0236] S302:將所述用戶記錄中的各用戶拆分為用戶對,每一用戶對包含所述用戶記錄中的兩個用戶;\n[0237] S303:匯集各個網(wǎng)絡(luò)資源的用戶對,獲得用戶二維關(guān)系,建立起用戶索引。\n[0238] 相應(yīng)的,本發(fā)明實施例還提供了另一種網(wǎng)絡(luò)信息推薦的方法,參見圖4,該方法包括以下步驟:\n[0239] S401:獲得訪問同一網(wǎng)絡(luò)資源的用戶記錄;\n[0240] S402:將所述用戶記錄中的各用戶拆分為用戶對,每一用戶對包含所述用戶記錄中的兩個用戶;\n[0241] S403:匯集各個網(wǎng)絡(luò)資源的用戶對,獲得用戶二維關(guān)系。\n[0242] S404:當(dāng)需要為用戶進行推薦時,根據(jù)所述用戶二維關(guān)系推薦相關(guān)的用戶信息。\n[0243] 例如,假設(shè)用戶A正在瀏覽用戶B發(fā)表在博客上的文章,則證明用戶A可能對于用戶B相關(guān)的其他用戶感興趣,此時就可以根據(jù)用戶二維關(guān)系,向用戶A推薦與用戶B相關(guān)的其他用戶。\n[0244] 其中,所述相關(guān)的用戶信息可以是與當(dāng)前用戶相關(guān)的用戶信息,或者與當(dāng)前被訪問的用戶相關(guān)的用戶信息。具體在根據(jù)所述用戶二維關(guān)系推薦與當(dāng)前訪問的用戶相關(guān)的用戶信息時,可以首先根據(jù)所述用戶二維關(guān)系獲得與當(dāng)前訪問的用戶相關(guān)的用戶集合,然后根據(jù)所述集合向用戶推薦相關(guān)的用戶信息。\n[0245] 與實施例一相似,該實施例中,也可以獲得各用戶對中兩用戶的相關(guān)度,所述根據(jù)所述用戶二維關(guān)系獲得與當(dāng)前訪問的用戶相關(guān)的用戶集合之后,還可以根據(jù)各用戶對中兩用戶的相關(guān)度,對所述集合中的用戶進行排序。\n[0246] 具體的獲得用戶對中兩用戶的相關(guān)度的方法可以包括:\n[0247] 將相同的用戶對進行合并;根據(jù)用戶對的合并次數(shù),為各個用戶對進行評分,得到各用戶對的相關(guān)度;\n[0248] 或者,通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,根據(jù)用戶的訪問歷史獲知用戶最可能訪問的網(wǎng)絡(luò)資源;將所述用戶最可能訪問的網(wǎng)絡(luò)資源的特征向量合并,得到各用戶的興趣向量;根據(jù)所述用戶的興趣向量獲得各用戶對中兩用戶的相關(guān)度;\n所述網(wǎng)絡(luò)資源特征向量用于描述網(wǎng)絡(luò)資源屬于各類別的置信度;所述興趣向量用于描述用戶對各類別的感興趣程度。\n[0249] 當(dāng)然,也可以將上述方法向結(jié)合,綜合考慮多方面因素,獲得用戶對中兩用戶的相關(guān)度。\n[0250] 在獲得到所述相關(guān)度之后,還可以對相關(guān)度進行修正。具體的修正方法可以是將相同的用戶對進行合并;根據(jù)用戶對的合并次數(shù),對所述相關(guān)度進行修正;或者,利用用戶的興趣向量進行修正。獲得相關(guān)度的方法與修正的方法可以任意組合,但是要保證獲得相關(guān)度與修正相關(guān)度的方法使用的參數(shù)不同。例如,可以先利用合并次數(shù)獲得相關(guān)度,再用用戶的興趣向量對相關(guān)度進行修正,等等。\n[0251] 此外,還可以利用各網(wǎng)絡(luò)資源的特征向量對所述相關(guān)度進行修正。該修正方法可以與前述任意種獲得相關(guān)度的方法配合使用。\n[0252] 另外,同樣可以將用戶二維關(guān)系作為核心索引,然后利用輔助索引對推薦結(jié)果進行排序、篩選等。例如,可以所述根據(jù)各用戶對中兩用戶的相關(guān)度,對所述集合中的用戶進行排序之后,根據(jù)輔助索引對所述集合中的用戶進行重新排序。也可以在獲得到所述集合之后,直接利用輔助索引對集合中的用戶進行排序。\n[0253] 具體的,可以分別將各所述相關(guān)用戶的興趣向量與當(dāng)前用戶的興趣向量進行內(nèi)積計算,并根據(jù)內(nèi)積計算的結(jié)果對各用戶進行排序或重新排序。\n[0254] 該實施例的細節(jié)部分可以參見實施例一、二,由于篇幅限制,這里不再贅述。\n[0255] 本領(lǐng)域普通技術(shù)人員可以理解實現(xiàn)上述實施例方法中的全部或部分步驟是可以通過程序來指令相關(guān)的硬件來完成,所述的程序可以存儲于一計算機可讀取存儲介質(zhì)中,該程序在執(zhí)行時,包括如下步驟:獲得訪問同一網(wǎng)絡(luò)資源的用戶記錄;將所述用戶記錄中的各用戶信息拆分為用戶對,每一用戶對包含所述用戶記錄中的兩個用戶信息;匯集各個網(wǎng)絡(luò)資源的用戶對,建立用戶二維關(guān)系;當(dāng)需要為用戶進行推薦時,根據(jù)所述用戶二維關(guān)系推薦相關(guān)的用戶信息。所述的存儲介質(zhì),如:ROM/RAM、磁碟、光盤等。\n[0256] 與本發(fā)明實施例提供的第一種網(wǎng)絡(luò)信息推薦的方法相對應(yīng),本發(fā)明實施例還提供了一種網(wǎng)絡(luò)信息推薦的系統(tǒng),參見圖5,該系統(tǒng)包括:\n[0257] 資源訪問記錄獲得單元U501,用于獲得用戶訪問網(wǎng)絡(luò)資源的資源訪問記錄;\n[0258] 網(wǎng)絡(luò)資源拆分單元U502,用于將所述用戶的資源訪問記錄中的網(wǎng)絡(luò)資源拆分為網(wǎng)絡(luò)資源訪問對,每一網(wǎng)絡(luò)資源訪問對包含所述資源訪問記錄中的兩個網(wǎng)絡(luò)資源信息;\n[0259] 網(wǎng)絡(luò)資源對匯集單元U503,用于匯集各用戶的網(wǎng)絡(luò)資源對,獲得網(wǎng)絡(luò)資源二維關(guān)系;\n[0260] 網(wǎng)絡(luò)資源推薦單元U504,用于當(dāng)需要為用戶進行推薦時,根據(jù)所述網(wǎng)絡(luò)資源二維關(guān)系為用戶推薦相關(guān)的網(wǎng)絡(luò)資源。\n[0261] 其中,網(wǎng)絡(luò)資源推薦單元U504包括:\n[0262] 第一網(wǎng)絡(luò)資源推薦子單元,用于根據(jù)所述網(wǎng)絡(luò)資源二維關(guān)系為用戶推薦與當(dāng)前訪問的網(wǎng)絡(luò)資源相關(guān)的網(wǎng)絡(luò)資源。\n[0263] 具體的,網(wǎng)絡(luò)資源推薦單元U504包括:\n[0264] 網(wǎng)絡(luò)資源集合獲得子單元,用于根據(jù)所述網(wǎng)絡(luò)資源二維關(guān)系獲得與當(dāng)前訪問的網(wǎng)絡(luò)資源相關(guān)的網(wǎng)絡(luò)資源集合;\n[0265] 第二網(wǎng)絡(luò)資源推薦子單元,用于根據(jù)所述集合向用戶推薦網(wǎng)絡(luò)資源。\n[0266] 為了對推薦結(jié)果進行排序,該系統(tǒng)還可以包括:\n[0267] 網(wǎng)絡(luò)資源相關(guān)度獲得單元,用于獲得各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源的相關(guān)度;\n[0268] 此時,網(wǎng)絡(luò)資源推薦單元U504還包括:\n[0269] 第一排序子單元,用于根據(jù)所述網(wǎng)絡(luò)資源二維關(guān)系獲得與當(dāng)前訪問的網(wǎng)絡(luò)資源相關(guān)的網(wǎng)絡(luò)資源集合之后,根據(jù)各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源的相關(guān)度,對所述集合中的網(wǎng)絡(luò)資源進行排序。\n[0270] 其中,所述網(wǎng)絡(luò)資源相關(guān)度獲得單元包括:\n[0271] 第一網(wǎng)絡(luò)資源相關(guān)度獲得子單元,用于將相同的網(wǎng)絡(luò)資源對進行合并;根據(jù)網(wǎng)絡(luò)資源對的合并次數(shù),為各個網(wǎng)絡(luò)資源對進行評分,得到各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源的相關(guān)度;\n[0272] 和/或,\n[0273] 第二網(wǎng)絡(luò)資源相關(guān)度獲得子單元,用于根據(jù)網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源之間的間隔時間,為各個網(wǎng)絡(luò)資源對進行評分,得到各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源的相關(guān)度;\n[0274] 和/或,\n[0275] 第三網(wǎng)絡(luò)資源相關(guān)度獲得子單元,用于通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,利用各網(wǎng)絡(luò)資源的特征向量獲得各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源的相關(guān)度;\n所述網(wǎng)絡(luò)資源特征向量用于描述網(wǎng)絡(luò)資源屬于各類別的置信度。\n[0276] 獲得到相關(guān)度之后,還可以對相關(guān)度進行修正,此時,該系統(tǒng)還包括:\n[0277] 第一網(wǎng)絡(luò)資源相關(guān)度修正單元,用于將相同的網(wǎng)絡(luò)資源對進行合并;根據(jù)網(wǎng)絡(luò)資源對的合并次數(shù),對所述相關(guān)度進行修正;\n[0278] 和/或,\n[0279] 第二網(wǎng)絡(luò)資源相關(guān)度修正單元,用于根據(jù)網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源之間的間隔時間,對所述相關(guān)度進行修正;\n[0280] 和/或,\n[0281] 第三網(wǎng)絡(luò)資源相關(guān)度修正單元,用于通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,利用各網(wǎng)絡(luò)資源的特征向量對所述相關(guān)度進行修正;所述網(wǎng)絡(luò)資源特征向量用于描述網(wǎng)絡(luò)資源屬于各類別的置信度;\n[0282] 和/或,\n[0283] 第四網(wǎng)絡(luò)資源相關(guān)度修正單元,通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,所述網(wǎng)絡(luò)資源特征向量用于描述網(wǎng)絡(luò)資源屬于各類別的置信度;根據(jù)用戶的訪問歷史獲知用戶最可能訪問的網(wǎng)絡(luò)資源;將所述用戶最可能訪問的網(wǎng)絡(luò)資源的特征向量合并,得到各用戶的興趣向量;利用各用戶的興趣向量對所述相關(guān)度進行修正;所述興趣向量用于描述用戶對各類別的感興趣程度。\n[0284] 具體在進行推薦時,還可以將所述網(wǎng)絡(luò)資源二維關(guān)系為核心索引,此時,網(wǎng)絡(luò)資源推薦單元U504還包括:\n[0285] 第二排序子單元,用于根據(jù)輔助索引對所述集合中的網(wǎng)絡(luò)資源進行排序。第二排序子單元可以在根據(jù)所述網(wǎng)絡(luò)資源二維關(guān)系獲得與當(dāng)前訪問的網(wǎng)絡(luò)資源相關(guān)的網(wǎng)絡(luò)資源集合之后進行排序,也可以在根據(jù)各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源的相關(guān)度,對所述集合中的網(wǎng)絡(luò)資源進行排序之后,進行重新排序。\n[0286] 其中,所述第二排序子單元包括:\n[0287] 特征向量生成子單元,用于通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,所述網(wǎng)絡(luò)資源特征向量用于描述網(wǎng)絡(luò)資源屬于各類別的置信度;\n[0288] 第一計算子單元,用于分別將各所述相關(guān)網(wǎng)絡(luò)資源的特征向量與用戶當(dāng)前訪問的網(wǎng)絡(luò)資源的特征向量進行內(nèi)積計算,并根據(jù)內(nèi)積計算的結(jié)果對各網(wǎng)絡(luò)資源進行排序。\n[0289] 或者,所述第二排序子單元也可以包括:\n[0290] 興趣向量生成子單元,用于通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,所述網(wǎng)絡(luò)資源特征向量用于描述網(wǎng)絡(luò)資源屬于各類別的置信度;根據(jù)用戶的訪問歷史獲知用戶最可能訪問的網(wǎng)絡(luò)資源;將所述用戶最可能訪問的網(wǎng)絡(luò)資源的特征向量合并,得到各用戶的興趣向量;所述興趣向量用于描述用戶對各類別的感興趣程度;\n[0291] 第二計算子單元,用于分別將各所述相關(guān)網(wǎng)絡(luò)資源的特征向量與該用戶的興趣向量進行內(nèi)積計算,并根據(jù)內(nèi)積計算的結(jié)果對各網(wǎng)絡(luò)資源進行排序。\n[0292] 此外,該系統(tǒng)還可以包括:\n[0293] 過濾單元,用于過濾掉無效的網(wǎng)絡(luò)資源對,所述無效的網(wǎng)絡(luò)資源對包括:內(nèi)容不相關(guān)的網(wǎng)絡(luò)資源對、訪問時間間隔超過預(yù)置閾值的網(wǎng)絡(luò)資源對或者包含有廣告導(dǎo)航頁的網(wǎng)絡(luò)資源對。\n[0294] 與本發(fā)明實施例提供的第二種網(wǎng)絡(luò)信息推薦的方法相對應(yīng),本發(fā)明實施例還提供了另一種網(wǎng)絡(luò)信息推薦的系統(tǒng),參見圖6,該系統(tǒng)包括:\n[0295] 用戶記錄獲得單元U601,用于獲得訪問同一網(wǎng)絡(luò)資源的用戶記錄;\n[0296] 用戶拆分單元U602,用于將所述用戶記錄中的各用戶信息拆分為用戶對,每一用戶對包含所述用戶記錄中的兩個用戶信息;\n[0297] 用戶對匯集單元U603,用于匯集各個網(wǎng)絡(luò)資源的用戶對,獲得用戶二維關(guān)系;\n[0298] 用戶信息推薦單元U604,用于當(dāng)需要為用戶進行推薦時,根據(jù)所述用戶二維關(guān)系推薦相關(guān)的用戶信息。\n[0299] 其中,用戶信息推薦單元U604包括:\n[0300] 第一用戶信息推薦子單元,用于根據(jù)所述用戶二維關(guān)系推薦與當(dāng)前訪問的用戶相關(guān)的用戶信息。\n[0301] 具體的,所述用戶信息推薦單元U604包括:\n[0302] 用戶信息集合生成子單元,用于根據(jù)所述用戶二維關(guān)系獲得相關(guān)的用戶集合;\n[0303] 第二用戶信息推薦子單元,用于根據(jù)所述集合向用戶推薦相關(guān)的用戶信息。\n[0304] 為了在推薦時能夠?qū)τ脩粜畔⑦M行排序,該系統(tǒng)還可以包括:\n[0305] 用戶相關(guān)度獲得單元,用于獲得各用戶對中兩用戶的相關(guān)度;\n[0306] 所述用戶信息推薦單元還包括:\n[0307] 第一用戶排序子單元,用于根據(jù)各用戶對中兩用戶的相關(guān)度,對所述集合中的用戶進行排序。\n[0308] 其中,所述用戶相關(guān)度獲得單元包括:\n[0309] 第一用戶相關(guān)度獲得子單元,用于將相同的用戶對進行合并;根據(jù)用戶對的合并次數(shù),為各個用戶對進行評分,得到各用戶對的相關(guān)度;\n[0310] 和/或,\n[0311] 第二用戶相關(guān)度獲得子單元,用于通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,根據(jù)用戶的訪問歷史獲知用戶最可能訪問的網(wǎng)絡(luò)資源;將所述用戶最可能訪問的網(wǎng)絡(luò)資源的特征向量合并,得到各用戶的興趣向量;根據(jù)所述用戶的興趣向量獲得各用戶對中兩用戶的相關(guān)度;所述網(wǎng)絡(luò)資源特征向量用于描述網(wǎng)絡(luò)資源屬于各類別的置信度;所述興趣向量用于描述用戶對各類別的感興趣程度。\n[0312] 獲得到相關(guān)度之后還可以對相關(guān)度進行修正,該系統(tǒng)還包括:\n[0313] 第一用戶相關(guān)度修正單元,用于將相同的用戶對進行合并;根據(jù)用戶對的合并次數(shù),對所述相關(guān)度進行修正;\n[0314] 和/或,\n[0315] 第二用戶相關(guān)度修正單元,用于通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,根據(jù)用戶的訪問歷史獲知用戶最可能訪問的網(wǎng)絡(luò)資源;將所述用戶最可能訪問的網(wǎng)絡(luò)資源的特征向量合并,得到各用戶的興趣向量;根據(jù)所述用戶的興趣向量對所述相關(guān)度進行修正;所述網(wǎng)絡(luò)資源特征向量用于描述網(wǎng)絡(luò)資源屬于各類別的置信度;所述興趣向量用于描述用戶對各類別的感興趣程度;\n[0316] 和/或,\n[0317] 第三用戶相關(guān)度修正單元,用于通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,利用各網(wǎng)絡(luò)資源的特征向量對所述相關(guān)度進行修正;所述網(wǎng)絡(luò)資源特征向量用于描述網(wǎng)絡(luò)資源屬于各類別的置信度。\n[0318] 此外,還可以講所述用戶二維關(guān)系為核心索引,此時,用戶信息推薦U604單元還包括:\n[0319] 第二用戶排序子單元,用于根據(jù)輔助索引對所述集合中的用戶進行排序。\n[0320] 其中,所述第二用戶排序子單元包括:\n[0321] 興趣向量生成子單元,用于通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,所述網(wǎng)絡(luò)資源特征向量用于描述網(wǎng)絡(luò)資源屬于各類別的置信度;根據(jù)用戶的訪問歷史獲知用戶最可能訪問的網(wǎng)絡(luò)資源;將所述用戶最可能訪問的網(wǎng)絡(luò)資源的特征向量合并,得到各用戶的興趣向量;所述興趣向量用于描述用戶對各類別的感興趣程度;\n[0322] 內(nèi)積計算子單元,用于分別將各所述相關(guān)用戶的興趣向量與當(dāng)前用戶的興趣向量進行內(nèi)積計算,并根據(jù)內(nèi)積計算的結(jié)果對各用戶進行排序。\n[0323] 與本發(fā)明實施例提供的建立網(wǎng)絡(luò)資源索引的方法相對應(yīng),本發(fā)明實施例還提供了一種建立網(wǎng)絡(luò)資源索引的系統(tǒng),參見圖7,該系統(tǒng)包括:\n[0324] 資源訪問記錄獲得單元U701,用于獲得用戶訪問網(wǎng)絡(luò)資源的資源訪問記錄;\n[0325] 網(wǎng)絡(luò)資源拆分單元U702,用于將所述用戶的資源訪問記錄中的網(wǎng)絡(luò)資源拆分為網(wǎng)絡(luò)資源訪問對,每一網(wǎng)絡(luò)資源訪問對包含所述資源訪問記錄中的兩個網(wǎng)絡(luò)資源信息;\n[0326] 網(wǎng)絡(luò)資源對匯集單元U703,用于匯集各用戶的網(wǎng)絡(luò)資源對,獲得網(wǎng)絡(luò)資源二維關(guān)系,建立起網(wǎng)絡(luò)資源索引。\n[0327] 其中,該系統(tǒng)還可以包括:\n[0328] 網(wǎng)絡(luò)資源相關(guān)度獲得單元,用于獲得各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源的相關(guān)度,以便根據(jù)所述相關(guān)度對所述網(wǎng)絡(luò)資源進行排序。\n[0329] 具體的,所述網(wǎng)絡(luò)資源相關(guān)度獲得單元包括:\n[0330] 第一網(wǎng)絡(luò)資源相關(guān)度獲得子單元,用于將相同的網(wǎng)絡(luò)資源對進行合并;根據(jù)網(wǎng)絡(luò)資源對的合并次數(shù),為各個網(wǎng)絡(luò)資源對進行評分,得到各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源的相關(guān)度;\n[0331] 和/或,\n[0332] 第二網(wǎng)絡(luò)資源相關(guān)度獲得子單元,用于根據(jù)網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源之間的間隔時間,為各個網(wǎng)絡(luò)資源對進行評分,得到各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源的相關(guān)度;\n[0333] 和/或,\n[0334] 第三網(wǎng)絡(luò)資源相關(guān)度獲得子單元,用于通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,利用各網(wǎng)絡(luò)資源的特征向量獲得各網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源的相關(guān)度;\n所述網(wǎng)絡(luò)資源特征向量用于描述網(wǎng)絡(luò)資源屬于各類別的置信度。\n[0335] 獲得到相關(guān)度之后還可以進行修正,此時,該系統(tǒng)還包括:\n[0336] 第一網(wǎng)絡(luò)資源相關(guān)度修正單元,用于將相同的網(wǎng)絡(luò)資源對進行合并;根據(jù)網(wǎng)絡(luò)資源對的合并次數(shù),對所述相關(guān)度進行修正;\n[0337] 和/或,\n[0338] 第二網(wǎng)絡(luò)資源相關(guān)度修正單元,用于根據(jù)網(wǎng)絡(luò)資源對中兩網(wǎng)絡(luò)資源之間的間隔時間,對所述相關(guān)度進行修正;\n[0339] 和/或,\n[0340] 第三網(wǎng)絡(luò)資源相關(guān)度修正單元,用于通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,利用各網(wǎng)絡(luò)資源的特征向量對所述相關(guān)度進行修正;所述網(wǎng)絡(luò)資源特征向量用于描述網(wǎng)絡(luò)資源屬于各類別的置信度;\n[0341] 和/或,\n[0342] 第四網(wǎng)絡(luò)資源相關(guān)度修正單元,通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,所述網(wǎng)絡(luò)資源特征向量用于描述網(wǎng)絡(luò)資源屬于各類別的置信度;根據(jù)用戶的訪問歷史獲知用戶最可能訪問的網(wǎng)絡(luò)資源;將所述用戶最可能訪問的網(wǎng)絡(luò)資源的特征向量合并,得到各用戶的興趣向量;利用各用戶的興趣向量對所述相關(guān)度進行修正;所述興趣向量用于描述用戶對各類別的感興趣程度。\n[0343] 與本發(fā)明實施例提供的建立用戶索引的方法相對應(yīng),本發(fā)明實施例還提供了一種建立用戶索引的系統(tǒng),參見圖8,該系統(tǒng)包括:\n[0344] 用戶記錄獲得單元U801,用于獲得訪問同一網(wǎng)絡(luò)資源的用戶記錄;\n[0345] 用戶拆分單元U802,用于將所述用戶記錄中的各用戶信息拆分為用戶對,每一用戶對包含所述用戶記錄中的兩個用戶信息;\n[0346] 用戶對匯集單元U803,用于匯集各個網(wǎng)絡(luò)資源的用戶對,獲得用戶二維關(guān)系,建立起用戶索引。\n[0347] 該系統(tǒng)還包括:\n[0348] 用戶相關(guān)度獲得單元,用于獲得各用戶對中兩用戶的相關(guān)度,以便根據(jù)所述相關(guān)度對用戶進行排序。\n[0349] 具體的,所述用戶相關(guān)度獲得單元包括:\n[0350] 第一用戶相關(guān)度獲得子單元,用于將相同的用戶對進行合并;根據(jù)用戶對的合并次數(shù),為各個用戶對進行評分,得到各用戶對的相關(guān)度;\n[0351] 和/或,\n[0352] 第二用戶相關(guān)度獲得子單元,用于通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,根據(jù)用戶的訪問歷史獲知用戶最可能訪問的網(wǎng)絡(luò)資源;將所述用戶最可能訪問的網(wǎng)絡(luò)資源的特征向量合并,得到各用戶的興趣向量;根據(jù)所述用戶的興趣向量獲得各用戶對中兩用戶的相關(guān)度;所述網(wǎng)絡(luò)資源特征向量用于描述網(wǎng)絡(luò)資源屬于各類別的置信度;所述興趣向量用于描述用戶對各類別的感興趣程度。\n[0353] 獲得到相關(guān)度之后還可以進行修正,此時,該系統(tǒng)還包括:\n[0354] 第一用戶相關(guān)度修正單元,用于將相同的用戶對進行合并;根據(jù)用戶對的合并次數(shù),對所述相關(guān)度進行修正;\n[0355] 和/或,\n[0356] 第二用戶相關(guān)度修正單元,用于通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,根據(jù)用戶的訪問歷史獲知用戶最可能訪問的網(wǎng)絡(luò)資源;將所述用戶最可能訪問的網(wǎng)絡(luò)資源的特征向量合并,得到各用戶的興趣向量;根據(jù)所述用戶的興趣向量對所述相關(guān)度進行修正;所述網(wǎng)絡(luò)資源特征向量用于描述網(wǎng)絡(luò)資源屬于各類別的置信度;所述興趣向量用于描述用戶對各類別的感興趣程度;\n[0357] 和/或,\n[0358] 第三用戶相關(guān)度修正單元,用于通過預(yù)置的分類信息為各網(wǎng)絡(luò)資源生成網(wǎng)絡(luò)資源特征向量,利用各網(wǎng)絡(luò)資源的特征向量對所述相關(guān)度進行修正;所述網(wǎng)絡(luò)資源特征向量用于描述網(wǎng)絡(luò)資源屬于各類別的置信度。\n[0359] 本發(fā)明中所描述的系統(tǒng)、裝置和方法適用于各種網(wǎng)絡(luò)或客戶端環(huán)境中,其例如可以實現(xiàn)在諸如個人計算機設(shè)備之類的計算機設(shè)備中,或者可以實現(xiàn)在諸如移動電話、移動通信設(shè)備、個人數(shù)字助理(PDA)等其他電子設(shè)備中。\n[0360] 以上對本發(fā)明所提供的網(wǎng)絡(luò)信息推薦、建立網(wǎng)絡(luò)資源索引方法及系統(tǒng),進行了詳細介紹,本文中應(yīng)用了具體個例對本發(fā)明的原理及實施方式進行了闡述,以上實施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想;同時,對于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在具體實施方式及應(yīng)用范圍上均會有改變之處。綜上所述,本說明書內(nèi)容不應(yīng)理解為對本發(fā)明的限制。法律信息
- 2014-03-19
- 2011-09-07
實質(zhì)審查的生效
IPC(主分類): G06F 17/30
專利申請?zhí)? 200910236867.6
申請日: 2009.11.04
- 2011-05-11
引用專利(該專利引用了哪些專利)
序號 | 公開(公告)號 | 公開(公告)日 | 申請日 | 專利名稱 | 申請人 |
1
| |
2008-12-17
|
2008-07-24
| | |
被引用專利(該專利被哪些專利引用)
序號 | 公開(公告)號 | 公開(公告)日 | 申請日 | 專利名稱 | 申請人 | 該專利沒有被任何外部專利所引用! |