加載中...
首頁專利查詢專利詳情

*來源于國家知識產(chǎn)權局數(shù)據(jù),僅供參考,實際以國家知識產(chǎn)權局展示為準

一種網(wǎng)絡爬蟲實現(xiàn)方法和網(wǎng)絡爬蟲系統(tǒng)

發(fā)明專利無效專利
  • 申請?zhí)枺?/span>
    CN201510901579.3
  • IPC分類號:G06F17/30
  • 申請日期:
    2015-12-08
  • 申請人:
    北京奇虎科技有限公司;奇智軟件(北京)有限公司
著錄項信息
專利名稱一種網(wǎng)絡爬蟲實現(xiàn)方法和網(wǎng)絡爬蟲系統(tǒng)
申請?zhí)?/td>CN201510901579.3申請日期2015-12-08
法律狀態(tài)駁回申報國家中國
公開/公告日2016-02-24公開/公告號CN105354337A
優(yōu)先權暫無優(yōu)先權號暫無
主分類號G06F17/30IPC分類號G;0;6;F;1;7;/;3;0查看分類表>
申請人北京奇虎科技有限公司;奇智軟件(北京)有限公司申請人地址
北京市西城區(qū)新街口外大街28號D座112室(德勝園區(qū)) 變更 專利地址、主體等相關變化,請及時變更,防止失效
權利人北京奇虎科技有限公司,奇智軟件(北京)有限公司當前權利人北京奇虎科技有限公司,奇智軟件(北京)有限公司
發(fā)明人葛山
代理機構北京市隆安律師事務所代理人權鮮枝;何立春
摘要
本發(fā)明公開了一種網(wǎng)絡爬蟲實現(xiàn)方法和網(wǎng)絡爬蟲系統(tǒng)。其中所述方法包括:模擬用戶對網(wǎng)頁的訪問操作發(fā)送網(wǎng)頁訪問請求;根據(jù)網(wǎng)頁訪問請求對應的反饋內容獲得相應的網(wǎng)頁內容;分析獲得的網(wǎng)頁內容,獲得目標信息。通過該技術方案實現(xiàn)的網(wǎng)絡爬蟲并不直接訪問網(wǎng)站服務器獲取資源,而是通過模擬正常用戶的網(wǎng)頁訪問請求,在客戶端如瀏覽器獲取到網(wǎng)頁內容,避免了受到網(wǎng)站設置的robots.txt中對網(wǎng)絡爬蟲獲取數(shù)據(jù)內容的限制,并且獲取到的內容也是通過正當途徑訪問網(wǎng)頁獲取的,既可以滿足用戶爬取數(shù)據(jù)的需求,也不違反網(wǎng)站服務提供方的約束。

我瀏覽過的專利

專利服務由北京酷愛智慧知識產(chǎn)權代理公司提供