加載中...
首頁專利查詢專利詳情

*來源于國(guó)家知識(shí)產(chǎn)權(quán)局?jǐn)?shù)據(jù),僅供參考,實(shí)際以國(guó)家知識(shí)產(chǎn)權(quán)局展示為準(zhǔn)

一種基于強(qiáng)編碼和中文分詞的中文文本分揀系統(tǒng)

發(fā)明專利有效專利
  • 申請(qǐng)?zhí)枺?/span>
    CN202211244693.X
  • IPC分類號(hào):G06F16/35;G06F40/216;G06F40/289;G06N3/08
  • 申請(qǐng)日期:
    2022-10-12
  • 申請(qǐng)人:
    浙江大學(xué)
著錄項(xiàng)信息
專利名稱一種基于強(qiáng)編碼和中文分詞的中文文本分揀系統(tǒng)
申請(qǐng)?zhí)?/td>CN202211244693.X申請(qǐng)日期2022-10-12
法律狀態(tài)公開申報(bào)國(guó)家暫無
公開/公告日2022-11-25公開/公告號(hào)CN115391544A
優(yōu)先權(quán)暫無優(yōu)先權(quán)號(hào)暫無
主分類號(hào)G06F16/35IPC分類號(hào)G;0;6;F;1;6;/;3;5;;;G;0;6;F;4;0;/;2;1;6;;;G;0;6;F;4;0;/;2;8;9;;;G;0;6;N;3;/;0;8查看分類表>
申請(qǐng)人浙江大學(xué)申請(qǐng)人地址
浙江省杭州市西湖區(qū)余杭塘路866號(hào) 變更 專利地址、主體等相關(guān)變化,請(qǐng)及時(shí)變更,防止失效
權(quán)利人浙江大學(xué)當(dāng)前權(quán)利人浙江大學(xué)
發(fā)明人劉興高;趙世強(qiáng);張逸然;王文海;張志猛;張澤銀
代理機(jī)構(gòu)杭州求是專利事務(wù)所有限公司代理人邱啟旺
摘要
本發(fā)明公開了一種基于強(qiáng)編碼和中文分詞的中文文本分揀系統(tǒng),該系統(tǒng)基于強(qiáng)編碼模型和中文分詞數(shù)據(jù)實(shí)現(xiàn)中文文本分揀,首先獲取包含大量中文文本及對(duì)應(yīng)標(biāo)簽的數(shù)據(jù)庫,采用帶標(biāo)簽的中文文本數(shù)據(jù)作為輸入,對(duì)中文文本進(jìn)行分詞后再編碼成機(jī)器可識(shí)別格式,將該編碼后的句子輸入中文文本分揀模型進(jìn)行模型訓(xùn)練,得到訓(xùn)練好的模型便可用于新獲取的中文文本自動(dòng)分揀。本發(fā)明實(shí)現(xiàn)了自動(dòng)化、高準(zhǔn)確率的中文文本分揀,考慮了中文字詞的前后關(guān)系,克服了人工進(jìn)行文本分揀效率低以及傳統(tǒng)方法準(zhǔn)確率低的不足,可廣泛應(yīng)用并有助于軍事情報(bào)分揀、新聞主題分類和電影評(píng)論分類等領(lǐng)域的智能化。

我瀏覽過的專利

專利服務(wù)由北京酷愛智慧知識(shí)產(chǎn)權(quán)代理公司提供