<samp id="ppput"><pre id="ppput"><rt id="ppput"></rt></pre></samp>

<dfn id="ppput"></dfn>

<samp id="ppput"></samp>

<dfn id="ppput"></dfn>

<track id="ppput"><big id="ppput"></big></track>

首頁專利查詢專利詳情

*來源于國家知識(shí)產(chǎn)權(quán)局?jǐn)?shù)據(jù)，僅供參考，實(shí)際以國家知識(shí)產(chǎn)權(quán)局展示為準(zhǔn)

一種確定商品配送范圍的方法和裝置

發(fā)明專利有效專利

申請(qǐng)?zhí)枺?/span>
CN201410427376.0
IPC分類號(hào)：G06Q30/00;G06Q10/08;G06F17/30
申請(qǐng)日期：
2014-08-27
申請(qǐng)人：
北京京東尚科信息技術(shù)有限公司;北京京東世紀(jì)貿(mào)易有限公司

基礎(chǔ)信息

權(quán)利要求

說明書

PDF全文

法律信息

引證文獻(xiàn)

著錄項(xiàng)信息

專利名稱	一種確定商品配送范圍的方法和裝置
申請(qǐng)?zhí)?/td>	CN201410427376.0	申請(qǐng)日期	2014-08-27
法律狀態(tài)	授權(quán)	申報(bào)國家	中國
公開/公告日	2014-12-10	公開/公告號(hào)	CN104200369A
優(yōu)先權(quán)	暫無	優(yōu)先權(quán)號(hào)	暫無
主分類號(hào)	G06Q30/00 ? IPC結(jié)構(gòu)圖譜： G 物理 G0 儀器 G06 計(jì)算；推算；計(jì)數(shù) G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的數(shù)據(jù)處理系統(tǒng)或方法；其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的處理系統(tǒng)或方法〔8〕 G06Q30/00 商業(yè)，例如購物或電子商務(wù)〔8，2012.01〕	IPC分類號(hào)	G;0;6;Q;3;0;/;0;0;;;G;0;6;Q;1;0;/;0;8;;;G;0;6;F;1;7;/;3;0查看分類表>
申請(qǐng)人	北京京東尚科信息技術(shù)有限公司;北京京東世紀(jì)貿(mào)易有限公司	申請(qǐng)人地址	北京市海淀區(qū)杏石口路65號(hào)西杉創(chuàng)意園四區(qū)11C樓東段1-4層西段1-4層變更專利地址、主體等相關(guān)變化，請(qǐng)及時(shí)變更，防止失效
權(quán)利人	北京京東尚科信息技術(shù)有限公司,北京京東世紀(jì)貿(mào)易有限公司	當(dāng)前權(quán)利人	北京京東尚科信息技術(shù)有限公司,北京京東世紀(jì)貿(mào)易有限公司
發(fā)明人	布如國;牟川;鐘超
代理機(jī)構(gòu)	中原信達(dá)知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司	代理人	劉光明;陸錦華

摘要

本發(fā)明提供一種確定商品配送范圍的方法和裝置，能夠比較高效地確定各個(gè)配送員的配送范圍，有助于提高配送速度。本發(fā)明的確定商品配送范圍的方法包括：步驟A：對(duì)于預(yù)選的包含配送員信息的多個(gè)歷史配送地址，使用查找重復(fù)串的方式確定初始詞庫；步驟B：對(duì)所述初始詞庫進(jìn)行過濾得到過濾詞庫；其中，使該過濾詞庫中的各個(gè)代表詞分別對(duì)應(yīng)一個(gè)或幾個(gè)配送地址，并且每個(gè)代表詞所在的配送地址由一個(gè)配送員配送；步驟C：對(duì)于所述過濾詞庫中的各個(gè)代表詞，按其對(duì)應(yīng)的配送地址的地理位置接近的原則對(duì)這些代表詞進(jìn)行聚類；步驟D：對(duì)于聚類得到的各類的代表詞，將每一類代表詞對(duì)應(yīng)的多個(gè)配送地址作為一個(gè)商品配送范圍。

1.一種確定商品配送范圍的方法，其特征在于，包括：
步驟A：對(duì)于預(yù)選的包含配送員信息的多個(gè)歷史配送地址，使用查找重復(fù)串的方式確定初始詞庫；
步驟B：對(duì)所述初始詞庫進(jìn)行二級(jí)過濾得到過濾詞庫；其中，第一級(jí)過濾濾除對(duì)所述歷史配送地址沒有意義的詞，第二級(jí)過濾濾除不能代表具體的地理位置的詞，使該過濾詞庫中的各個(gè)代表詞分別對(duì)應(yīng)一個(gè)或幾個(gè)配送地址，并且每個(gè)代表詞所在的配送地址由一個(gè)配送員配送；
步驟C：對(duì)于所述過濾詞庫中的各個(gè)代表詞，按其對(duì)應(yīng)的配送地址的地理位置接近的原則對(duì)這些代表詞進(jìn)行聚類；
步驟D：對(duì)于聚類得到的各類的代表詞，將每一類代表詞對(duì)應(yīng)的多個(gè)配送地址作為一個(gè)商品配送范圍；
所述步驟C包括：計(jì)算所述過濾詞庫中的所有代表詞兩兩之間的權(quán)重；對(duì)所述過濾詞庫中的所有詞按所述權(quán)重構(gòu)成鄰接矩陣，然后得出該鄰接矩陣對(duì)應(yīng)的拉普拉斯矩陣；將所述拉普拉斯矩陣的前K個(gè)最小的特征值對(duì)應(yīng)的特征向量排列組成N×K的矩陣，其中N表示所述過濾詞庫中的代表詞的數(shù)量；采用K-me?ans算法對(duì)所述N×K的矩陣按行進(jìn)行聚類，將聚類之后的同一類的行對(duì)應(yīng)的代表詞作為同一類的代表詞。
2.根據(jù)權(quán)利要求1所述的方法，其特征在于，在所述步驟B之前，還包括：對(duì)步驟A中確定出的初始詞庫進(jìn)行去重處理。
3.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述步驟B中的過濾包括第一級(jí)過濾和第二級(jí)過濾；
所述第一級(jí)過濾包括：
計(jì)算所述初始詞庫中各個(gè)詞在所述初始詞庫中的詞頻與該詞在指定城市的所有地址中出現(xiàn)的詞頻的比值，取該比值大于預(yù)設(shè)閾值的詞構(gòu)成中間過濾詞庫；
所述第二級(jí)過濾包括：
按如下步驟1至步驟3進(jìn)行計(jì)算代表詞對(duì)應(yīng)的平均值，若步驟3中計(jì)算得到的平均值小于預(yù)選閾值，則舍棄該平均值大于預(yù)選閾值的代表詞并且再次執(zhí)行步驟1至步驟3，直至選擇的每個(gè)代表詞對(duì)應(yīng)的所述平均值小于所述預(yù)選閾值，然后將選擇的代表詞組成所述過濾詞庫：
步驟1：從每一個(gè)所述歷史配送地址中選擇代表詞，該代表詞屬于所述中間過濾詞庫，并且是該代表詞所在地址中的在所述中間過濾詞庫中詞頻最高的詞；
步驟2：對(duì)每個(gè)選擇的代表詞，按如下公式計(jì)算一日的熵：
其中T表示包含該選擇的代表詞的所有配送地址在該日對(duì)應(yīng)的配送員數(shù)目，P表示所述對(duì)應(yīng)的配送員中每個(gè)配送員在該日的配送地址數(shù)占該所有地址的比例；
步驟3：對(duì)每個(gè)選擇的代表詞，計(jì)算預(yù)設(shè)數(shù)目的多日的熵的平均值并作為該代表詞對(duì)應(yīng)的平均值。
4.根據(jù)權(quán)利要求1至3中任一項(xiàng)所述的方法，其特征在于，
根據(jù)如下公式計(jì)算所述過濾詞庫中的所有代表詞兩兩之間的權(quán)重：
其中表示第i1個(gè)代表詞和第i2個(gè)代表詞之間的權(quán)重，L表示采樣天數(shù)，M表示在L天內(nèi)所述過濾詞庫中的所有代表詞所在的配送地址對(duì)應(yīng)的所有配送員的數(shù)目，aijk表示第k天，第i個(gè)代表詞所在的配送地址由第j個(gè)配送員配送的數(shù)量。
5.一種確定商品配送范圍的裝置，其特征在于，包括：
初始詞庫模塊，用于對(duì)于預(yù)選的包含配送員信息的多個(gè)歷史配送地址，使用查找重復(fù)串的方式確定多個(gè)代表詞得到初始詞庫；
過濾模塊，用于對(duì)所述初始詞庫進(jìn)行二級(jí)過濾得到過濾詞庫；其中，第一級(jí)過濾濾除對(duì)所述歷史配送地址沒有意義的詞，第二級(jí)過濾濾除不能代表具體的地理位置的詞，使該過濾詞庫中的各個(gè)代表詞分別對(duì)應(yīng)一個(gè)或幾個(gè)配送地址，并且每個(gè)代表詞所在的配送地址由一個(gè)配送員配送；
聚類模塊，用于對(duì)于所述過濾詞庫中的各個(gè)代表詞，按其對(duì)應(yīng)的配送地址的地理位置接近的原則對(duì)這些代表詞進(jìn)行聚類；
確定模塊，用于對(duì)于聚類得到的各類的代表詞，將每一類代表詞對(duì)應(yīng)的多個(gè)配送地址作為一個(gè)商品配送范圍；
所述聚類模塊還用于：計(jì)算所述過濾詞庫中的所有代表詞兩兩之間的權(quán)重：對(duì)所述過濾詞庫中的所有詞按所述權(quán)重構(gòu)成鄰接矩陣，然后得出該鄰接矩陣對(duì)應(yīng)的拉普拉斯矩陣；
將所述拉普拉斯矩陣的前K個(gè)最小的特征值對(duì)應(yīng)的特征向量排列組成N×K的矩陣，其中N表示所述過濾詞庫中的代表詞的數(shù)量；采用K-me?ans算法對(duì)所述N×K的矩陣按行進(jìn)行聚類，將聚類之后的同一類的行對(duì)應(yīng)的代表詞作為同一類的代表詞。
6.根據(jù)權(quán)利要求5所述的裝置，其特征在于，還包括去重模塊，用于對(duì)所述初始詞庫模塊得到的詞庫中的多個(gè)代表詞進(jìn)行去重處理。
7.根據(jù)權(quán)利要求5所述的裝置，其特征在于，所述過濾模塊還用于對(duì)所述初始詞庫進(jìn)行第一級(jí)過濾和第二級(jí)過濾；
所述第一級(jí)過濾包括：
計(jì)算所述初始詞庫中各個(gè)詞在所述初始詞庫中的詞頻與該詞在指定城市的所有地址中出現(xiàn)的詞頻的比值，取該比值大于預(yù)設(shè)閾值的詞構(gòu)成中間過濾詞庫；
所述第二級(jí)過濾包括：
按如下步驟1至步驟3進(jìn)行計(jì)算代表詞對(duì)應(yīng)的平均值，若步驟3?中計(jì)算得到的平均值小于預(yù)選閾值，則舍棄該平均值大于預(yù)選閾值的代表詞并且再次執(zhí)行步驟1至步驟3，直至選擇的每個(gè)代表詞對(duì)應(yīng)的所述平均值小于所述預(yù)選閾值，然后將選擇的代表詞組成所述過濾詞庫：
步驟1：從每一個(gè)所述歷史配送地址中選擇代表詞，該代表詞屬于所述中間過濾詞庫，并且是該代表詞所在地址中的在所述中間過濾詞庫中詞頻最高的詞；
步驟2：對(duì)每個(gè)選擇的代表詞，按如下公式計(jì)算一日的熵：
其中T表示包含該選擇的代表詞的所有配送地址在該日對(duì)應(yīng)的配送員數(shù)目，P表示所述對(duì)應(yīng)的配送員中每個(gè)配送員在該日的配送地址數(shù)占該所有地址的比例；
步驟3：對(duì)每個(gè)選擇的代表詞，計(jì)算預(yù)設(shè)數(shù)目的多日的熵的平均值并作為該代表詞對(duì)應(yīng)的平均值。
8.根據(jù)權(quán)利要求5所述的裝置，其特征在于，所述聚類模塊還用于：
根據(jù)如下公式計(jì)算所述過濾詞庫中的所有代表詞兩兩之間的權(quán)重：
其中表示第i1個(gè)代表詞和第i2個(gè)代表詞之間的權(quán)重，L表示采樣天數(shù)，M表示在L天內(nèi)所述過濾詞庫中的所有代表詞所在的配送地址對(duì)應(yīng)的所有配送員的數(shù)目，aijk表示第k天，第i個(gè)代表詞所在的配送地址由第j個(gè)配送員配送的數(shù)量。
9.一種電子設(shè)備，其特征在于，包括：
一個(gè)或多個(gè)處理器；
存儲(chǔ)裝置，用于存儲(chǔ)一個(gè)或多個(gè)程序，
當(dāng)所述一個(gè)或多個(gè)程序被所述一個(gè)或多個(gè)處理器執(zhí)行，使得所述一個(gè)或多個(gè)處理器實(shí)現(xiàn)如權(quán)利要求1-4中任一所述的方法。
10.一種計(jì)算機(jī)可讀介質(zhì)，其上存儲(chǔ)有計(jì)算機(jī)程序，其特征在于，所述程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1-4中任一所述的方法。

一種確定商品配送范圍的方法和裝置\n技術(shù)領(lǐng)域\n[0001] 本發(fā)明涉及計(jì)算機(jī)技術(shù)領(lǐng)域，特別地涉及一種確定商品配送范圍的方法和裝置。\n背景技術(shù)\n[0002] 隨著電子商務(wù)的不斷發(fā)展，網(wǎng)上購物成為越來越常見的購物方式。在網(wǎng)上購物之后，商品將被配送員送達(dá)用戶指定的配送地址。各個(gè)配送員各自負(fù)責(zé)不同的配送范圍，配送范圍是多個(gè)配送地址組成的集合。商品在配送站要經(jīng)過人工分揀，使配送員確定屬于自己負(fù)責(zé)的配送范圍的商品。這種人工分揀的效率比較低，影響了配送速度。\n發(fā)明內(nèi)容\n[0003] 有鑒于此，本發(fā)明提供一種確定商品配送范圍的方法和裝置，能夠比較高效地確定各個(gè)配送員的配送范圍，有助于提高配送速度。\n[0004] 為實(shí)現(xiàn)上述目的，根據(jù)本發(fā)明的一個(gè)方面，提供了一種確定商品配送范圍的方法。\n[0005] 本發(fā)明的確定商品配送范圍的方法包括：步驟A：對(duì)于預(yù)選的包含配送員信息的多個(gè)歷史配送地址，使用查找重復(fù)串的方式確定初始詞庫；步驟B：對(duì)所述初始詞庫進(jìn)行過濾得到過濾詞庫；其中，使該過濾詞庫中的各個(gè)代表詞分別對(duì)應(yīng)一個(gè)或幾個(gè)配送地址，并且每個(gè)代表詞所在的配送地址由一個(gè)配送員配送；步驟C：對(duì)于所述過濾詞庫中的各個(gè)代表詞，按其對(duì)應(yīng)的配送地址的地理位置接近的原則對(duì)這些代表詞進(jìn)行聚類；步驟D：對(duì)于聚類得到的各類的代表詞，將每一類代表詞對(duì)應(yīng)的多個(gè)配送地址作為一個(gè)商品配送范圍。\n[0006] 可選地，在所述步驟B之前，還包括：對(duì)步驟A中確定出的初始詞庫進(jìn)行去重處理。\n[0007] 可選地，所述步驟B中的過濾包括第一級(jí)過濾和第二級(jí)過濾；所述第一級(jí)過濾包括：計(jì)算所述初始詞庫中各個(gè)詞在所述初始詞庫中的詞頻與該詞在指定城市的所有地址中出現(xiàn)的詞頻的比值，取該比值大于預(yù)設(shè)閾值的詞構(gòu)成中間過濾詞庫；所述第二級(jí)過濾包括：\n按如下步驟1至步驟3進(jìn)行計(jì)算代表詞對(duì)應(yīng)的平均值，若步驟3中計(jì)算得到的平均值小于預(yù)選閾值，則舍棄該平均值大于預(yù)選閾值的代表詞并且再次執(zhí)行步驟1至步驟3，直至選擇的每個(gè)代表詞對(duì)應(yīng)的所述平均值小于所述預(yù)選閾值，然后將選擇的代表詞組成所述過濾詞庫：步驟1：從每一個(gè)所述歷史配送地址中選擇代表詞，該代表詞屬于所述中間過濾詞庫，并且是該代表詞所在地址中的在所述中間過濾詞庫中詞頻最高的詞；步驟2：對(duì)每個(gè)選擇的代表詞，按如下公式計(jì)算一日的熵：\n[0008]\n[0009] 其中T表示包含該選擇的代表詞的所有配送地址在該日對(duì)應(yīng)的配送員數(shù)目，P表示所述對(duì)應(yīng)的配送員中每個(gè)配送員在該日的配送地址數(shù)占該所有地址的比例；步驟3：對(duì)每個(gè)選擇的代表詞，計(jì)算預(yù)設(shè)數(shù)目的多日的熵的平均值并作為該代表詞對(duì)應(yīng)的平均值。\n[0010] 可選地，所述步驟C包括：根據(jù)如下公式計(jì)算所述過濾詞庫中的所有代表詞兩兩之間的權(quán)重：\n[0011]\n[0012] 其中表示第i1個(gè)代表詞和第i2個(gè)代表詞之間的權(quán)重，L表示采樣天數(shù)，M表示在L天內(nèi)所述過濾詞庫中的所有代表詞所在的配送地址對(duì)應(yīng)的所有配送員的數(shù)目，aijk表示第k天，第i個(gè)代表詞所在的配送地址由第j個(gè)配送員配送的數(shù)量；對(duì)所述過濾詞庫中的所有詞按所述權(quán)重構(gòu)成鄰接矩陣，然后得出該鄰接矩陣對(duì)應(yīng)的拉普拉斯矩陣；將所述拉普拉斯矩陣的前K個(gè)最小的特征值對(duì)應(yīng)的特征向量排列組成N×K的矩陣，其中N表示所述過濾詞庫中的代表詞的數(shù)量；采用K-mans算法對(duì)所述N×K的矩陣按行進(jìn)行聚類，將聚類之后的同一類的行對(duì)應(yīng)的代表詞作為同一類的代表詞。\n[0013] 根據(jù)本發(fā)明的另一方面，提供了一種確定商品配送范圍的裝置。\n[0014] 本發(fā)明的確定商品配送范圍的裝置包括：初始詞庫模塊，用于對(duì)于預(yù)選的包含配送員信息的多個(gè)歷史配送地址，使用查找重復(fù)串的方式確定多個(gè)代表詞得到初始詞庫；過濾模塊，用于對(duì)所述初始詞庫進(jìn)行過濾得到過濾詞庫；其中，使該過濾詞庫中的各個(gè)代表詞分別對(duì)應(yīng)一個(gè)或幾個(gè)配送地址，并且每個(gè)代表詞所在的配送地址由一個(gè)配送員配送；聚類模塊，用于對(duì)于所述過濾詞庫中的各個(gè)代表詞，按其對(duì)應(yīng)的配送地址的地理位置接近的原則對(duì)這些代表詞進(jìn)行聚類；確定模塊，用于對(duì)于聚類得到的各類的代表詞，將每一類代表詞對(duì)應(yīng)的多個(gè)配送地址作為一個(gè)商品配送范圍。\n[0015] 可選地，還包括去重模塊，用于對(duì)所述初始詞庫模塊得到的詞庫中的多個(gè)代表詞進(jìn)行去重處理。\n[0016] 可選地，所述過濾模塊還用于對(duì)所述初始詞庫進(jìn)行第一級(jí)過濾和第二級(jí)過濾；所述第一級(jí)過濾包括：計(jì)算所述初始詞庫中各個(gè)詞在所述初始詞庫中的詞頻與該詞在指定城市的所有地址中出現(xiàn)的詞頻的比值，取該比值大于預(yù)設(shè)閾值的詞構(gòu)成中間過濾詞庫；所述第二級(jí)過濾包括：按如下步驟1至步驟3進(jìn)行計(jì)算代表詞對(duì)應(yīng)的平均值，若步驟3中計(jì)算得到的平均值小于預(yù)選閾值，則舍棄該平均值大于預(yù)選閾值的代表詞并且再次執(zhí)行步驟1至步驟3，直至選擇的每個(gè)代表詞對(duì)應(yīng)的所述平均值小于所述預(yù)選閾值，然后將選擇的代表詞組成所述過濾詞庫：步驟1：從每一個(gè)所述歷史配送地址中選擇代表詞，該代表詞屬于所述中間過濾詞庫，并且是該代表詞所在地址中的在所述中間過濾詞庫中詞頻最高的詞；步驟2：\n對(duì)每個(gè)選擇的代表詞，按如下公式計(jì)算一日的熵：\n[0017]\n[0018] 其中T表示包含該選擇的代表詞的所有配送地址在該日對(duì)應(yīng)的配送員數(shù)目，P表示所述對(duì)應(yīng)的配送員中每個(gè)配送員在該日的配送地址數(shù)占該所有地址的比例；步驟3：對(duì)每個(gè)選擇的代表詞，計(jì)算預(yù)設(shè)數(shù)目的多日的熵的平均值并作為該代表詞對(duì)應(yīng)的平均值。\n[0019] 可選地，所述聚類模塊還用于：根據(jù)如下公式計(jì)算所述過濾詞庫中的所有代表詞兩兩之間的權(quán)重：\n[0020]\n[0021] 其中表示第i1個(gè)代表詞和第i2個(gè)代表詞之間的權(quán)重，L表示采樣天數(shù)，M表示在L天內(nèi)所述過濾詞庫中的所有代表詞所在的配送地址對(duì)應(yīng)的所有配送員的數(shù)目，aijk表示第k天，第i個(gè)代表詞所在的配送地址由第j個(gè)配送員配送的數(shù)量；對(duì)所述過濾詞庫中的所有詞按所述權(quán)重構(gòu)成鄰接矩陣，然后得出該鄰接矩陣對(duì)應(yīng)的拉普拉斯矩陣；將所述拉普拉斯矩陣的前K個(gè)最小的特征值對(duì)應(yīng)的特征向量排列組成N×K的矩陣，其中N表示所述過濾詞庫中的代表詞的數(shù)量；采用K-mans算法對(duì)所述N×K的矩陣按行進(jìn)行聚類，將聚類之后的同一類的行對(duì)應(yīng)的代表詞作為同一類的代表詞。\n[0022] 根據(jù)本發(fā)明的技術(shù)方案，獲取代表配送地址的代表詞，再對(duì)這些代表詞進(jìn)行聚類，使配送區(qū)域得以細(xì)化，配送區(qū)域被劃分為多個(gè)網(wǎng)格，每個(gè)網(wǎng)格有一個(gè)配送員，直接按網(wǎng)格就可以確定各個(gè)配送員的配送范圍，因此能夠高效地確定各個(gè)配送員的配送范圍，有助于提高配送速度。\n附圖說明\n[0023] 附圖用于更好地理解本發(fā)明，不構(gòu)成對(duì)本發(fā)明的不當(dāng)限定。其中：\n[0024] 圖1是根據(jù)本發(fā)明實(shí)施例的確定商品配送范圍的方法的主要步驟的示意圖；\n[0025] 圖2是根據(jù)本發(fā)明實(shí)施例的樹的結(jié)構(gòu)的示意圖；\n[0026] 圖3是根據(jù)本發(fā)明實(shí)施例的確定商品配送范圍的裝置的基本結(jié)構(gòu)的示意圖。\n具體實(shí)施方式\n[0027] 以下結(jié)合附圖對(duì)本發(fā)明的示范性實(shí)施例做出說明，其中包括本發(fā)明實(shí)施例的各種細(xì)節(jié)以助于理解，應(yīng)當(dāng)將它們認(rèn)為僅僅是示范性的。因此，本領(lǐng)域普通技術(shù)人員應(yīng)當(dāng)認(rèn)識(shí)到，可以對(duì)這里描述的實(shí)施例做出各種改變和修改，而不會(huì)背離本發(fā)明的范圍和精神。同樣，為了清楚和簡明，以下的描述中省略了對(duì)公知功能和結(jié)構(gòu)的描述。\n[0028] 在本發(fā)明實(shí)施例中，根據(jù)歷史配送地址，將配送區(qū)域劃分為多個(gè)網(wǎng)格，每個(gè)網(wǎng)格由一名配送員進(jìn)行配送。歷史配送地址是歷史中的一段時(shí)間(幾周或兩三個(gè)月)的配送信息，其中包含配送員信息，即哪個(gè)配送員在哪天配送了哪些地址。圖1是根據(jù)本發(fā)明實(shí)施例的確定商品配送范圍的方法的主要步驟的示意圖。如圖1所示，該方法主要包括如下的步驟S11至步驟S14。\n[0029] 步驟S10：獲取歷史配送地址。\n[0030] 步驟S11：確定初始詞庫。本實(shí)施例中采用查找重復(fù)串的方式來得到初始詞庫。首先去除預(yù)先指定的一些明顯不能代表地址的字、詞、字符等，例如“省”、“市”、“區(qū)”、“街”、“路”等。然后統(tǒng)計(jì)每個(gè)字在所有歷史配送地址中出現(xiàn)的次數(shù)，如果小于預(yù)設(shè)值，該字也被去除，其中數(shù)字和字母不參與統(tǒng)計(jì)。最后對(duì)于保留下來的字，進(jìn)行重復(fù)串查找，重復(fù)串長度預(yù)先設(shè)定，以重復(fù)串出現(xiàn)6次以上為例，將多條地址作為一項(xiàng)文本，該文本中各個(gè)字的位置如下：\n[0031] 北辰西路1號(hào)(11，12，13，14，15，16)\n[0032] 北辰西路1號(hào)(24，25，26，27，28，29)\n[0033] 北辰西路8號(hào)院(33，34，35，36，37，38，39)\n[0034] 北辰西路11號(hào)(41，42，43，44，45，46，47)\n[0035] 北辰西路1號(hào)(61，62，63，64，65，66)\n[0036] 北辰西路1號(hào)(83，84，85，86，87，88)\n[0037] 其中數(shù)字表示相應(yīng)的字在該文本中的位置，例如第一條地址中的“北”位于第11個(gè)字，“西”位于第13個(gè)字。\n[0038] 接下來建立樹并結(jié)合樹得到重復(fù)串。參考圖2，圖2是根據(jù)本發(fā)明實(shí)施例的樹的結(jié)構(gòu)的示意圖。在建立樹時(shí)，對(duì)每個(gè)節(jié)點(diǎn)包含“字、該字在各地址中的位置、樹的深度”，例如，在圖2中的樹20中，節(jié)點(diǎn)21中，字為“北”；該字在各地址中的位置為[11，24，33，41，61，83]；\n因?yàn)槭堑谝粋€(gè)節(jié)點(diǎn)，因此樹的深度為0。在樹增加節(jié)點(diǎn)時(shí)，要對(duì)該字的下一個(gè)字進(jìn)行等價(jià)類劃分，劃分結(jié)果如果某個(gè)等價(jià)類小于預(yù)設(shè)閾值，則該節(jié)點(diǎn)不能加入。最后用深度優(yōu)先原則處理，可采用堆棧來輔助實(shí)現(xiàn)，從而得到以“北”開頭的重復(fù)串長度為6次的“北辰西路”。\n[0039] 將歷史配送地址所有文本按上述方式處理，會(huì)得到多種重復(fù)串，并且同時(shí)出現(xiàn)大量實(shí)際內(nèi)容重復(fù)的地理名稱，這主要是由于書寫或錄入錯(cuò)誤引起，例如得到45個(gè)“北辰世紀(jì)中心”、48個(gè)“辰世紀(jì)中心”、49個(gè)“北辰世紀(jì)中”，此時(shí)可進(jìn)行去重處理。在允許冗余的情況下，對(duì)全字符串進(jìn)行根據(jù)前向排序和后向排序后去重，如上結(jié)果重復(fù)串中只提取出“北辰世紀(jì)中心”。至此得到初始詞庫。\n[0040] 步驟S12：對(duì)初始詞庫進(jìn)行過濾得到過濾詞庫。本實(shí)施例中對(duì)初始詞庫進(jìn)行二級(jí)過濾，其中第一級(jí)過濾為TF-IDF過濾，第二級(jí)過濾為熵過濾。在初始詞庫中，很多詞對(duì)于代表整個(gè)收貨地址來說沒有意義，例如“大廈13層”、“八單元”、“單元9**室”、“管理處”、“編輯部”、“小區(qū)**號(hào)樓”等詞在多個(gè)配送站都會(huì)出現(xiàn)，在本實(shí)施例中采用TF-IDF過濾將其過濾掉；又如“中關(guān)村”、“大屯路”、“奧運(yùn)村”這樣的詞所指的地理范圍不能代表具體的地理位置，并且一般是由多個(gè)配送員配送，在本實(shí)施例中采用熵過濾將其過濾掉。\n[0041] 在TF-IDF過濾中，將初始詞庫中各個(gè)詞在初始詞庫中的詞頻作為TF，將該詞在指定城市的所有地址中出現(xiàn)的詞頻作為IDF，計(jì)算二者比值即TF/IDF，該比值小于預(yù)設(shè)閾值時(shí)該詞被過濾掉，得到中間過濾詞庫。\n[0042] 在熵過濾中，按如下步驟1至步驟3進(jìn)行計(jì)算代表詞對(duì)應(yīng)的平均值，若步驟3中計(jì)算得到的平均值小于預(yù)選閾值，則舍棄該平均值大于預(yù)選閾值的代表詞并且再次執(zhí)行步驟1至步驟3，直至選擇的每個(gè)代表詞對(duì)應(yīng)的平均值小于預(yù)選閾值，然后將選擇的代表詞組成過濾詞庫：\n[0043] 步驟1：從每一個(gè)歷史配送地址中選擇代表詞，該代表詞屬于中間過濾詞庫，并且是該代表詞所在地址中的在中間過濾詞庫中詞頻最高的詞；\n[0044] 步驟2：對(duì)每個(gè)選擇的代表詞，按如下公式計(jì)算一日的熵：\n[0045]\n[0046] 其中T表示包含該選擇的代表詞的所有配送地址在該日對(duì)應(yīng)的配送員數(shù)目，P表示對(duì)應(yīng)的配送員中每個(gè)配送員在該日的配送地址數(shù)占該所有地址的比例；\n[0047] 步驟3：對(duì)每個(gè)選擇的代表詞，計(jì)算預(yù)設(shè)數(shù)目的多日的熵的平均值并作為該代表詞對(duì)應(yīng)的平均值。\n[0048] 步驟S13：對(duì)于過濾詞庫中的各個(gè)代表詞，按其對(duì)應(yīng)的配送地址的地理位置接近的原則對(duì)這些代表詞進(jìn)行聚類。根據(jù)以上步驟所做的操作，從統(tǒng)計(jì)上可以保證，每條地址提取在中間過濾詞庫中詞頻最高的詞作為代表詞由一個(gè)配送員進(jìn)行配送。每條地址的文本信息，通過分詞之后一條文本地址會(huì)對(duì)應(yīng)很多的地理名稱的詞。然后在通過詞過濾之后，提取的詞是代表定位配送范圍并且在一個(gè)配送區(qū)域內(nèi)有代表性的詞。例如地址“北京市西城區(qū)金融大街19號(hào)富凱大廈B座10層1005”中，“富凱大廈”就是有代表性的詞。前面的處理實(shí)際上是將所有的收貨地址的文本信息處理為一個(gè)詞來代替，如上例中的“富凱大廈”。但是同一個(gè)詞所代表的地址位置信息還是太細(xì)了，實(shí)際劃分的網(wǎng)格是多個(gè)詞的集合。一個(gè)詞的集合對(duì)應(yīng)著一個(gè)地址位置范圍，該范圍可認(rèn)為是網(wǎng)格劃分出來的一個(gè)格子。在步驟13中，主要是解決的是如何將多個(gè)代表詞聚合成一個(gè)代表網(wǎng)格區(qū)域的詞集合。\n[0049] 本實(shí)施例中，步驟13按如下步驟進(jìn)行：\n[0050] 步驟1：根據(jù)如下公式計(jì)算過濾詞庫中的所有代表詞兩兩之間的權(quán)重：\n[0051]\n[0052] 其中表示第i1個(gè)代表詞和第i2個(gè)代表詞之間的權(quán)重，L表示采樣天數(shù)，M表示在L天內(nèi)過濾詞庫中的所有代表詞所在的配送地址對(duì)應(yīng)的所有配送員的數(shù)目，aijk表示第k天，第i個(gè)代表詞所在的配送地址由第j個(gè)配送員配送的數(shù)量。\n[0053] 步驟2：對(duì)過濾詞庫中的所有詞按權(quán)重構(gòu)成鄰接矩陣，然后得出該鄰接矩陣對(duì)應(yīng)的拉普拉斯矩陣。\n[0054] 步驟3：將拉普拉斯矩陣的前K個(gè)最小的特征值對(duì)應(yīng)的特征向量排列組成N×K的矩陣，其中N表示過濾詞庫中的代表詞的數(shù)量。\n[0055] 步驟4：采用K-mans算法對(duì)N×K的矩陣按行進(jìn)行聚類，將聚類之后的同一類的行對(duì)應(yīng)的代表詞作為同一類的代表詞。因?yàn)槊恳恍械脑厥窃撔袑?duì)應(yīng)的代表詞與該行每一列對(duì)應(yīng)的代表詞之間的相關(guān)度，所以與其他詞的相關(guān)度較為接近的代表詞應(yīng)當(dāng)歸為同一類。\n[0056] 步驟S14：對(duì)于聚類得到的各類的代表詞，將每一類代表詞對(duì)應(yīng)的多個(gè)配送地址作為一個(gè)商品配送范圍。此時(shí)可以按類輸出各個(gè)代表詞，每一類形成一個(gè)商品配送范圍，在配送站直接按該商品配送范圍分揀貨物得到多組貨物，這樣每一組貨物就由一個(gè)配送員配送。\n[0057] 圖3是根據(jù)本發(fā)明實(shí)施例的確定商品配送范圍的裝置的基本結(jié)構(gòu)的示意圖。如圖3所示，確定商品配送范圍的裝置30主要包括初始詞庫模塊31、過濾模塊32、聚類模塊33、以及確定模塊34。\n[0058] 初始詞庫模塊31用于對(duì)于預(yù)選的包含配送員信息的多個(gè)歷史配送地址，使用查找重復(fù)串的方式確定多個(gè)代表詞得到初始詞庫；過濾模塊32用于對(duì)所述初始詞庫進(jìn)行過濾得到過濾詞庫；其中，使該過濾詞庫中的各個(gè)代表詞分別對(duì)應(yīng)一個(gè)或幾個(gè)配送地址，并且每個(gè)代表詞所在的配送地址由一個(gè)配送員配送；聚類模塊33用于對(duì)于過濾詞庫中的各個(gè)代表詞，按其對(duì)應(yīng)的配送地址的地理位置接近的原則對(duì)這些代表詞進(jìn)行聚類；確定模塊34用于對(duì)于聚類得到的各類的代表詞，將每一類代表詞對(duì)應(yīng)的多個(gè)配送地址作為一個(gè)商品配送范圍。\n[0059] 確定商品配送范圍的裝置30還可以包括去重模塊(圖中未示出)，用于對(duì)初始詞庫模塊得到的詞庫中的多個(gè)代表詞進(jìn)行去重處理。過濾模塊還可用于對(duì)初始詞庫進(jìn)行上述的第一級(jí)過濾和第二級(jí)過濾。聚類模塊33還可采用步驟S13中的步驟進(jìn)行處理。\n[0060] 根據(jù)本發(fā)明實(shí)施例的技術(shù)方案，獲取代表配送地址的代表詞，再對(duì)這些代表詞進(jìn)行聚類，使配送區(qū)域得以細(xì)化，配送區(qū)域被劃分為多個(gè)網(wǎng)格，每個(gè)網(wǎng)格有一個(gè)配送員，直接按網(wǎng)格就可以確定各個(gè)配送員的配送范圍，因此能夠高效地確定各個(gè)配送員的配送范圍，有助于提高配送速度。\n[0061] 以上結(jié)合具體實(shí)施例描述了本發(fā)明的基本原理，但是，需要指出的是，對(duì)本領(lǐng)域的普通技術(shù)人員而言，能夠理解本發(fā)明的方法和設(shè)備的全部或者任何步驟或者部件，可以在任何計(jì)算裝置(包括處理器、存儲(chǔ)介質(zhì)等)或者計(jì)算裝置的網(wǎng)絡(luò)中，以硬件、固件、軟件或者它們的組合加以實(shí)現(xiàn)，這是本領(lǐng)域普通技術(shù)人員在閱讀了本發(fā)明的說明的情況下運(yùn)用他們的基本編程技能就能實(shí)現(xiàn)的。\n[0062] 因此，本發(fā)明的目的還可以通過在任何計(jì)算裝置上運(yùn)行一個(gè)程序或者一組程序來實(shí)現(xiàn)。所述計(jì)算裝置可以是公知的通用裝置。因此，本發(fā)明的目的也可以僅僅通過提供包含實(shí)現(xiàn)所述方法或者裝置的程序代碼的程序產(chǎn)品來實(shí)現(xiàn)。也就是說，這樣的程序產(chǎn)品也構(gòu)成本發(fā)明，并且存儲(chǔ)有這樣的程序產(chǎn)品的存儲(chǔ)介質(zhì)也構(gòu)成本發(fā)明。顯然，所述存儲(chǔ)介質(zhì)可以是任何公知的存儲(chǔ)介質(zhì)或者將來開發(fā)出的任何存儲(chǔ)介質(zhì)。\n[0063] 還需要指出的是，在本發(fā)明的裝置和方法中，顯然，各部件或各步驟是可以分解和/或重新組合的。這些分解和/或重新組合應(yīng)視為本發(fā)明的等效方案。并且，執(zhí)行上述系列處理的步驟可以自然地按照說明的順序按時(shí)間順序執(zhí)行，但是并不需要一定按照時(shí)間順序執(zhí)行。某些步驟可以并行或彼此獨(dú)立地執(zhí)行。\n[0064] 上述具體實(shí)施方式，并不構(gòu)成對(duì)本發(fā)明保護(hù)范圍的限制。本領(lǐng)域技術(shù)人員應(yīng)該明白的是，取決于設(shè)計(jì)要求和其他因素，可以發(fā)生各種各樣的修改、組合、子組合和替代。任何在本發(fā)明的精神和原則之內(nèi)所作的修改、等同替換和改進(jìn)等，均應(yīng)包含在本發(fā)明保護(hù)范圍之內(nèi)。

我瀏覽過的專利

專利服務(wù)由北京酷愛智慧知識(shí)產(chǎn)權(quán)代理公司提供

<legend id="uycve"><table id="uycve"></table></legend>