基礎(chǔ)信息
權(quán)利要求
說明書
PDF全文
法律信息
引證文獻(xiàn)
著錄項(xiàng)信息
專利名稱 | 一種確定商品配送范圍的方法和裝置 |
申請(qǐng)?zhí)?/td> | CN201410427376.0 | 申請(qǐng)日期 | 2014-08-27 |
法律狀態(tài) | 授權(quán) | 申報(bào)國家 | 中國 |
公開/公告日 | 2014-12-10 | 公開/公告號(hào) | CN104200369A |
優(yōu)先權(quán) | 暫無 | 優(yōu)先權(quán)號(hào) | 暫無 |
主分類號(hào) | G06Q30/00 | IPC分類號(hào) | G;0;6;Q;3;0;/;0;0;;;G;0;6;Q;1;0;/;0;8;;;G;0;6;F;1;7;/;3;0查看分類表>
|
申請(qǐng)人 | 北京京東尚科信息技術(shù)有限公司;北京京東世紀(jì)貿(mào)易有限公司 | 申請(qǐng)人地址 | 北京市海淀區(qū)杏石口路65號(hào)西杉創(chuàng)意園四區(qū)11C樓東段1-4層西段1-4層
變更
專利地址、主體等相關(guān)變化,請(qǐng)及時(shí)變更,防止失效 |
權(quán)利人 | 北京京東尚科信息技術(shù)有限公司,北京京東世紀(jì)貿(mào)易有限公司 | 當(dāng)前權(quán)利人 | 北京京東尚科信息技術(shù)有限公司,北京京東世紀(jì)貿(mào)易有限公司 |
發(fā)明人 | 布如國;牟川;鐘超 |
代理機(jī)構(gòu) | 中原信達(dá)知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 | 代理人 | 劉光明;陸錦華 |
摘要
本發(fā)明提供一種確定商品配送范圍的方法和裝置,能夠比較高效地確定各個(gè)配送員的配送范圍,有助于提高配送速度。本發(fā)明的確定商品配送范圍的方法包括:步驟A:對(duì)于預(yù)選的包含配送員信息的多個(gè)歷史配送地址,使用查找重復(fù)串的方式確定初始詞庫;步驟B:對(duì)所述初始詞庫進(jìn)行過濾得到過濾詞庫;其中,使該過濾詞庫中的各個(gè)代表詞分別對(duì)應(yīng)一個(gè)或幾個(gè)配送地址,并且每個(gè)代表詞所在的配送地址由一個(gè)配送員配送;步驟C:對(duì)于所述過濾詞庫中的各個(gè)代表詞,按其對(duì)應(yīng)的配送地址的地理位置接近的原則對(duì)這些代表詞進(jìn)行聚類;步驟D:對(duì)于聚類得到的各類的代表詞,將每一類代表詞對(duì)應(yīng)的多個(gè)配送地址作為一個(gè)商品配送范圍。
1.一種確定商品配送范圍的方法,其特征在于,包括:
步驟A:對(duì)于預(yù)選的包含配送員信息的多個(gè)歷史配送地址,使用查找重復(fù)串的方式確定初始詞庫;
步驟B:對(duì)所述初始詞庫進(jìn)行二級(jí)過濾得到過濾詞庫;其中,第一級(jí)過濾濾除對(duì)所述歷史配送地址沒有意義的詞,第二級(jí)過濾濾除不能代表具體的地理位置的詞,使該過濾詞庫中的各個(gè)代表詞分別對(duì)應(yīng)一個(gè)或幾個(gè)配送地址,并且每個(gè)代表詞所在的配送地址由一個(gè)配送員配送;
步驟C:對(duì)于所述過濾詞庫中的各個(gè)代表詞,按其對(duì)應(yīng)的配送地址的地理位置接近的原則對(duì)這些代表詞進(jìn)行聚類;
步驟D:對(duì)于聚類得到的各類的代表詞,將每一類代表詞對(duì)應(yīng)的多個(gè)配送地址作為一個(gè)商品配送范圍;
所述步驟C包括:計(jì)算所述過濾詞庫中的所有代表詞兩兩之間的權(quán)重;對(duì)所述過濾詞庫中的所有詞按所述權(quán)重構(gòu)成鄰接矩陣,然后得出該鄰接矩陣對(duì)應(yīng)的拉普拉斯矩陣;將所述拉普拉斯矩陣的前K個(gè)最小的特征值對(duì)應(yīng)的特征向量排列組成N×K的矩陣,其中N表示所述過濾詞庫中的代表詞的數(shù)量;采用K-me?ans算法對(duì)所述N×K的矩陣按行進(jìn)行聚類,將聚類之后的同一類的行對(duì)應(yīng)的代表詞作為同一類的代表詞。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述步驟B之前,還包括:對(duì)步驟A中確定出的初始詞庫進(jìn)行去重處理。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟B中的過濾包括第一級(jí)過濾和第二級(jí)過濾;
所述第一級(jí)過濾包括:
計(jì)算所述初始詞庫中各個(gè)詞在所述初始詞庫中的詞頻與該詞在指定城市的所有地址中出現(xiàn)的詞頻的比值,取該比值大于預(yù)設(shè)閾值的詞構(gòu)成中間過濾詞庫;
所述第二級(jí)過濾包括:
按如下步驟1至步驟3進(jìn)行計(jì)算代表詞對(duì)應(yīng)的平均值,若步驟3中計(jì)算得到的平均值小于預(yù)選閾值,則舍棄該平均值大于預(yù)選閾值的代表詞并且再次執(zhí)行步驟1至步驟3,直至選擇的每個(gè)代表詞對(duì)應(yīng)的所述平均值小于所述預(yù)選閾值,然后將選擇的代表詞組成所述過濾詞庫:
步驟1:從每一個(gè)所述歷史配送地址中選擇代表詞,該代表詞屬于所述中間過濾詞庫,并且是該代表詞所在地址中的在所述中間過濾詞庫中詞頻最高的詞;
步驟2:對(duì)每個(gè)選擇的代表詞,按如下公式計(jì)算一日的熵:
其中T表示包含該選擇的代表詞的所有配送地址在該日對(duì)應(yīng)的配送員數(shù)目,P表示所述對(duì)應(yīng)的配送員中每個(gè)配送員在該日的配送地址數(shù)占該所有地址的比例;
步驟3:對(duì)每個(gè)選擇的代表詞,計(jì)算預(yù)設(shè)數(shù)目的多日的熵的平均值并作為該代表詞對(duì)應(yīng)的平均值。
4.根據(jù)權(quán)利要求1至3中任一項(xiàng)所述的方法,其特征在于,
根據(jù)如下公式計(jì)算所述過濾詞庫中的所有代表詞兩兩之間的權(quán)重:
其中 表示第i1個(gè)代表詞和第i2個(gè)代表詞之間的權(quán)重,L表示采樣天數(shù),M表示在L天內(nèi)所述過濾詞庫中的所有代表詞所在的配送地址對(duì)應(yīng)的所有配送員的數(shù)目,aijk表示第k天,第i個(gè)代表詞所在的配送地址由第j個(gè)配送員配送的數(shù)量。
5.一種確定商品配送范圍的裝置,其特征在于,包括:
初始詞庫模塊,用于對(duì)于預(yù)選的包含配送員信息的多個(gè)歷史配送地址,使用查找重復(fù)串的方式確定多個(gè)代表詞得到初始詞庫;
過濾模塊,用于對(duì)所述初始詞庫進(jìn)行二級(jí)過濾得到過濾詞庫;其中,第一級(jí)過濾濾除對(duì)所述歷史配送地址沒有意義的詞,第二級(jí)過濾濾除不能代表具體的地理位置的詞,使該過濾詞庫中的各個(gè)代表詞分別對(duì)應(yīng)一個(gè)或幾個(gè)配送地址,并且每個(gè)代表詞所在的配送地址由一個(gè)配送員配送;
聚類模塊,用于對(duì)于所述過濾詞庫中的各個(gè)代表詞,按其對(duì)應(yīng)的配送地址的地理位置接近的原則對(duì)這些代表詞進(jìn)行聚類;
確定模塊,用于對(duì)于聚類得到的各類的代表詞,將每一類代表詞對(duì)應(yīng)的多個(gè)配送地址作為一個(gè)商品配送范圍;
所述聚類模塊還用于:計(jì)算所述過濾詞庫中的所有代表詞兩兩之間的權(quán)重:對(duì)所述過濾詞庫中的所有詞按所述權(quán)重構(gòu)成鄰接矩陣,然后得出該鄰接矩陣對(duì)應(yīng)的拉普拉斯矩陣;
將所述拉普拉斯矩陣的前K個(gè)最小的特征值對(duì)應(yīng)的特征向量排列組成N×K的矩陣,其中N表示所述過濾詞庫中的代表詞的數(shù)量;采用K-me?ans算法對(duì)所述N×K的矩陣按行進(jìn)行聚類,將聚類之后的同一類的行對(duì)應(yīng)的代表詞作為同一類的代表詞。
6.根據(jù)權(quán)利要求5所述的裝置,其特征在于,還包括去重模塊,用于對(duì)所述初始詞庫模塊得到的詞庫中的多個(gè)代表詞進(jìn)行去重處理。
7.根據(jù)權(quán)利要求5所述的裝置,其特征在于,所述過濾模塊還用于對(duì)所述初始詞庫進(jìn)行第一級(jí)過濾和第二級(jí)過濾;
所述第一級(jí)過濾包括:
計(jì)算所述初始詞庫中各個(gè)詞在所述初始詞庫中的詞頻與該詞在指定城市的所有地址中出現(xiàn)的詞頻的比值,取該比值大于預(yù)設(shè)閾值的詞構(gòu)成中間過濾詞庫;
所述第二級(jí)過濾包括:
按如下步驟1至步驟3進(jìn)行計(jì)算代表詞對(duì)應(yīng)的平均值,若步驟3?中計(jì)算得到的平均值小于預(yù)選閾值,則舍棄該平均值大于預(yù)選閾值的代表詞并且再次執(zhí)行步驟1至步驟3,直至選擇的每個(gè)代表詞對(duì)應(yīng)的所述平均值小于所述預(yù)選閾值,然后將選擇的代表詞組成所述過濾詞庫:
步驟1:從每一個(gè)所述歷史配送地址中選擇代表詞,該代表詞屬于所述中間過濾詞庫,并且是該代表詞所在地址中的在所述中間過濾詞庫中詞頻最高的詞;
步驟2:對(duì)每個(gè)選擇的代表詞,按如下公式計(jì)算一日的熵:
其中T表示包含該選擇的代表詞的所有配送地址在該日對(duì)應(yīng)的配送員數(shù)目,P表示所述對(duì)應(yīng)的配送員中每個(gè)配送員在該日的配送地址數(shù)占該所有地址的比例;
步驟3:對(duì)每個(gè)選擇的代表詞,計(jì)算預(yù)設(shè)數(shù)目的多日的熵的平均值并作為該代表詞對(duì)應(yīng)的平均值。
8.根據(jù)權(quán)利要求5所述的裝置,其特征在于,所述聚類模塊還用于:
根據(jù)如下公式計(jì)算所述過濾詞庫中的所有代表詞兩兩之間的權(quán)重:
其中 表示第i1個(gè)代表詞和第i2個(gè)代表詞之間的權(quán)重,L表示采樣天數(shù),M表示在L天內(nèi)所述過濾詞庫中的所有代表詞所在的配送地址對(duì)應(yīng)的所有配送員的數(shù)目,aijk表示第k天,第i個(gè)代表詞所在的配送地址由第j個(gè)配送員配送的數(shù)量。
9.一種電子設(shè)備,其特征在于,包括:
一個(gè)或多個(gè)處理器;
存儲(chǔ)裝置,用于存儲(chǔ)一個(gè)或多個(gè)程序,
當(dāng)所述一個(gè)或多個(gè)程序被所述一個(gè)或多個(gè)處理器執(zhí)行,使得所述一個(gè)或多個(gè)處理器實(shí)現(xiàn)如權(quán)利要求1-4中任一所述的方法。
10.一種計(jì)算機(jī)可讀介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1-4中任一所述的方法。
一種確定商品配送范圍的方法和裝置\n技術(shù)領(lǐng)域\n[0001] 本發(fā)明涉及計(jì)算機(jī)技術(shù)領(lǐng)域,特別地涉及一種確定商品配送范圍的方法和裝置。\n背景技術(shù)\n[0002] 隨著電子商務(wù)的不斷發(fā)展,網(wǎng)上購物成為越來越常見的購物方式。在網(wǎng)上購物之后,商品將被配送員送達(dá)用戶指定的配送地址。各個(gè)配送員各自負(fù)責(zé)不同的配送范圍,配送范圍是多個(gè)配送地址組成的集合。商品在配送站要經(jīng)過人工分揀,使配送員確定屬于自己負(fù)責(zé)的配送范圍的商品。這種人工分揀的效率比較低,影響了配送速度。\n發(fā)明內(nèi)容\n[0003] 有鑒于此,本發(fā)明提供一種確定商品配送范圍的方法和裝置,能夠比較高效地確定各個(gè)配送員的配送范圍,有助于提高配送速度。\n[0004] 為實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的一個(gè)方面,提供了一種確定商品配送范圍的方法。\n[0005] 本發(fā)明的確定商品配送范圍的方法包括:步驟A:對(duì)于預(yù)選的包含配送員信息的多個(gè)歷史配送地址,使用查找重復(fù)串的方式確定初始詞庫;步驟B:對(duì)所述初始詞庫進(jìn)行過濾得到過濾詞庫;其中,使該過濾詞庫中的各個(gè)代表詞分別對(duì)應(yīng)一個(gè)或幾個(gè)配送地址,并且每個(gè)代表詞所在的配送地址由一個(gè)配送員配送;步驟C:對(duì)于所述過濾詞庫中的各個(gè)代表詞,按其對(duì)應(yīng)的配送地址的地理位置接近的原則對(duì)這些代表詞進(jìn)行聚類;步驟D:對(duì)于聚類得到的各類的代表詞,將每一類代表詞對(duì)應(yīng)的多個(gè)配送地址作為一個(gè)商品配送范圍。\n[0006] 可選地,在所述步驟B之前,還包括:對(duì)步驟A中確定出的初始詞庫進(jìn)行去重處理。\n[0007] 可選地,所述步驟B中的過濾包括第一級(jí)過濾和第二級(jí)過濾;所述第一級(jí)過濾包括:計(jì)算所述初始詞庫中各個(gè)詞在所述初始詞庫中的詞頻與該詞在指定城市的所有地址中出現(xiàn)的詞頻的比值,取該比值大于預(yù)設(shè)閾值的詞構(gòu)成中間過濾詞庫;所述第二級(jí)過濾包括:\n按如下步驟1至步驟3進(jìn)行計(jì)算代表詞對(duì)應(yīng)的平均值,若步驟3中計(jì)算得到的平均值小于預(yù)選閾值,則舍棄該平均值大于預(yù)選閾值的代表詞并且再次執(zhí)行步驟1至步驟3,直至選擇的每個(gè)代表詞對(duì)應(yīng)的所述平均值小于所述預(yù)選閾值,然后將選擇的代表詞組成所述過濾詞庫:步驟1:從每一個(gè)所述歷史配送地址中選擇代表詞,該代表詞屬于所述中間過濾詞庫,并且是該代表詞所在地址中的在所述中間過濾詞庫中詞頻最高的詞;步驟2:對(duì)每個(gè)選擇的代表詞,按如下公式計(jì)算一日的熵:\n[0008]\n[0009] 其中T表示包含該選擇的代表詞的所有配送地址在該日對(duì)應(yīng)的配送員數(shù)目,P表示所述對(duì)應(yīng)的配送員中每個(gè)配送員在該日的配送地址數(shù)占該所有地址的比例;步驟3:對(duì)每個(gè)選擇的代表詞,計(jì)算預(yù)設(shè)數(shù)目的多日的熵的平均值并作為該代表詞對(duì)應(yīng)的平均值。\n[0010] 可選地,所述步驟C包括:根據(jù)如下公式計(jì)算所述過濾詞庫中的所有代表詞兩兩之間的權(quán)重:\n[0011]\n[0012] 其中 表示第i1個(gè)代表詞和第i2個(gè)代表詞之間的權(quán)重,L表示采樣天數(shù),M表示在L天內(nèi)所述過濾詞庫中的所有代表詞所在的配送地址對(duì)應(yīng)的所有配送員的數(shù)目,aijk表示第k天,第i個(gè)代表詞所在的配送地址由第j個(gè)配送員配送的數(shù)量;對(duì)所述過濾詞庫中的所有詞按所述權(quán)重構(gòu)成鄰接矩陣,然后得出該鄰接矩陣對(duì)應(yīng)的拉普拉斯矩陣;將所述拉普拉斯矩陣的前K個(gè)最小的特征值對(duì)應(yīng)的特征向量排列組成N×K的矩陣,其中N表示所述過濾詞庫中的代表詞的數(shù)量;采用K-mans算法對(duì)所述N×K的矩陣按行進(jìn)行聚類,將聚類之后的同一類的行對(duì)應(yīng)的代表詞作為同一類的代表詞。\n[0013] 根據(jù)本發(fā)明的另一方面,提供了一種確定商品配送范圍的裝置。\n[0014] 本發(fā)明的確定商品配送范圍的裝置包括:初始詞庫模塊,用于對(duì)于預(yù)選的包含配送員信息的多個(gè)歷史配送地址,使用查找重復(fù)串的方式確定多個(gè)代表詞得到初始詞庫;過濾模塊,用于對(duì)所述初始詞庫進(jìn)行過濾得到過濾詞庫;其中,使該過濾詞庫中的各個(gè)代表詞分別對(duì)應(yīng)一個(gè)或幾個(gè)配送地址,并且每個(gè)代表詞所在的配送地址由一個(gè)配送員配送;聚類模塊,用于對(duì)于所述過濾詞庫中的各個(gè)代表詞,按其對(duì)應(yīng)的配送地址的地理位置接近的原則對(duì)這些代表詞進(jìn)行聚類;確定模塊,用于對(duì)于聚類得到的各類的代表詞,將每一類代表詞對(duì)應(yīng)的多個(gè)配送地址作為一個(gè)商品配送范圍。\n[0015] 可選地,還包括去重模塊,用于對(duì)所述初始詞庫模塊得到的詞庫中的多個(gè)代表詞進(jìn)行去重處理。\n[0016] 可選地,所述過濾模塊還用于對(duì)所述初始詞庫進(jìn)行第一級(jí)過濾和第二級(jí)過濾;所述第一級(jí)過濾包括:計(jì)算所述初始詞庫中各個(gè)詞在所述初始詞庫中的詞頻與該詞在指定城市的所有地址中出現(xiàn)的詞頻的比值,取該比值大于預(yù)設(shè)閾值的詞構(gòu)成中間過濾詞庫;所述第二級(jí)過濾包括:按如下步驟1至步驟3進(jìn)行計(jì)算代表詞對(duì)應(yīng)的平均值,若步驟3中計(jì)算得到的平均值小于預(yù)選閾值,則舍棄該平均值大于預(yù)選閾值的代表詞并且再次執(zhí)行步驟1至步驟3,直至選擇的每個(gè)代表詞對(duì)應(yīng)的所述平均值小于所述預(yù)選閾值,然后將選擇的代表詞組成所述過濾詞庫:步驟1:從每一個(gè)所述歷史配送地址中選擇代表詞,該代表詞屬于所述中間過濾詞庫,并且是該代表詞所在地址中的在所述中間過濾詞庫中詞頻最高的詞;步驟2:\n對(duì)每個(gè)選擇的代表詞,按如下公式計(jì)算一日的熵:\n[0017]\n[0018] 其中T表示包含該選擇的代表詞的所有配送地址在該日對(duì)應(yīng)的配送員數(shù)目,P表示所述對(duì)應(yīng)的配送員中每個(gè)配送員在該日的配送地址數(shù)占該所有地址的比例;步驟3:對(duì)每個(gè)選擇的代表詞,計(jì)算預(yù)設(shè)數(shù)目的多日的熵的平均值并作為該代表詞對(duì)應(yīng)的平均值。\n[0019] 可選地,所述聚類模塊還用于:根據(jù)如下公式計(jì)算所述過濾詞庫中的所有代表詞兩兩之間的權(quán)重:\n[0020]\n[0021] 其中 表示第i1個(gè)代表詞和第i2個(gè)代表詞之間的權(quán)重,L表示采樣天數(shù),M表示在L天內(nèi)所述過濾詞庫中的所有代表詞所在的配送地址對(duì)應(yīng)的所有配送員的數(shù)目,aijk表示第k天,第i個(gè)代表詞所在的配送地址由第j個(gè)配送員配送的數(shù)量;對(duì)所述過濾詞庫中的所有詞按所述權(quán)重構(gòu)成鄰接矩陣,然后得出該鄰接矩陣對(duì)應(yīng)的拉普拉斯矩陣;將所述拉普拉斯矩陣的前K個(gè)最小的特征值對(duì)應(yīng)的特征向量排列組成N×K的矩陣,其中N表示所述過濾詞庫中的代表詞的數(shù)量;采用K-mans算法對(duì)所述N×K的矩陣按行進(jìn)行聚類,將聚類之后的同一類的行對(duì)應(yīng)的代表詞作為同一類的代表詞。\n[0022] 根據(jù)本發(fā)明的技術(shù)方案,獲取代表配送地址的代表詞,再對(duì)這些代表詞進(jìn)行聚類,使配送區(qū)域得以細(xì)化,配送區(qū)域被劃分為多個(gè)網(wǎng)格,每個(gè)網(wǎng)格有一個(gè)配送員,直接按網(wǎng)格就可以確定各個(gè)配送員的配送范圍,因此能夠高效地確定各個(gè)配送員的配送范圍,有助于提高配送速度。\n附圖說明\n[0023] 附圖用于更好地理解本發(fā)明,不構(gòu)成對(duì)本發(fā)明的不當(dāng)限定。其中:\n[0024] 圖1是根據(jù)本發(fā)明實(shí)施例的確定商品配送范圍的方法的主要步驟的示意圖;\n[0025] 圖2是根據(jù)本發(fā)明實(shí)施例的樹的結(jié)構(gòu)的示意圖;\n[0026] 圖3是根據(jù)本發(fā)明實(shí)施例的確定商品配送范圍的裝置的基本結(jié)構(gòu)的示意圖。\n具體實(shí)施方式\n[0027] 以下結(jié)合附圖對(duì)本發(fā)明的示范性實(shí)施例做出說明,其中包括本發(fā)明實(shí)施例的各種細(xì)節(jié)以助于理解,應(yīng)當(dāng)將它們認(rèn)為僅僅是示范性的。因此,本領(lǐng)域普通技術(shù)人員應(yīng)當(dāng)認(rèn)識(shí)到,可以對(duì)這里描述的實(shí)施例做出各種改變和修改,而不會(huì)背離本發(fā)明的范圍和精神。同樣,為了清楚和簡明,以下的描述中省略了對(duì)公知功能和結(jié)構(gòu)的描述。\n[0028] 在本發(fā)明實(shí)施例中,根據(jù)歷史配送地址,將配送區(qū)域劃分為多個(gè)網(wǎng)格,每個(gè)網(wǎng)格由一名配送員進(jìn)行配送。歷史配送地址是歷史中的一段時(shí)間(幾周或兩三個(gè)月)的配送信息,其中包含配送員信息,即哪個(gè)配送員在哪天配送了哪些地址。圖1是根據(jù)本發(fā)明實(shí)施例的確定商品配送范圍的方法的主要步驟的示意圖。如圖1所示,該方法主要包括如下的步驟S11至步驟S14。\n[0029] 步驟S10:獲取歷史配送地址。\n[0030] 步驟S11:確定初始詞庫。本實(shí)施例中采用查找重復(fù)串的方式來得到初始詞庫。首先去除預(yù)先指定的一些明顯不能代表地址的字、詞、字符等,例如“省”、“市”、“區(qū)”、“街”、“路”等。然后統(tǒng)計(jì)每個(gè)字在所有歷史配送地址中出現(xiàn)的次數(shù),如果小于預(yù)設(shè)值,該字也被去除,其中數(shù)字和字母不參與統(tǒng)計(jì)。最后對(duì)于保留下來的字,進(jìn)行重復(fù)串查找,重復(fù)串長度預(yù)先設(shè)定,以重復(fù)串出現(xiàn)6次以上為例,將多條地址作為一項(xiàng)文本,該文本中各個(gè)字的位置如下:\n[0031] 北辰西路1號(hào)(11,12,13,14,15,16)\n[0032] 北辰西路1號(hào)(24,25,26,27,28,29)\n[0033] 北辰西路8號(hào)院(33,34,35,36,37,38,39)\n[0034] 北辰西路11號(hào)(41,42,43,44,45,46,47)\n[0035] 北辰西路1號(hào)(61,62,63,64,65,66)\n[0036] 北辰西路1號(hào)(83,84,85,86,87,88)\n[0037] 其中數(shù)字表示相應(yīng)的字在該文本中的位置,例如第一條地址中的“北”位于第11個(gè)字,“西”位于第13個(gè)字。\n[0038] 接下來建立樹并結(jié)合樹得到重復(fù)串。參考圖2,圖2是根據(jù)本發(fā)明實(shí)施例的樹的結(jié)構(gòu)的示意圖。在建立樹時(shí),對(duì)每個(gè)節(jié)點(diǎn)包含“字、該字在各地址中的位置、樹的深度”,例如,在圖2中的樹20中,節(jié)點(diǎn)21中,字為“北”;該字在各地址中的位置為[11,24,33,41,61,83];\n因?yàn)槭堑谝粋€(gè)節(jié)點(diǎn),因此樹的深度為0。在樹增加節(jié)點(diǎn)時(shí),要對(duì)該字的下一個(gè)字進(jìn)行等價(jià)類劃分,劃分結(jié)果如果某個(gè)等價(jià)類小于預(yù)設(shè)閾值,則該節(jié)點(diǎn)不能加入。最后用深度優(yōu)先原則處理,可采用堆棧來輔助實(shí)現(xiàn),從而得到以“北”開頭的重復(fù)串長度為6次的“北辰西路”。\n[0039] 將歷史配送地址所有文本按上述方式處理,會(huì)得到多種重復(fù)串,并且同時(shí)出現(xiàn)大量實(shí)際內(nèi)容重復(fù)的地理名稱,這主要是由于書寫或錄入錯(cuò)誤引起,例如得到45個(gè)“北辰世紀(jì)中心”、48個(gè)“辰世紀(jì)中心”、49個(gè)“北辰世紀(jì)中”,此時(shí)可進(jìn)行去重處理。在允許冗余的情況下,對(duì)全字符串進(jìn)行根據(jù)前向排序和后向排序后去重,如上結(jié)果重復(fù)串中只提取出“北辰世紀(jì)中心”。至此得到初始詞庫。\n[0040] 步驟S12:對(duì)初始詞庫進(jìn)行過濾得到過濾詞庫。本實(shí)施例中對(duì)初始詞庫進(jìn)行二級(jí)過濾,其中第一級(jí)過濾為TF-IDF過濾,第二級(jí)過濾為熵過濾。在初始詞庫中,很多詞對(duì)于代表整個(gè)收貨地址來說沒有意義,例如“大廈13層”、“八單元”、“單元9**室”、“管理處”、“編輯部”、“小區(qū)**號(hào)樓”等詞在多個(gè)配送站都會(huì)出現(xiàn),在本實(shí)施例中采用TF-IDF過濾將其過濾掉;又如“中關(guān)村”、“大屯路”、“奧運(yùn)村”這樣的詞所指的地理范圍不能代表具體的地理位置,并且一般是由多個(gè)配送員配送,在本實(shí)施例中采用熵過濾將其過濾掉。\n[0041] 在TF-IDF過濾中,將初始詞庫中各個(gè)詞在初始詞庫中的詞頻作為TF,將該詞在指定城市的所有地址中出現(xiàn)的詞頻作為IDF,計(jì)算二者比值即TF/IDF,該比值小于預(yù)設(shè)閾值時(shí)該詞被過濾掉,得到中間過濾詞庫。\n[0042] 在熵過濾中,按如下步驟1至步驟3進(jìn)行計(jì)算代表詞對(duì)應(yīng)的平均值,若步驟3中計(jì)算得到的平均值小于預(yù)選閾值,則舍棄該平均值大于預(yù)選閾值的代表詞并且再次執(zhí)行步驟1至步驟3,直至選擇的每個(gè)代表詞對(duì)應(yīng)的平均值小于預(yù)選閾值,然后將選擇的代表詞組成過濾詞庫:\n[0043] 步驟1:從每一個(gè)歷史配送地址中選擇代表詞,該代表詞屬于中間過濾詞庫,并且是該代表詞所在地址中的在中間過濾詞庫中詞頻最高的詞;\n[0044] 步驟2:對(duì)每個(gè)選擇的代表詞,按如下公式計(jì)算一日的熵:\n[0045]\n[0046] 其中T表示包含該選擇的代表詞的所有配送地址在該日對(duì)應(yīng)的配送員數(shù)目,P表示對(duì)應(yīng)的配送員中每個(gè)配送員在該日的配送地址數(shù)占該所有地址的比例;\n[0047] 步驟3:對(duì)每個(gè)選擇的代表詞,計(jì)算預(yù)設(shè)數(shù)目的多日的熵的平均值并作為該代表詞對(duì)應(yīng)的平均值。\n[0048] 步驟S13:對(duì)于過濾詞庫中的各個(gè)代表詞,按其對(duì)應(yīng)的配送地址的地理位置接近的原則對(duì)這些代表詞進(jìn)行聚類。根據(jù)以上步驟所做的操作,從統(tǒng)計(jì)上可以保證,每條地址提取在中間過濾詞庫中詞頻最高的詞作為代表詞由一個(gè)配送員進(jìn)行配送。每條地址的文本信息,通過分詞之后一條文本地址會(huì)對(duì)應(yīng)很多的地理名稱的詞。然后在通過詞過濾之后,提取的詞是代表定位配送范圍并且在一個(gè)配送區(qū)域內(nèi)有代表性的詞。例如地址“北京市西城區(qū)金融大街19號(hào)富凱大廈B座10層1005”中,“富凱大廈”就是有代表性的詞。前面的處理實(shí)際上是將所有的收貨地址的文本信息處理為一個(gè)詞來代替,如上例中的“富凱大廈”。但是同一個(gè)詞所代表的地址位置信息還是太細(xì)了,實(shí)際劃分的網(wǎng)格是多個(gè)詞的集合。一個(gè)詞的集合對(duì)應(yīng)著一個(gè)地址位置范圍,該范圍可認(rèn)為是網(wǎng)格劃分出來的一個(gè)格子。在步驟13中,主要是解決的是如何將多個(gè)代表詞聚合成一個(gè)代表網(wǎng)格區(qū)域的詞集合。\n[0049] 本實(shí)施例中,步驟13按如下步驟進(jìn)行:\n[0050] 步驟1:根據(jù)如下公式計(jì)算過濾詞庫中的所有代表詞兩兩之間的權(quán)重:\n[0051]\n[0052] 其中 表示第i1個(gè)代表詞和第i2個(gè)代表詞之間的權(quán)重,L表示采樣天數(shù),M表示在L天內(nèi)過濾詞庫中的所有代表詞所在的配送地址對(duì)應(yīng)的所有配送員的數(shù)目,aijk表示第k天,第i個(gè)代表詞所在的配送地址由第j個(gè)配送員配送的數(shù)量。\n[0053] 步驟2:對(duì)過濾詞庫中的所有詞按權(quán)重構(gòu)成鄰接矩陣,然后得出該鄰接矩陣對(duì)應(yīng)的拉普拉斯矩陣。\n[0054] 步驟3:將拉普拉斯矩陣的前K個(gè)最小的特征值對(duì)應(yīng)的特征向量排列組成N×K的矩陣,其中N表示過濾詞庫中的代表詞的數(shù)量。\n[0055] 步驟4:采用K-mans算法對(duì)N×K的矩陣按行進(jìn)行聚類,將聚類之后的同一類的行對(duì)應(yīng)的代表詞作為同一類的代表詞。因?yàn)槊恳恍械脑厥窃撔袑?duì)應(yīng)的代表詞與該行每一列對(duì)應(yīng)的代表詞之間的相關(guān)度,所以與其他詞的相關(guān)度較為接近的代表詞應(yīng)當(dāng)歸為同一類。\n[0056] 步驟S14:對(duì)于聚類得到的各類的代表詞,將每一類代表詞對(duì)應(yīng)的多個(gè)配送地址作為一個(gè)商品配送范圍。此時(shí)可以按類輸出各個(gè)代表詞,每一類形成一個(gè)商品配送范圍,在配送站直接按該商品配送范圍分揀貨物得到多組貨物,這樣每一組貨物就由一個(gè)配送員配送。\n[0057] 圖3是根據(jù)本發(fā)明實(shí)施例的確定商品配送范圍的裝置的基本結(jié)構(gòu)的示意圖。如圖3所示,確定商品配送范圍的裝置30主要包括初始詞庫模塊31、過濾模塊32、聚類模塊33、以及確定模塊34。\n[0058] 初始詞庫模塊31用于對(duì)于預(yù)選的包含配送員信息的多個(gè)歷史配送地址,使用查找重復(fù)串的方式確定多個(gè)代表詞得到初始詞庫;過濾模塊32用于對(duì)所述初始詞庫進(jìn)行過濾得到過濾詞庫;其中,使該過濾詞庫中的各個(gè)代表詞分別對(duì)應(yīng)一個(gè)或幾個(gè)配送地址,并且每個(gè)代表詞所在的配送地址由一個(gè)配送員配送;聚類模塊33用于對(duì)于過濾詞庫中的各個(gè)代表詞,按其對(duì)應(yīng)的配送地址的地理位置接近的原則對(duì)這些代表詞進(jìn)行聚類;確定模塊34用于對(duì)于聚類得到的各類的代表詞,將每一類代表詞對(duì)應(yīng)的多個(gè)配送地址作為一個(gè)商品配送范圍。\n[0059] 確定商品配送范圍的裝置30還可以包括去重模塊(圖中未示出),用于對(duì)初始詞庫模塊得到的詞庫中的多個(gè)代表詞進(jìn)行去重處理。過濾模塊還可用于對(duì)初始詞庫進(jìn)行上述的第一級(jí)過濾和第二級(jí)過濾。聚類模塊33還可采用步驟S13中的步驟進(jìn)行處理。\n[0060] 根據(jù)本發(fā)明實(shí)施例的技術(shù)方案,獲取代表配送地址的代表詞,再對(duì)這些代表詞進(jìn)行聚類,使配送區(qū)域得以細(xì)化,配送區(qū)域被劃分為多個(gè)網(wǎng)格,每個(gè)網(wǎng)格有一個(gè)配送員,直接按網(wǎng)格就可以確定各個(gè)配送員的配送范圍,因此能夠高效地確定各個(gè)配送員的配送范圍,有助于提高配送速度。\n[0061] 以上結(jié)合具體實(shí)施例描述了本發(fā)明的基本原理,但是,需要指出的是,對(duì)本領(lǐng)域的普通技術(shù)人員而言,能夠理解本發(fā)明的方法和設(shè)備的全部或者任何步驟或者部件,可以在任何計(jì)算裝置(包括處理器、存儲(chǔ)介質(zhì)等)或者計(jì)算裝置的網(wǎng)絡(luò)中,以硬件、固件、軟件或者它們的組合加以實(shí)現(xiàn),這是本領(lǐng)域普通技術(shù)人員在閱讀了本發(fā)明的說明的情況下運(yùn)用他們的基本編程技能就能實(shí)現(xiàn)的。\n[0062] 因此,本發(fā)明的目的還可以通過在任何計(jì)算裝置上運(yùn)行一個(gè)程序或者一組程序來實(shí)現(xiàn)。所述計(jì)算裝置可以是公知的通用裝置。因此,本發(fā)明的目的也可以僅僅通過提供包含實(shí)現(xiàn)所述方法或者裝置的程序代碼的程序產(chǎn)品來實(shí)現(xiàn)。也就是說,這樣的程序產(chǎn)品也構(gòu)成本發(fā)明,并且存儲(chǔ)有這樣的程序產(chǎn)品的存儲(chǔ)介質(zhì)也構(gòu)成本發(fā)明。顯然,所述存儲(chǔ)介質(zhì)可以是任何公知的存儲(chǔ)介質(zhì)或者將來開發(fā)出的任何存儲(chǔ)介質(zhì)。\n[0063] 還需要指出的是,在本發(fā)明的裝置和方法中,顯然,各部件或各步驟是可以分解和/或重新組合的。這些分解和/或重新組合應(yīng)視為本發(fā)明的等效方案。并且,執(zhí)行上述系列處理的步驟可以自然地按照說明的順序按時(shí)間順序執(zhí)行,但是并不需要一定按照時(shí)間順序執(zhí)行。某些步驟可以并行或彼此獨(dú)立地執(zhí)行。\n[0064] 上述具體實(shí)施方式,并不構(gòu)成對(duì)本發(fā)明保護(hù)范圍的限制。本領(lǐng)域技術(shù)人員應(yīng)該明白的是,取決于設(shè)計(jì)要求和其他因素,可以發(fā)生各種各樣的修改、組合、子組合和替代。任何在本發(fā)明的精神和原則之內(nèi)所作的修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明保護(hù)范圍之內(nèi)。
法律信息
- 2019-12-31
- 2015-01-07
實(shí)質(zhì)審查的生效
IPC(主分類): G06Q 30/00
專利申請(qǐng)?zhí)? 201410427376.0
申請(qǐng)日: 2014.08.27
- 2014-12-10
引用專利(該專利引用了哪些專利)
序號(hào) | 公開(公告)號(hào) | 公開(公告)日 | 申請(qǐng)日 | 專利名稱 | 申請(qǐng)人 |
1
| |
2014-04-02
|
2013-12-26
| | |
2
| |
2013-12-11
|
2013-08-27
| | |
3
| |
2011-12-21
|
2011-07-22
| | |
4
| |
2013-12-25
|
2013-09-06
| | |
被引用專利(該專利被哪些專利引用)
序號(hào) | 公開(公告)號(hào) | 公開(公告)日 | 申請(qǐng)日 | 專利名稱 | 申請(qǐng)人 | 該專利沒有被任何外部專利所引用! |