• / 11
  • 下載費用:30 金幣  

數據用量預測裝置、方法及其電腦程序產品.pdf

摘要
申請專利號:

CN201510916761.6

申請日:

2015.12.10

公開號:

CN105468774A

公開日:

2016.04.06

當前法律狀態:

實審

有效性:

審中

法律詳情: 實質審查的生效IPC(主分類):G06F 17/30申請日:20151210|||公開
IPC分類號: G06F17/30 主分類號: G06F17/30
申請人: 中華電信股份有限公司
發明人: 賴岳廷; 陳志華; 吳雅萍; 余家璿; 呂芳森
地址: 中國臺灣桃園縣楊梅市電研路99號
優先權: 104121968 2015.07.07 TW
專利代理機構: 廣州華進聯合專利商標代理有限公司44224 代理人: 黃曉慶
PDF完整版下載: PDF下載
法律狀態
申請(專利)號:

CN201510916761.6

授權公告號:

|||

法律狀態公告日:

2016.05.04|||2016.04.06

法律狀態類型:

實質審查的生效|||公開

摘要

本發明提供一種數據用量預測裝置、方法及其電腦程序產品。前述的數據用量預測裝置包含存取外部的數據庫,其數據庫包含復數筆數據集合,其中數據集合包含目標數據集合以及復數筆對比數據集合,而目標數據集合以及對比數據集合分別包含復數個期間記錄數據。該裝置并依據目標數據集合的N個期間記錄數據值以及各對比數據集合的N個期間記錄數據值以提供復數個向量距離值,又依據向量距離值以選取K個對比數據集合中的第T個期間記錄數據值,并依據K個的第T個期間記錄數據進行加權平均,以提供目標數據集合的第T個期間記錄數據的數據用量預測值。

權利要求書

1.一種數據用量預測裝置,其特征在于,包含:存取外部的數據庫,該數據庫包含復數
筆數據集合,其中該數據集合包含目標數據集合以及復數筆對比數據集合,而該目標數據
集合以及各該對比數據集合分別包含復數個期間記錄數據;以及依據該目標數據集合的N
個該期間記錄數據值以及各該對比數據集合的N個該期間記錄數據值以提供復數個向量距
離值,又依據該各向量距離值以選取K個該對比數據集合中的第T個該期間記錄數據值,并
依據K個的第T個該期間記錄數據進行加權平均,以提供該目標數據集合的第T個該期間記
錄數據的數據用量預測值。
2.根據權利要求1所述的數據用量預測裝置,其特征在于,T=N+X,其中X表示X個期間
記錄數據值。
3.根據權利要求1所述的數據用量預測裝置,其特征在于,該向量距離值為該目標數據
集合以及各該對比數據集合的歐幾里德距離。
4.根據權利要求1所述的數據用量預測裝置,其特征在于,依據該向量距離的倒數以取
得第T個該期間記錄數據的權重值。
5.根據權利要求1所述的數據用量預測裝置,其特征在于,該目標數據集合與該各對比
數據集合屬相同集合類型。
6.根據權利要求1所述的數據用量預測裝置,其特征在于,該目標數據集合與該各對比
數據集合屬相似集合類型。
7.一種數據用量預測方法,其特征在于,包含步驟:
存取復數筆數據集合,其中該數據集合包含目標數據集合以及復數筆對比數據集合,
而該目標數據集合以及各該對比數據集合分別包含復數個期間記錄數據;
依據該目標數據集合的N個該期間記錄數據值以及各該對比數據集合的N個該期間記
錄數據值,以提供復數個向量距離值;以及
依據該各向量距離值以選取K個該對比數據集合的第T個該期間記錄數據值,并依據K
個的第T個該期間記錄數據進行加權平均,以提供該目標數據集合的第T個該期間記錄數據
的數據用量預測值。
8.根據權利要求7所述的數據用量預測方法,其特征在于,T=N+X,其中X表示X個期間
記錄數據值。
9.根據權利要求7所述的數據預測方法,其特征在于,計算該目標數據集合以及各該對
比數據集合的歐幾里德距離得到各向量距離值。
10.根據權利要求7所述的數據用量預測方法,其特征在于,依據該向量距離值的倒數
以取得第T個該期間記錄數據的權重值。
11.根據權利要求7所述的數據用量預測方法,其特征在于,該目標數據集合與該各對
比數據集合屬相同集合類型。
12.根據權利要求7所述的數據用量預測方法,其特征在于,該目標數據集合與該各對
比數據集合屬相似集合類型。
13.一種數據用量預測的電腦程序產品,其特征在于,當電腦裝置加載并執行該產品,
可完成如權利要求7至12任一項所述的數據用量預測方法。

說明書

數據用量預測裝置、方法及其電腦程序產品

技術領域

本發明是一種數據用量預測裝置、方法及其電腦程序產品。尤指一種分析比對數
據模式,以進行數據用量預測裝置、方法及其電腦程序產品。

背景技術

隨著行動上網各項服務以及內容的發展,使用者在申辦各種上網資費方案時并無
法準確的預估未來的行動數據使用量是否會超出申辦時的使用量。而現行電信收費上,當
超出預定使用量時,其超出部分的資費會遠高于申請的資費。因此,對使用者而言預估未來
可能的數據使用量并適時的調整資費極其重要。

另外,對電信服務業者而言,當電信服務區域的使用人員有所變動時,其所需提供
的數據用量亦會隨之改變,為維護高質量的數據服務,電信業者則必需通過預估數據用量
來調整后各個電信服務區域內的電信設備數量。

目前行動數據用量預測方法多對大量的數據進行平均預測。由于各個用戶的行動
網絡數據用量變異性極大,因此前揭技術所計算出來的行動網絡數據用量估計值其誤差值
不甚理想,而嚴重影響后端的決策作業。

綜上所述,如何提供一種可有效預估數據用量的技術手段乃本領域亟需解決的技
術問題。

發明內容

為解決前揭的問題,本發明的目的為提供一種數據用量預測裝置、方法及其電腦
程序產品。

為達上述目的,本發明提出一種數據用量預測裝置。該裝置包含存取外部的數據
庫,前述的數據庫包含復數筆數據集合,其中數據集合包含目標數據集合以及復數筆對比
數據集合,而目標數據集合以及對比數據集合分別包含復數個期間記錄數據。并依據目標
數據集合的N個期間記錄數據值以及各對比數據集合的N個期間記錄數據值,以提供復數個
向量距離值。數據預測裝置更依據向量距離值以選取K個對比數據集合的第T個期間記錄數
據值,并依據K個的第T個期間記錄數據進行加權平均,以提供目標數據集合的第T個期間記
錄數據的數據用量預測值。

為達上述目的,本發明提出一種數據用量預測方法。該方法包含下列步驟:存取復
數筆數據集合,其中數據集合包含目標數據集合以及復數筆對比數據集合,而目標數據集
合以及對比數據集合分別包含復數個期間記錄數據。依據目標數據集合的N個期間記錄數
據值以及各對比數據集合的N個期間記錄數據值,以提供復數個向量距離值。又依據前述的
多個向量距離值以選取K個對比數據集合的第T個期間記錄數據值,并依據K個的第T個期間
記錄數據進行加權平均,以提供目標數據集合的第T個期間記錄數據的數據用量預測值。

為達上述目的,本發明提出一種數據用量預測的電腦程序產品。當電腦裝置加載
并執行該產品,可完成前述數據用量預測方法的步驟。

綜上所述,本發明的數據用量預測裝置、方法及其電腦程序產品通過分析目標客
戶的一期間內的數據用量的向量,并從相同群組的客戶中,依向量距離挑選出特定的期間
記錄數據值,以從挑選出的期間記錄數據值作為數據用量預測的依據,而能提供更為精準
的預測結果。

附圖說明

圖1為本發明的數據用量預測系統的系統架構圖;

圖2為本發明的數據用量預測方法的方法流程圖。

符號說明

1數據用量預測系統

10數據用量預測裝置

11決策服務器

12數據庫

13帳務計算服務器

14電信網絡

15客戶端設備

S101~S103步驟

具體實施方式

以下將描述具體的實施例以說明本發明的實施態樣,惟其并非用以限制本發明所
欲保護的范疇。

請參閱圖1,其為本發明的數據用量預測系統1的架構圖。數據用量預測系統1包含
數據用量預測裝置10、決策服務器11、數據庫12、帳務計算服務器13、電信網絡14以及復數
個客戶端設備15。前述的客戶端設備15經由電信網絡14連接至帳務計算服務器13。帳務計
算服務器13則將記錄的帳務數據傳送至數據庫12,以供數據用量預測裝置10進行存取,而
數據用量預測裝置10依據數據庫12內的數據進行預測,以提供決策服務器11數據預測值作
為決策判斷的依據。前述的數據用量預測裝置10、決策服務器11以及帳務計算服務器13為
具有運算功能的電子裝置,例如電腦裝置。客戶端設備15為行動通訊裝置,例如智能型手
機、平板電腦、筆記本電腦等。

前述的數據庫12儲存復數筆數據集合,而數據集合中又包含目標數據集合以及對
比數據集合,而目標數據集合以及對比數據集合分別包含復數個期間記錄數據。當數據用
量預測裝置10需預測目標數據時,則存取歷史數據的目標數據集合以及對比數據集合,再
計算目標數據集合的N個期間記錄數據值以及各對比數據集合的N個期間記錄數據值,以提
供復數個向量距離值,數據用量預測裝置10依據向量距離值以選取出K個對比數據集合的
第T個期間記錄數據值,T個期間記錄數據值為N個期間記錄數據值加上X個期間記錄數據值
并依據K個的第T個期間記錄數據進行加權平均,以提供目標數據集合的第T個期間記錄數
據的數據用量預測值。

請接著參閱圖2,其為本發明的數據用量預測方法,該方法應用于電腦裝置,該方
法包含下列步驟:

S101:存取復數筆數據集合,其中數據集合包含目標數據集合以及復數筆對比數
據集合,而目標數據集合以及對比數據集合分別包含復數個期間記錄數據。

S102:計算目標數據集合的N個期間記錄數據值以及各對比數據集合的N個期間記
錄數據值,以提供復數個向量距離值。

S103:依據向量距離值以選取K個對比數據集合的第T個期間記錄數據值,并依據K
個的第T個期間記錄數據進行加權平均,以提供目標數據集合的第T個期間記錄數據的數據
用量預測值。

本發明又提供一種用于數據用量預測的電腦程序產品。當電腦裝置加載并執行該
電腦程序產品時,可完成步驟S101~103的步驟。

其中,前述的向量距離值為目標數據集合以及各對比數據集合的歐幾里德距離。
而各個期間記錄數據的權重則為向量距離值的倒數。于另一實施例中,目標數據集合與各
個對比數據集合屬相同集合類型。于另一實施例中,目標數據集合與各個對比數據集合屬
相似集合類型。于另一實施例中,參數T=N+X,于此實施例中設定X為1,惟其數值不在此限。

本發明的數據用量預測系統1選擇行動通訊數據量的預測作為說明,惟其用途不
在此限。本發明的范例設定數據用量預測系統1包含多個客戶端設備15,客戶端設備15擁有
P種行動上網資費方案。客戶端設備15經由電信網絡14將通信記錄傳送至帳務計算服務器
13進行帳務處理。帳務計算服務器13于統計每個客戶每D天(1周期)的用量集合與資費方案
信息,再依不同資費方案(集合類型)分類儲存于數據庫12。

帳務計算服務器13統計每個客戶每個周期的行動數據用量結果如表1所示,并將
其儲存于數據庫12,其中包含有使用者編號、期間值(周期時間)、集合類型(資費方案)、以
及期間記錄數據(行動數據用量信息)。數據用量預測裝置10則根據數據庫12所儲存的各種
資費方案、各周期的行動數據用量數據,運用行動數據用量預測方法預測客戶下一周期預
計的行動數據用量。接著數據用量預測裝置10再將此預測結果給予決策服務器11進行決策
運算。

表1:每個客戶每個周期的行動數據用量結果





處理程序(1):設定相關參數值

數據用量預測裝置10分析每個客戶每個周期(包含D天)的行動數據用量、每個客
戶前N個周期的行動數據用量集合、以及取得歷史數據中最相似的K筆數據。接著設定D、N、K
等參數值以進行后續預測計算。于一實施例中,設定D值為5(即一個周期5天)、N值為5(即分
析前5個周期)、K值為2(即取得數據庫12中最相似的2筆記錄)、T=6(T=N+X,在此設定X=
1,待預測的期間記錄數據,預測第T個周期)。前揭的變數D、N、K、X、T為實數。

處理程序(2):收集和統計各客戶于每一周期的行動數據用量

于此程序中,帳務計算服務器13通過電信網絡14收集和記錄各客戶的行動數據通
信記錄。接著,計算并儲存客戶每一周期的行動數據用量。

處理程序(3)取得前N個周期的行動數據用量,并轉換為向量集合

于此程序中,數據用量預測裝置10依參數值設定取出數據庫12數據,取得目標客
戶前5個周期的行動數據用量集合,并將此集合作為該客戶行動上網行為的參考依據,依此
進行后續的分析與判斷使用。于本實施例中,待預測的目標數據為用戶編號1于第i個周期
(2014/07/26~2014/07/31)的行動數據用量q1,i,故將取得其N個期間記錄數據(前5個周期
的行動數據用量)集合Q1,i-1,i-5={q1,i-5,q1,i-4,q1,i-3,q1,i-2,q1,i-1}(即2014/07/01~2014/
07/25期間的行動數據用量),如公式Eq(1)、Eq(2)、以及表2所示。

Q1,i-1,i-5={q1,i-5,q1,i-4,q1,i-3,q1,i-2,q1,i-1}Eq(1)

Q1,i-1,i-5={1881531,5651084,1875929,3116748,1808503}Eq(2)

表2:使用者編號1前5個周期的行動數據用量集合



處理程序(4):與歷史數據進行比對,取得最相似的K筆數據

于此程序中,數據用量預測裝置10自數據庫12取出目標客戶相同資費方案(使用
者編號1的資費方案為Group1)的歷史行動數據用量數據,不同資費方案的客戶行動數據
用量數據將不被考慮(如表1中的使用者編號2)。

考慮客戶歷史行動數據用量數據集合如表3所示。例如:使用者編號c的歷史行動
數據用量數據集合為Qc,i-6,i-11={qc,i-11,qc,i-10,qc,i-9,qc,i-8,qc,i-7,qc,i-6}(即2014/06/01~
2014/06/30期間的行動數據用量),如公式Eq(3)、Eq(4)所示。

Qc,i-6,i-11={qc,i-11,qc,i-10,qc,i-9,qc,i-8,qc,i-7,qc,i-6}Eq(3)

Qc,i-6,i-11={1731307,4234143,2018105,3696109,2513784,3622136}Eq(4)

表3:客戶歷史行動數據用量數據集合



接著,數據用量預測裝置10將目標客戶前5個周期的行動數據用量集合Q1,i-1,i-5與
歷史數據每筆行動數據用量集合進行比對,而在本實施例中,相似度權重計算主要采用歐
幾里德距離的倒數。使用者編號1與使用者編號j的歐幾里德距離d(Q1,i-1,i-5,Qj,i-7,i-11)如
公式Eq(5)所示,而使用者編號1與使用者編號j的相似度權重w1,j則如公式Eq(6)所示。其
中,M為一個極大數,在本實施例中設定為1000000。依此可計算出使用者編號1前5個周期的
行動數據用量集合Q1,i-1,i-5={q1,i-5,q1,i-4,q1,i-3,q1,i-2,q1,i-1}(即2014/07/01~2014/07/
25期間的行動數據用量)與歷史數據每筆行動數據用量集合計算的相似度權重(如表4所
示)。

d ( Q 1 , i - 1 , i - 5 , Q j , i - 7 , i - 11 ) = Σ a = 1 n ( q 1 , i - a , q j , i - a - ( N + 1 ) ) 2 - - - E q ( 5 ) ]]>

w 1 , j = 1 d ( Q 1 , i - 1 , i - 5 , Q j , i - 7 , i - 11 ) , w h e r e d ( Q 1 , i - 1 , i - 5 , Q j , i - 7 , i - 11 ) 0 M , o t h e r w i s e - - - E q ( 6 ) ]]>

表4:目標客戶與歷史行動數據用量數據集合比對所得的距離與權重


使用者編號
距離d(Q1,i-1,i-5,Qj,i-7,i-11)
權重w1,j
1
4981449
0.00000020074
3
5556700
0.00000017996


c
2041777
0.00000048977

當與每一筆歷史行動數據用量數據集合比對得到權重w1,j后,取得權重最大的K筆
(在此實施例中K為2),其中權重最大值為f1和其對應的前第i-(N+1)個周期行動數據用量
為g1、權重第二大值為f2和其對應的前第i-(N+1)個周期行動數據用量為g2,依此類推如公
式(7)所示。

f 1 = max 1 j c w 1 , j - - - E q ( 7 ) ]]>

處理程序(5)依每筆數據向量距離進行加權平均,估計行動數據用量

于此程序中,分別將相似度最大的k筆數據所對應的前第i-(N+1)個周期行動數據
用量依權重進行加權平均(如公式Eq(8)所示)。在此實施例中,與使用者編號1前5個周期的
行動數據用量集合Q1,i-1,i-5相似度最高的2筆分別為使用者編號c的歷史行動數據用量數據
集合Qc,i-7,i-11和使用者編號1的歷史行動數據用量數據集合Q1,i-7,i-11,故f1為w1,c=
0.00000048977、g1為qc,i-6=3622136、f2為w1,1=0.00000020074、g2為q1,i-6=3423594。因
此,使用者編號1于2014/07/26~2014/07/31此周期(第i個周期)的行動數據估計用量q1,i'
為3,140,242,如公式(9)所示。

q 1 , i = Σ b = 1 k f b × g b Σ b = 1 k f b - - - E q ( 8 ) ]]>

q 1 , i = 0.00000048977 × 3622136 + 0.00000020074 × 3423594 0.00000048977 + 0.00000020074 = 3140242 - - - E q ( 9 ) ]]>

當數據用量預測裝置10完成目標客戶行動數據用量預測后,可將此預測值傳送至
決策服務器11,并依據預測的行動數據用量,經過決策運算產生相關的營銷、預警、網絡部
署等策略,并提供相關建議信息予企業主管和客戶決策參考。在此實施例中,使用者編號1
的資費方案允許的封包數量為15,000,000,而目前使用者編號1已使用封包數量14,333,
795,并且估計使用者編號1到2014/07/31時將累計使用封包數量為17474037,故將由決策
服務器11提供預警信息予用戶編號1,并推薦使用者編號1其他資費方案。

本發明更以中華電信北區用戶多種資費方案數據(mPro50、mPro150、mPro450、
mPro550、mPro650、mPro750;用戶記錄數:565606個,K值:10)來進行測試。測試結果如下表
所示,相較于傳統預測方法(平均值方法、類神經網絡),本申請的數據用量預測裝置、方法
及其電腦程序產品具有更優異的預測準確度。



上列詳細說明是針對本發明的一可行實施例的具體說明,惟該實施例并非用以限
制本發明的專利范圍,凡未脫離本發明技藝精神所為的等效實施或變更,均應包含于本申
請的專利范圍中。

關 鍵 詞:
數據 用量 預測 裝置 方法 及其 電腦 程序 產品
  專利查詢網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
關于本文
本文標題:數據用量預測裝置、方法及其電腦程序產品.pdf
鏈接地址:http://www.rgyfuv.icu/p-6341405.html
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服客服 - 聯系我們

[email protected] 2017-2018 zhuanlichaxun.net網站版權所有
經營許可證編號:粵ICP備17046363號-1 
 


收起
展開
山东11选5中奖结果走势图