• / 20
  • 下載費用:30 金幣  

基于DTW的衛星遙測數據異常檢測方法.pdf

摘要
申請專利號:

CN201510351199.7

申請日:

2015.06.24

公開號:

CN104915568A

公開日:

2015.09.16

當前法律狀態:

授權

有效性:

有權

法律詳情: 授權|||實質審查的生效IPC(主分類):G06F 19/00申請日:20150624|||公開
IPC分類號: G06F19/00(2011.01)I 主分類號: G06F19/00
申請人: 哈爾濱工業大學
發明人: 彭宇; 劉大同; 陳靜; 龐景月; 彭喜元
地址: 150001黑龍江省哈爾濱市南崗區西大直街92號
優先權:
專利代理機構: 哈爾濱市松花江專利商標事務所23109 代理人: 楊立超
PDF完整版下載: PDF下載
法律狀態
申請(專利)號:

CN201510351199.7

授權公告號:

||||||

法律狀態公告日:

2017.09.29|||2015.10.14|||2015.09.16

法律狀態類型:

授權|||實質審查的生效|||公開

摘要

基于DTW的衛星遙測數據異常檢測方法,涉及衛星遙測數據異常檢領域。本發明為了解決現有的檢測方法存在的異常參數未超過報警門限導致的衛星部件異常漏檢的問題、以固定點數對具有周期特性的衛星遙測數據進行分段存在較大偏差的問題和時間序列存在微小偏移而使度量結果不夠準確進而導致異常檢測結果不夠準確的問題。本發明以幅角突變點為標識對衛星遙測數據進行分段,然后計算出含有類別標簽的時間序列中各類別類內的DTW距離均值,并獲取待進行異常檢測的時間序列x';計算x'與含有類別標簽的時間序列X之間的DTW距離,確定x'與準所屬類別l'之間的最小DTW距離dmin,根據dmin與之間的大小關系從而確定x'是否為異常序列。本發明適用衛星遙測數據異常檢測。

權利要求書

權利要求書
1.  基于DTW的衛星遙測數據異常檢測方法,其特征在于它包括下述步驟:
步驟一:以幅角突變點為標識進行分段,獲取含有類別標簽的時間序列,包括時間序列X={x1,x2,…,xn},對應類別標簽L={l1,l2,…,ln};其中n為含有類別標簽的時間序列數目,l=1,2,…,c;c為類別數目;
步驟二:計算出含有類別標簽的時間序列中各類別類內的DTW距離均值S‾={s1‾,s2‾,...,sc‾},]]>其中的計算方式如下:
s‾l=2ml(ml-1)Σi=1ml-1Σj=i+1mlDTW(xli,xlj),ml>1min(S‾),ml=1]]>
其中,表示第l類的類內距離均值,ml表示第l類的成員數目,表示第l類的所有成員,DTW(xli,xlj)表示計算xli與xlj之間的DTW距離,i=1,2,…,ml-1,j=i+1,i+2,…,ml;
步驟三:獲取待進行異常檢測的時間序列x',獲取方式為提取最新衛星遙測數據中相鄰兩個幅角突變點對應時間之內的測試數據為x';
步驟四:計算出待檢測的時間序列x'與含有類別標簽的時間序列X之間的DTW距離序列D={d1,d2,…,dn},其中di'的計算方式如下:
di'=DTW(x',xi')
其中,di'表示D的第i'個元素,xi'表示X的第i'個序列,i'=1,2,…,n;
步驟五:采用基于DTW距離的KNN分類方法,根據設定的K近鄰數目對待檢測的時間序列x'進行預分類,確定待檢測的時間序列x'的準所屬類別l',其中K=1,2,…,n;
步驟六:確定待檢測的時間序列x'與準所屬類別l'之間的最小DTW距離dmin;
步驟七:判斷dmin與之間的大小關系,其中P為用戶設定的異常檢測敏感系數,得出待檢測的時間序列x'的異常檢測結果,其判斷規則為:若則待檢測的時間序列x'判定為異常序列,否則待檢測的時間序列x'判定為正常序列。

2.  根據權利要求1所述基于DTW的衛星遙測數據異常檢測方法,其特征在于:步驟一的具體實現步驟如下:
步驟1.1:將衛星正常運行狀態下的歷史衛星遙測數據以幅角突變點為標識進行分段, 得到正常時間序列X={x1,x2,…,xn};
步驟1.2:將分段后所得到的正常時間序列X={x1,x2,…,xn},通過層次聚類方法對序列進行聚類操作,從而獲得正常時間序列的類別標簽L={l1,l2,…,ln},完成類別指定。

3.  根據權利要求1所述基于DTW的衛星遙測數據異常檢測方法,其特征在于:步驟五的具體實現步驟如下:
步驟5.1:確定與待檢測的時間序列x'的DTW距離最近的K個含有類別標簽的時間序列,即在D={d1,d2,…,dn}中,取出K個最小的數值,確定這K個最小的數值對應的含有類別標簽的時間序列;對應的類別標簽為
步驟5.2:統計類別標簽中出現頻率最高的類別,即準所屬類別為l'。

4.  根據權利要求1所述基于DTW的衛星遙測數據異常檢測方法,其特征在于:步驟六的具體實現步驟如下:
步驟6.1:求取待檢測的時間序列x'與準所屬類別l'中所有成員序列之間的DTW距離序列其中dl'i”的計算方式如下
dl'i=DTW(x',xl'i”)
其中,xl'i”表示含類別標簽的時間序列X的第l'類的第i”個時間序列;ml'表示第l'類的成員數目;此時的i”=1,2,…,ml';
步驟6.2:求取DTW距離序列Dl'中的的最小值,即為待檢測的時間序列x'與準所屬類別l'之間的最小DTW距離dmin。

說明書

說明書基于DTW的衛星遙測數據異常檢測方法
技術領域
本發明涉及衛星遙測數據異常檢領域。
背景技術
隨著科技的發展,越來越多的技術都要依賴于衛星實現,所以衛星的正常工作關系到眾多行業和領域;衛星在軌運行過程中,通過對衛星遙測數進行監測,及時發現遙測數據異常對于判斷衛星可能出現各種各樣的故障具有決定性作用;
閾值法是衛星測控中心監測衛星遙測數據異常的一種常用方法。其主要原理是根據每一個遙測數據的自身性質與功能要求,設置報警門限,當遙測數據值超過報警門限時,判斷參數異常,屬于異常點檢測,但有一些衛星遙測數據值總是在門限內波動,即使衛星部件出現異常,其值仍然未超出設定門限造成故障漏報。
另外,通過對衛星遙測數據中的偏航姿態角進行分析,偏航姿態角的整體變化趨勢如圖2所示,其細節變化如圖3所示,得出衛星遙測數據具有明顯地周期性,且該特性已與衛星遙測數據提供單位進行了確認。通過對遙測數據的每個周期進行分析,可以得出衛星在該周期之內的運行狀態是否正常。
以固定點數進行衛星遙測數據分段能夠反映出原始測試數據的周期特性,具有一定的合理性,但是各個分段序列之間的耦合度不夠高,存在一定的偏差,如圖4,隨著時間的推進這種偏差會愈發明顯,因此,若按照固定周期對原始測試數據進行分段,則分段不夠準確,進而可能影響后續數據挖掘質量。綜上,目前還需要更為合理的分段方法對衛星遙測數據進行分段,并在此基礎之上實現對衛星遙測數據的異常檢測。
而衛星遙測數據有其自身特點,比如:存在微小偏差等,這些特點致使在針對衛星遙測數據的異常檢測中采用經典的時間序列相似性度量方法,如歐式距離、皮爾森相關系數等,體現出不適應性。經典的時間序列度量方法,不能針對時間序列存在微小偏移實現異步度量使得度量結果不夠準確,進而導致對衛星遙測數據的異常檢測結果不夠準確。因此,在衛星遙測數據的異常檢測中還需應用更具適應性的相似性度量方法。
發明內容
本發明的目的是為了解決現有的檢測方法存在的異常參數未超過報警門限導致的衛星部件異常漏檢的問題、以固定點數對具有周期特性的衛星遙測數據進行分段存在較大偏差的問題和時間序列存在微小偏移而使度量結果不夠準確進而導致異常檢測結果不夠準確的問題。
基于DTW的衛星遙測數據異常檢測方法,包括下述步驟:
步驟一:以幅角突變點為標識進行分段,獲取含有類別標簽的時間序列,包括時間序列X={x1,x2,…,xn},對應類別標簽L={l1,l2,…,ln};其中n為含有類別標簽的時間序列數目,l=1,2,…,c;c為類別數目;
步驟二:計算出含有類別標簽的時間序列中各類別類內的DTW距離均值S‾={s‾1,s‾2,...,s‾c},]]>其中的計算方式如下:
s‾l=2ml(ml-1)Σi=1ml-1Σj=i+1mlDTW(xli,xlj),ml>1min(S‾),ml=1]]>
其中,表示第l類的類內距離均值,ml表示第l類的成員數目,表示第l類的所有成員,DTW(xli,xlj)表示計算xli與xlj之間的DTW距離,i=1,2,…,ml-1,j=i+1,i+2,…,ml;
步驟三:獲取待進行異常檢測的時間序列x',獲取方式為提取最新衛星遙測數據中相鄰兩個幅角突變點對應時間之內的測試數據為x';
步驟四:計算出待檢測的時間序列x'與含有類別標簽的時間序列X之間的DTW距離序列D={d1,d2,…,dn},其中di'的計算方式如下:
di'=DTW(x',xi')
其中,di'表示D的第i'個元素,xi'表示X的第i'個序列,i'=1,2,…,n;
步驟五:采用基于DTW距離的KNN分類方法,根據設定的K近鄰數目對待檢測的時間序列x'進行預分類,確定待檢測的時間序列x'的準所屬類別l',其中K=1,2,…,n;準所屬類別l'為1,2,…,c中確定的某個數;
步驟六:確定待檢測的時間序列x'與準所屬類別l'之間的最小DTW距離dmin;
步驟七:判斷dmin與之間的大小關系,其中P為用戶設定的異常檢測敏感系數,得出待檢測的時間序列x'的異常檢測結果,其判斷規則為:若則待檢測的時間序列x'判定為異常序列,否則待檢測的時間序列x'判定為正常序列。
本發明針對衛星遙測數據特點,首先,根據衛星遙測數據的周期特性對衛星遙測數據進行分段;然后,采用動態時間規整(Dynamic Time Warping,DTW)距離對分段后得到 的時間序列之間的相似性進行度量,最后,結合K最近鄰(K-Nearest Neighbor,KNN)算法以及衛星遙測數據歷史數據對最新衛星遙測數據進行異常檢測,能夠準確實現衛星異常狀態監測。
針對按照固定點對衛星遙測數據分段效果不理想的情況,如圖4所示,本發明提出了按照衛星遙測數據中的幅角突變點為標識進行分段的方法,其分段效果如圖5所示,以幅角為標識進行分段的分段結果更為緊湊,各個分段序列之間的耦合度更高、更為合理。
對衛星遙測數據進行異常檢測是對衛星遙測數據進行數據挖掘的一項重要功能。而衛星遙測數據有其自身特點,比如存在微小偏移等,這些特點致使在針對衛星遙測數據的異常檢測中采用經典的時間序列相似性度量方法,如歐式距離、皮爾森相關系數等,體現出不適應性。經典的時間序列度量方法,不能針對時間序列存在微小偏移實現異步度量使得度量結果不夠準確,進而導致對衛星遙測數據的異常檢測結果不夠準確。本發明采用動態時間規整(Dynamic Time Warping,DTW)距離對衛星遙測數據時間序列之間的距離進行度量,能夠實現異步度量,解決了由于時間序列存在微小偏移而使度量結果不夠確的問題。
而且,本發明結合K最近鄰居(K-Nearest Neighbor,KNN)分類算法以及衛星遙測數據歷史多維時間序列對最新遙測時間序列進行異常檢測,有效地解決現有的檢測方法存在的異常參數未超過報警門限導致的衛星部件異常漏檢的問題。
附圖說明
圖1為本發明的衛星遙測數據異常檢測實現流程圖;
圖2為偏航姿態角測試序列示例圖;
圖3為偏航姿態角測試序列前450點示例圖;
圖4為偏航姿態角測試序列固定點分段疊加繪圖結果圖;
圖5為偏航姿態角測試序列以幅角分段疊加繪圖結果圖;
圖6(a)為訓練樣本正常模式1示例圖;
圖6(b)為訓練樣本正常模式2示例圖;
圖6(c)為訓練樣本正常模式3示例圖;
圖7為未注入異常的測試樣本示例圖;
圖8為注入脈沖型異常后的樣本示例圖;
圖9為注入階躍型異常后的樣本示例圖;
圖10為注入漸變型異常后的樣本示例圖;
圖11為注入周期型異常后的樣本示例圖。
具體實施方式
具體實施方式一:結合圖1說明本實施方式,基于DTW的衛星遙測數據異常檢測方法,包括下述步驟:
步驟一:以幅角突變點為標識進行分段,獲取含有類別標簽的時間序列,包括時間序列X={x1,x2,…,xn},對應類別標簽L={l1,l2,…,ln};其中n為含有類別標簽的時間序列數目,l=1,2,…,c;c為類別數目;
步驟二:計算出含有類別標簽的時間序列中各類別類內的DTW距離均值S‾={s‾1,s‾2,...,s‾c},]]>其中的計算方式如下:
s‾l=2ml(ml-1)Σi=1ml-1Σj=i+1mlDTW(xli,xlj),ml>1min(S‾),ml=1]]>
其中,表示第l類的類內距離均值,ml表示第l類的成員數目,表示第l類的所有成員,DTW(xli,xlj)表示計算xli與xlj之間的DTW距離,i=1,2,…,ml-1,j=i+1,i+2,…,ml;
步驟三:獲取待進行異常檢測的時間序列x',獲取方式為提取最新衛星遙測數據中相鄰兩個幅角突變點對應時間之內的測試數據為x';
步驟四:計算出待檢測的時間序列x'與含有類別標簽的時間序列X之間的DTW距離序列D={d1,d2,…,dn},其中di'的計算方式如下:
di'=DTW(x',xi')
其中,di'表示D的第i'個元素,xi'表示X的第i'個序列,i'=1,2,…,n;
步驟五:采用基于DTW距離的KNN分類方法,根據設定的K近鄰數目對待檢測的時間序列x'進行預分類,確定待檢測的時間序列x'的準所屬類別l',其中K=1,2,…,n;準所屬類別l'為1,2,…,c中確定的某個數;
步驟六:確定待檢測的時間序列x'與準所屬類別l'之間的最小DTW距離dmin;
步驟七:判斷dmin與之間的大小關系,其中P為用戶設定的異常檢測敏感系數,得出待檢測的時間序列x'的異常檢測結果,其判斷規則為:若則待檢測的時間序列x'判定為異常序列,否則待檢測的時間序列x'判定為正常序列。
具體實施方式二:本實施方式所述的步驟一的具體實現步驟如下:
步驟1.1:將衛星正常運行狀態下的歷史衛星遙測數據以幅角突變點為標識進行分段,得到正常時間序列X={x1,x2,…,xn};幅角為衛星遙測數據中的測試參量之一,其變化規律為從0~360依次遞增,當達到360后,則變為0重新開始遞增,其中從360變為0這個點為幅角突變點;以幅角突變點為標識進行分段,即:記錄幅角突變點的對應時間,將其他測試參量根據幅角突變點對應的時間進行提取,提取方法為相鄰兩個幅角突變點對應時間之內的測試數據提取為一條時間序列;
步驟1.2:將分段后所得到的正常時間序列X={x1,x2,…,xn},通過層次聚類方法對序列進行聚類操作,從而獲得正常時間序列的類別標簽L={l1,l2,…,ln},完成類別指定。此處類別指定工作,其方法并不固定,能夠實現類別指定任何現有方法都可以,層次聚類方法是能夠實現類別指定的方法之一。
其它步驟和參數與具體實施方式一相同。
具體實施方式三:本實施方式所述的步驟五的具體實現步驟如下:
步驟5.1:確定與待檢測的時間序列x'的DTW距離最近的K個含有類別標簽的時間序列,即在D={d1,d2,…,dn}中,取出K個最小的數值,確定這K個最小的數值對應的含有類別標簽的時間序列;對應的類別標簽為
步驟5.2:統計類別標簽中出現頻率最高的類別,即準所屬類別為l'。
其它步驟和參數與具體實施方式二相同。
具體實施方式四:本實施方式所述步驟六的具體實現步驟如下:
步驟6.1:求取待檢測的時間序列x'與準所屬類別l'中所有成員序列之間的DTW距離序列其中dl'i”的計算方式如下
dl'i=DTW(x',xl'i”)
其中,xl'i”表示含類別標簽的時間序列X的第l'類的第i”個時間序列;ml'表示第l'類的成員數目;此時的i”=1,2,…,ml';
步驟6.2:求取DTW距離序列Dl'中的的最小值,即為待檢測的時間序列x'與準所屬類別l'之間的最小DTW距離dmin。
其它步驟和參數與具體實施方式三相同。
實施例
針對衛星遙測數據開展基于不同時間序列相似性度量方法的異常檢測實驗,其中訓練樣本數為50,樣本為偏航姿態角數據,訓練樣本正常模式下各類別數據如圖6所示,測試樣本為25,其數據如圖7所示,所有時間序列經與數據提供單位確認已無異常,故采用異常準入的方式對其中一個時間序列注入異常,然后進行異常檢測。衛星遙測數據的異常情況總共分為四種:脈沖型、階躍型、漸變型、周期型。不同類型的異常模型,根據其參數的不同又有不同的表現形式,因此,驗證實驗針對不同表現形式的異常進行異常檢測實驗,并統計出漏檢率和誤檢率。
設△Y為偏航姿態角的最大值減去最小值,T為時間序列長度。針對脈沖型分別取脈沖幅值為△Y、0.5△Y、0.25△Y、-△Y、-0.5△Y、-0.25△Y,分別注入到時間序列的0.25T位置、0.5T位置、0.75T位置,共18種異常形式,圖8為注入脈沖型異常后的測試樣本示例;針對階躍型異常分別取階躍幅值為△Y、0.5△Y、0.25△Y、-△Y、-0.5△Y、-0.25△Y,分別從時間序列的0.25位置、0.5位置、0.75位置開始注入,共18種異常形式,圖9為注入階躍型異常后的測試樣本示例;針對漸變型異常分別取漸變系數為△Y/T、0.5△Y/T、0.25△Y/T、-△Y/T、-0.5△Y/T、-0.25△Y/T,分別從時間序列的0位置、0.5T位置開始注入,共12種異常形式,圖10為注入漸變型異常后的測試樣本示例;針對周期型異常分別取震動幅值為△Y、0.5△Y、0.25△Y、-△Y、-0.5△Y、-0.25△Y,周期長度為0.5T、T、2T,從時間序列起始位置注入,共18種異常形式,圖11為注入周期型異常后的測試樣本示例。
設定異常檢測敏感系數P為1,實驗結果如下表所示。
表1針對不同異常表現形式采用不同相似性度量方法的異常檢測結果

通過實驗結果可以發現,應用馬氏距離的異常檢測結果漏檢率全為零,但是誤檢率達 到1500%,因此其度量效果最差。而應用歐式距離和DTW距離的異常檢測結果中,誤檢率都為零,其中針對脈沖型和周期型異常DTW距離體現出了明顯的優勢,其漏檢率分別針對脈沖型和周期型降低了16.67%和5.55%,綜合分析可得,采用DTW距離的異常檢測度量效果最佳。

關 鍵 詞:
基于 DTW 衛星 遙測 數據 異常 檢測 方法
  專利查詢網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
關于本文
本文標題:基于DTW的衛星遙測數據異常檢測方法.pdf
鏈接地址:http://www.rgyfuv.icu/p-6373517.html
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服客服 - 聯系我們

[email protected] 2017-2018 zhuanlichaxun.net網站版權所有
經營許可證編號:粵ICP備17046363號-1 
 


收起
展開
山东11选5中奖结果走势图