• / 9
  • 下載費用:30 金幣  

一種信息物理融合系統隱私保護型數據分類方法.pdf

摘要
申請專利號:

CN201510234860.6

申請日:

2015.05.08

公開號:

CN104915608A

公開日:

2015.09.16

當前法律狀態:

授權

有效性:

有權

法律詳情: 授權|||實質審查的生效IPC(主分類):G06F 21/62申請日:20150508|||公開
IPC分類號: G06F21/62(2013.01)I; G06F17/30 主分類號: G06F21/62
申請人: 南京郵電大學
發明人: 黃繼鵬; 陳志; 岳文靜; 芮路; 顧振興; 崔鳴浩; 吳向忠; 黃本軒
地址: 210003江蘇省南京市棲霞區文苑路9號
優先權:
專利代理機構: 南京知識律師事務所32207 代理人: 汪旭東
PDF完整版下載: PDF下載
法律狀態
申請(專利)號:

CN201510234860.6

授權公告號:

||||||

法律狀態公告日:

2018.07.27|||2015.10.14|||2015.09.16

法律狀態類型:

授權|||實質審查的生效|||公開

摘要

本發明給出一種信息物理融合系統隱私保護型數據分類方法,使用隨機決策樹和門限加法同態密碼解決了信息物理融合系統在分布式數據挖掘過程中的隱私泄漏問題。該方法首先由信息物理融合系統的各單元確定隨機決策樹的結構;然后對決策樹的結點值進行計算,最后用建成的隨機決策森林和門限加法同態公鑰密碼對新的實例進行分類。本發明利用分布式隨機決策樹準確地建立分類器,結合門限加法同態密碼,能夠在提供高效可靠的隱私保護的前提下,進行信息物理融合系統中的數據分類。

權利要求書

權利要求書
1.  一種信息物理融合系統隱私保護型數據分類方法,其特征在于包括以下步驟:
步驟1)用戶將信息物理融合系統的組成單元劃分為多個信息物理單元和一個證書管理單元,所述的信息物理單元用于獨立地收集和處理數據,證書管理單元用于頒發證書;
步驟2)用戶預先將樣本格式放置在系統中,所述樣本格式包括樣本名稱、屬性名稱和對應的屬性值;
步驟3)用戶啟動每個信息物理單元收集訓練樣本的數據;
步驟4)每個信息物理單元隨機地生成一個決策樹的結構,所述的決策樹是一種樹型結構的分類器,分類器是一種計算機程序,可自動將數據分到已知類別;
步驟5)每個信息物理單元都將生成的決策樹結構共享,形成一個集合;
步驟6)對于集合中的每個決策樹結構,每個信息物理單元都以匿名的方式表示接受或拒絕,如果不能一致接受集合中的任何決策樹結構,則需從步驟4)重新開始;
步驟7)根據每個信息物理單元的合作方式,訓練決策樹的過程分為三種情況,所述的合作方式指每個信息物理單元對數據和決策樹的共享方式:
a.每個信息物理單元都知道所有決策樹的結點向量值
步驟a7.1)每個信息物理單元用自己的數據計算決策樹結點向量值,并告知所有信息物理單元,所述決策樹結點向量值是通過決策樹算法計算得出的分布概率的組合;
步驟a7.2)每個信息物理單元累加所有決策樹的結點向量值并平均,得到一棵全局決策樹;
b.只有擁有決策樹的信息物理單元知道所有決策樹的結點向量值
步驟b7.1)每個信息物理單元用自己的數據計算決策樹的結點向量值,只告知擁有決策樹的信息物理單元;
步驟b7.2)擁有決策樹的信息物理單元累加所有決策樹的結點向量值并平均,得到一棵全局的決策樹;
c.所有信息物理單元都不知道所有決策樹的結點向量值
步驟c7.1)每個信息物理單元用自己的數據計算決策樹的結點向量值;
步驟8)對于一個新實例的分類,針對步驟7)中的三種情況:
步驟8.1a)每個信息物理單元都持有全局決策樹,直接在本地分類;
步驟8.1b)需要分類的信息物理單元為門限加法同態公鑰密碼產生一個公私密鑰對,并向證書管理單元申請頒發自己構造的證書,若證書申請不成功,則需要重新進行步驟8b),所述的門限加法同態公鑰密碼是一種公鑰密碼,只有當有達到門限數量的單元同意解密時, 持有私鑰的單元才可以解密;
步驟8.1b2)申請證書成功后,需要分類的信息物理單元向擁有決策樹的信息物理單元發出分類請求;
步驟8.1b3)擁有決策樹的信息物理單元將全局決策樹的結點向量值用證書中的公鑰加密后回送給需要分類的信息物理單元;
步驟8.1b4)需要分類的信息物理單元根據回送的加密值檢索分類的實例到達的所有結點,并將所有加密的結點向量值相乘;
步驟8.1b5)需要分類的信息物理單元辦理門限解密,檢索分類結果;
步驟8.1c)需要分類的信息物理單元為門限加法同態公鑰密碼產生一個公私密鑰對,并向證書管理單元申請自己構造的證書,若證書申請不成功,則需要重新進行步驟8.1c);
步驟8.1c2)申請證書成功后,需要分類的信息物理單元向所有信息物理單元發出分類請求;
步驟8.1c3)每個信息物理單元將自己的決策樹結點向量值用證書中的公鑰加密后回送給需要分類的信息物理單元;
步驟8.1c4)需要分類的信息物理單元根據回送的加密值檢索分類的實例到達的所有結點,并將所有加密的結點向量值相乘;
步驟8.1c5)需要分類的信息物理單元辦理門限解密,檢索分類結果。

說明書

說明書一種信息物理融合系統隱私保護型數據分類方法
技術領域
本發明提供一種基于隨機決策樹的信息物理融合系統隱私保護型數據分類方法,主要在信息物理融合系統進行分類的過程中采用分布式隨機決策樹和門限加法同態密碼提供高效且可靠的隱私保護,屬于信息安全和數據挖掘的交叉技術應用領域。
背景技術
信息物理融合系統是一個綜合計算、網絡和物理環境的多維復雜系統,通過3C(Computation、Communication、Control)技術的有機融合與深度協作,實現大型工程系統的實時感知、動態控制和信息服務。信息物理融合系統是一個智能的有自主行為的系統,信息物理融合系統不僅能夠從環境中獲取數據,進行數據融合,提取有效信息,并且根據系統規則通過效應器作用于環境,被廣泛地應用于人工智能領域。
數據挖掘是一個從大量的數據中通過算法搜索隱藏于其中信息的過程。數據挖掘最大的優勢在于可以把許多分析和解決問題的方法用于大量的問題集。數據挖掘由于其廣闊的適用面和日益增長的市場需求,被應用于交通、醫療、保險、金融、制造等多個領域,已經成為計算機行業中發展最快的領域之一。但是如果隱私和安全的要求限制了數據的共享,就必須采用隱私保護型的數據挖掘方法。傳統密碼學的方法效率過低,很難進行大規模分析,簡單混淆輸入輸出的方法很難提供可靠的安全性。本發明結合隨機決策樹和門限加法同態密碼技術,進行高效的隱私保護型數據挖掘。
分類是一種重要的數據分析方法。先選出已經分好類的數據作為訓練集,在該訓練集上運用數據挖掘分類的技術,建立分類模型;對于沒有分類的數據進行分類預測。最初的數據挖掘分類應用大多都是基于內存基礎上所構造的算法。目前數據挖掘方法都要求具有基于外存以處理大規模數據集合的能力和具有可擴展的能力。
隨機決策樹是一種決策樹的構建方法,具有基于外存以處理大規模數據集合的能力和具有可擴展的能力。隨機樹的結構是由完全獨立的訓練數據建成的,算法可被分為訓練和分類兩部分。由于隨機分配在建立樹過程中的使用,隨機決策樹在計算速度和安全性能方面優于其他模型,適合本發明的需求。
同態加密是基于數學難題的計算復雜性理論的密碼學技術。同態加密對經過同態加密的 數據進行處理得到一個輸出,將這一輸出進行解密得到的結果與用同一方法處理為加密的原始數據得到的輸出結果是一樣的。同態加密主要包括加法同態、乘法同態、混合乘法同態、減法同態等,本發明主要利用加法同態密碼的性質進行保密通信。
發明內容
技術問題:本發明的目的是提供一種信息物理融合系統隱私保護型數據分類方法,該方法在分類的過程中結合了分布式隨機決策樹和門限加法同態密碼,以解決數據挖掘中的隱私保護問題。
技術方案:本發明所述的基于隨機決策樹的信息物理融合系統隱私保護型數據分類方法,用戶先在信息物理融合系統中構建多棵隨機決策樹,再用門限加法同態密碼加密決策樹,用加密后的決策森林組成一個全局決策樹,對數據進行分類。
本發明所述的信息物理融合系統由若干信息物理單元和一個證書管理單元組成,其中所述的信息物理單元用于獨立地收集和處理數據,證書管理單元用于頒發證書。
基于隨機決策樹的信息物理融合系統隱私保護型數據分類方法包括以下步驟:
步驟1)用戶將信息物理融合系統的組成單元劃分為多個信息物理單元和一個證書管理單元,所述的信息物理單元用于獨立地收集和處理數據,證書管理單元用于頒發證書;
步驟2)用戶預先將樣本格式放置在系統中,所述樣本格式包括樣本名稱、屬性名稱和對應的屬性值;
步驟3)用戶啟動每個信息物理單元收集訓練樣本的數據;
步驟4)每個信息物理單元隨機地生成一個決策樹的結構,所述的決策樹是一種樹型結構的分類器,分類器是一種計算機程序,可自動將數據分到已知類別;
步驟5)每個信息物理單元都將生成的決策樹結構共享,形成一個集合;
步驟6)對于集合中的每個決策樹結構,每個信息物理單元都以匿名的方式表示接受或拒絕,如果不能一致接受集合中的任何決策樹結構,則需從步驟4)重新開始;
步驟7)根據每個信息物理單元的合作方式,訓練決策樹的過程分為三種情況,所述的合作方式指每個信息物理單元對數據和決策樹的共享方式:
(a)每個信息物理單元都知道所有決策樹的結點向量值
步驟a7.1)每個信息物理單元用自己的數據計算決策樹結點向量值,并告知所有信息物理單元,所述決策樹結點向量值是通過決策樹算法計算得出的分布概率的組合;
步驟a7.2)每個信息物理單元累加所有決策樹的結點向量值并平均,得到一棵全局決策樹;
(b)只有擁有決策樹的信息物理單元知道所有決策樹的結點向量值
步驟b7.1)每個信息物理單元用自己的數據計算決策樹的結點向量值,只告知擁有決策樹的信息物理單元;
步驟b7.2)擁有決策樹的信息物理單元累加所有決策樹的結點向量值并平均,得到一棵全局的決策樹;
(c)所有信息物理單元都不知道所有決策樹的結點向量值
步驟c7.1)每個信息物理單元用自己的數據計算決策樹的結點向量值;
步驟8)對于一個新實例的分類,針對步驟7)中的三種情況:
步驟8.1a)每個信息物理單元都持有全局決策樹,直接在本地分類;
步驟8.1b)需要分類的信息物理單元為門限加法同態公鑰密碼產生一個公私密鑰對,并向證書管理單元申請頒發自己構造的證書,若證書申請不成功,則需要重新進行步驟8b),所述的門限加法同態公鑰密碼是一種公鑰密碼,只有當有達到門限數量的單元同意解密時,持有私鑰的單元才可以解密;
步驟8.1b2)申請證書成功后,需要分類的信息物理單元向擁有決策樹的信息物理單元發出分類請求;
步驟8.1b3)擁有決策樹的信息物理單元將全局決策樹的結點向量值用證書中的公鑰加密后回送給需要分類的信息物理單元;
步驟8.1b4)需要分類的信息物理單元根據回送的加密值檢索分類的實例到達的所有結點,并將所有加密的結點向量值相乘;
步驟8.1b5)需要分類的信息物理單元辦理門限解密,檢索分類結果;
步驟8.1c)需要分類的信息物理單元為門限加法同態公鑰密碼產生一個公私密鑰對,并向證書管理單元申請自己構造的證書,若證書申請不成功,則需要重新進行步驟8.1c)
步驟8.1c2)申請證書成功后,需要分類的信息物理單元向所有信息物理單元發出分類請求;
步驟8.1c3)每個信息物理單元將自己的決策樹結點向量值用證書中的公鑰加密后回送給需要分類的信息物理單元;
步驟8.1c4)需要分類的信息物理單元根據回送的加密值檢索分類的實例到達的所有結點,并將所有加密的結點向量值相乘;
步驟8.1c5)需要分類的信息物理單元辦理門限解密,檢索分類結果。
有益效果:本發明使用了數據挖掘中分類算法的隨機決策樹算法,并結合了門限加法同態公鑰密碼以實現信息物理融合系統中的隱私保護,解決了傳統混淆輸入輸出方法的不穩定性和純密碼學方法不能高效進行的問題。具體來說,本發明所述的基于隨機決策樹的信 息物理融合系統隱私保護型數據分類方法具有如下的有益效果:
(1)隨機決策樹在隱私保護時提供的安全性比傳統的混淆輸入輸出的方法更為可靠,而計算和通信的代價也遠小于純密碼學方法,可以適應大數據需求,并且實現起來也較為容易。
(2)隨機決策樹適合于分布式的數據挖掘,適應多方共享數據或合作進行數據挖掘的情形,對信息物理融合系統有很好的適應性。
(3)門限加法同態密碼可以很好的確保一方不能單獨解密,也可以保證在不解密的情況下,對數據的操作不會破壞數據的完整性。
附圖說明
圖1是基于隨機決策樹的信息物理融合系統隱私保護型數據分類方法流程。
具體實施方式
下面根據附圖和實例對本發明作更詳細的描述。
本發明根據天氣樣本數據進行具體描述,天氣樣本數據包括樣本名稱、屬性名稱和相對應的屬性值。其中屬性包括陰晴(對應的屬性值有sunny、overcast、rainy)、溫度(對應的屬性值有hot、mild、cool)、濕度(對應的屬性值有high、normal)、風力(對應的屬性值有strong、weak)、出行情況(對應的類別有yes、no)。
假設有如下表的天氣數據:

步驟1)用戶將信息物理融合系統的組成單元劃分為兩個信息物理單元和一個證書管理 單元,所述的信息物理單元用于獨立地收集和處理數據,證書管理單元用于頒發證書;
步驟2)用戶預先將樣本格式放置在系統中,包括樣本名稱、屬性名稱(陰晴、溫度、濕度、風力、出行情況)和對應的屬性值;
步驟3)用戶啟動每個信息物理單元收集訓練樣本的數據,樣本號為1-7的歸第一個信息物理單元,樣本號為8-14的歸第二個信息物理單元;
步驟4)每個信息物理單元隨機地生成一個決策樹的結構,所述的決策樹是一種樹型結構的分類器,分類器是一種計算機程序,可自動將數據分到已知類別;
步驟5)每個信息物理單元都將生成的決策樹結構共享,形成一個集合;
步驟6)對于集合中的每個決策樹結構,每個信息物理單元都以匿名的方式表示接受或拒絕,如果不能一致接受集合中的任何決策樹結構,則需從步驟4)重新開始;
步驟7)根據每個信息物理單元的合作方式,訓練決策樹的過程分為三種情況,所述的合作方式指每個信息物理單元對數據和決策樹的共享方式:
(a)每個信息物理單元都知道所有決策樹的結點向量值。
步驟7.1)每個信息物理單元用自己的數據計算決策樹結點向量值,并告知所有信息物理單元,所述決策樹結點向量值是通過決策樹算法計算得出的分布概率的組合;
步驟7.2)每個信息物理單元累加所有決策樹的結點向量值并平均,得到一棵全局決策樹;
(b)只有擁有決策樹的信息物理單元知道所有決策樹的結點向量值。
步驟7.1)每個信息物理單元用自己的數據計算決策樹的結點向量值,只告知擁有決策樹的信息物理單元;
步驟7.2)擁有決策樹的信息物理單元累加所有決策樹的結點向量值并平均,得到一棵全局的決策樹;
(c)所有信息物理單元都不知道所有決策樹的結點向量值。
步驟7.1)每個信息物理單元用自己的數據計算決策樹的結點向量值;
步驟8)對于一個新實例的分類,針對步驟7)中的三種情況:
(a)步驟8.1)每個信息物理單元都持有全局決策樹,直接在本地分類;
(b)步驟8.1)需要分類的信息物理單元為門限加法同態公鑰密碼產生一個公私密鑰對,并向證書管理單元申請頒發自己構造的證書,若證書申請不成功,則需要重新進行步驟8.1),所述的門限加法同態公鑰密碼是一種公鑰密碼,只有當有達到門限數量的單元同意解密時,持有私鑰的單元才可以解密;
步驟8.2)申請證書成功后,需要分類的信息物理單元向擁有決策樹的信息物理單 元發出分類請求;
步驟8.3)擁有決策樹的信息物理單元將全局決策樹的結點向量值用證書中的公鑰加密后回送給需要分類的信息物理單元;
步驟8.4)需要分類的信息物理單元根據回送的加密值檢索分類的實例到達的所有結點,并將所有加密的結點向量值相乘;
步驟8.5)需要分類的信息物理單元辦理門限解密,檢索分類結果;
(c)步驟8.1)需要分類的信息物理單元為門限加法同態公鑰密碼產生一個公私密鑰對,并向證書管理單元申請自己構造的證書,若證書申請不成功,則需要重新進行步驟8.1)
步驟8.2)申請證書成功后,需要分類的信息物理單元向所有信息物理單元發出分類請求;
步驟8.3)每個信息物理單元將全局決策樹的結點向量值用證書中的公鑰加密后回送給需要分類的信息物理單元;
步驟8.4)需要分類的信息物理單元根據回送的加密值檢索分類的實例到達的所有結點,并將所有加密的結點向量值相乘;
步驟8.5)需要分類的信息物理單元辦理門限解密,檢索分類結果。

關 鍵 詞:
一種 信息 物理 融合 系統 隱私 保護 數據 分類 方法
  專利查詢網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
關于本文
本文標題:一種信息物理融合系統隱私保護型數據分類方法.pdf
鏈接地址:http://www.rgyfuv.icu/p-6373544.html
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服客服 - 聯系我們

[email protected] 2017-2018 zhuanlichaxun.net網站版權所有
經營許可證編號:粵ICP備17046363號-1 
 


收起
展開
山东11选5中奖结果走势图