• / 12
  • 下載費用:30 金幣  

一種基于大數據的多源信息關聯方法.pdf

摘要
申請專利號:

CN201510459613.6

申請日:

2015.07.30

公開號:

CN104992075A

公開日:

2015.10.21

當前法律狀態:

授權

有效性:

有權

法律詳情: 授權|||實質審查的生效IPC(主分類):G06F 19/00申請日:20150730|||公開
IPC分類號: G06F19/00(2011.01)I 主分類號: G06F19/00
申請人: 浙江宇視科技有限公司
發明人: 成浩
地址: 310051浙江省杭州市濱江區西興街道江陵路88號10幢南座1-11層
優先權:
專利代理機構: 北京博思佳知識產權代理有限公司11415 代理人: 林祥
PDF完整版下載: PDF下載
法律狀態
申請(專利)號:

CN201510459613.6

授權公告號:

||||||

法律狀態公告日:

2018.07.13|||2016.02.03|||2015.10.21

法律狀態類型:

授權|||實質審查的生效|||公開

摘要

本發明提供一種基于大數據的多源信息關聯方法,包括:采集包含手機MAC地址和人臉的N個樣本,其中每一個樣本的手機MAC地址和人臉在同一地點采集;從N個樣本中篩選出出現次數超過第一預設閾值的手機MAC地址集合;針對集合中的每一個MAC地址,計算該MAC地址綁定其所在M個樣本中的每一組相同人臉的置信度R;根據置信度R確定該MAC地址綁定一組相同人臉是否成功。本發明的方案基于大數據的規律性定律,解決了視頻監控系統采集的人臉數據和WIFI AP采集的手機MAC地址兩個緯度的人員身份數據對同一目標建立綁定關系的問題。

權利要求書

權利要求書
1.  一種基于大數據的多源信息關聯方法,該方法用于關聯手機MAC地址和人臉,其特征在于,該方法包括:
采集包含手機MAC地址和人臉的N個樣本,其中每一個樣本的手機MAC地址和人臉在同一地點采集;
從N個樣本中篩選出出現次數超過第一預設閾值的手機MAC地址集合;
針對集合中的每一個MAC地址,計算該MAC地址綁定其所在M個樣本中的每一組相同人臉的置信度R;
如果該MAC地址綁定某一組相同人臉的置信度大于第二預設閾值,且與該MAC地址綁定其他任何一組相同人臉的置信度的差大于第三預設閾值,則該MAC地址綁定該某一組相同人臉成功;如果該MAC地址綁定任何一組相同人臉的置信度均小于第四預設閾值,則該MAC地址綁定人臉失敗;如果該MAC地址綁定一組相同人臉的置信度和綁定另一組人臉的置信度相同或者差值小于第五預設閾值,則該MAC地址綁定人臉失敗。

2.  如權利要求1所述的方法,其特征在于,當N個樣本均在同一地點采集時,所述針對集合中的每一個MAC地址,計算該MAC地址綁定其所在M個樣本中的每一組相同人臉的置信度R包括:
獲取所述M個樣本中的一組相同人臉各自的采集時間,計算該組相同人臉中的每一個的采集時間與同一樣本中的所述MAC地址采集時間的差值T;
所述置信度R等于各個子置信度的和;其中,每個子置信度根據該組相同人臉中的每一個的采集時間與同一樣本中的所述MAC地址采集時間的差值T來計算;所述T越大,則子置信度越小。

3.  如權利要求2所述的方法,其特征在于,所述每個子置信度根據該組相同人臉中的每一個的采集時間與同一樣本中的所述MAC地址采集時間的差值T來計算包括:
該子置信度等于置信度基數的i次方,其中,置信度基數為小于1的正 數,i等于k*T,k為調節常數。

4.  如權利要求1所述的方法,其特征在于,當N個樣本不是在同一地點采集的情況下,所述針對集合中的每一個MAC地址,計算該MAC地址綁定其所在M個樣本中的每一組相同人臉的置信度R包括:
確定相同人臉在同一地點分別出現的次數Li以及計算同一地點采集的該組相同人臉綁定MAC地址的置信度Ri,根據所述Li和Ri以及該組人臉出現的地點數量a計算所述置信度R;
其中,計算置信度Ri包括:
獲取同一地點采集的該組相同人臉各自的采集時間,計算同一地點采集的該組相同人臉中的每一個的采集時間與同一樣本中的所述MAC地址采集時間的差值T;
所述置信度Ri等于各個子置信度的和;其中,每個子置信度根據同一地點該組相同人臉中的每一個的采集時間與同一樣本中的所述MAC地址采集時間的差值T來計算;所述T越大,則子置信度越小。

5.  如權利要求4所述的方法,其特征在于,所述置信度R按照如下公式計算:其中,ΣRi表示各地點采集的一組相同人臉綁定MAC地址的置信度之和;ΣLi表示一組相同人臉在不同地點出現的次數之和。

6.  一種基于大數據的多源信息關聯裝置,該裝置用于關聯手機MAC地址和人臉,其特征在于,該裝置包括:
樣本采集模塊,用于采集包含手機MAC地址和人臉的N個樣本,其中每一個樣本的手機MAC地址和人臉在同一地點采集;
MAC地址篩選模塊,用于從N個樣本中篩選出出現次數超過第一預設閾值的手機MAC地址集合;
置信度計算模塊,用于針對集合中的每一個MAC地址,計算該MAC地址綁定其所在M個樣本中的每一組相同人臉的置信度R;
綁定模塊,用于如果該MAC地址綁定某一組相同人臉的置信度大于第二預設閾值,且與該MAC地址綁定其他任何一組相同人臉的置信度的差大于第三預設閾值,則該MAC地址綁定該某一組相同人臉成功;如果該MAC地址綁定任何一組相同人臉的置信度均小于第四預設閾值,則該MAC地址綁定人臉失敗;如果該MAC地址綁定一組相同人臉的置信度和綁定另一組人臉的置信度相同或者差值小于第五預設閾值,則該MAC地址綁定人臉失敗。

7.  如權利要求6所述的裝置,其特征在于,當N個樣本均在同一地點采集時,所述置信度計算模塊計算置信度包括:
獲取所述M個樣本中的一組相同人臉各自的采集時間,計算該組相同人臉中的每一個的采集時間與同一樣本中的所述MAC地址采集時間的差值T;
所述置信度R等于各個子置信度的和;其中,每個子置信度根據該組相同人臉中的每一個的采集時間與同一樣本中的所述MAC地址采集時間的差值T來計算;所述T越大,則子置信度越小。

8.  如權利要求7所述的裝置,其特征在于,置信度計算模塊計算子置信度包括:
該子置信度等于置信度基數的i次方,其中,置信度基數為小于1的正數,i等于k*T,k為調節常數。

9.  如權利要求6所述的裝置,其特征在于,當N個樣本不是在同一地點采集的情況下,置信度計算模塊計算置信度包括:
確定相同人臉在同一地點分別出現的次數Li以及計算同一地點采集的該組相同人臉綁定MAC地址的置信度Ri,根據所述Li和Ri以及該組人臉出現的地點數量a計算所述置信度R;
該置信度模塊計算置信度Ri時包括:獲取同一地點采集的該組相同人臉各自的采集時間,計算同一地點采集的該組相同人臉中的每一個的采集時間與同一樣本中的所述MAC地址采集時間的差值T;所述置信度Ri等于各個子置信度的和;其中,每個子置信度根據同一地點該組相同人臉中的每一個 的采集時間與同一樣本中的所述MAC地址采集時間的差值T來計算;所述T越大,則子置信度越小。

10.  如權利要求9所述的裝置,其特征在于,置信度計算模塊按照如下公式計算置信度R:其中,ΣRi表示各地點采集的一組相同人臉綁定MAC地址的置信度之和;ΣLi表示一組相同人臉在不同地點出現的次數之和。

說明書

說明書一種基于大數據的多源信息關聯方法
技術領域
本發明涉及大數據技術領域,尤其涉及一種基于大數據的多源信息關聯方法。
背景技術
隨著機器視覺、智能傳感器、大數據等新技術的引入,安防監控系統逐步走向智能化。對運動目標的檢測、識別、跟蹤、時空軌跡分析,已經成為安防監控行業需要解決的關鍵問題之一。其中,對運動目標的身份識別是上述問題解決的基礎,因為只有識別出目標的唯一身份,才能基于目標匯總海量時空點數據,從而可以對目標的時空活動軌跡做進一步的分析。
從安防的運動目標來看,主要分成車和人。
無論是基于監控視頻圖像數據、還是智能傳感器數據,對車的身份識別技術相對比較成熟。在智能交通系統中,智能卡口、電警等前端設備可以在各種背景環境下,較穩定的提取出經過車輛的車牌、車型、車身顏色等各維度的數據。通過“車牌+車型”的組合識別,系統可以實現對車輛的唯一身份識別。基于RFID等傳感器設備,可以通過RFID閱讀器,捕獲所經過車輛的唯一電子車牌的身份數據,從而可以實現對車輛的唯一身份識別。
在基于視頻圖像數據對人員進行身份識別方面,目前主要采用的是人臉特征提取與識別技術。該技術方案一般實現如下:在封閉場所的入口,部署人員卡口相機。該相機能夠自動捕獲經過人員的人臉區域圖片,并將圖片發送到后臺的人臉識別設備。人臉識別設備通過人臉特征提取算法,從圖片中提取出人臉的關鍵特征向量數據。然后,按照一定的匹對算法,將該特征向 量與所存儲的海量人臉特征數據逐一進行匹對。
如果匹對計算得到的置信度值達到閾值,則認為兩張人臉圖片很可能是同一目標的人臉。
安防領域的視頻圖像具有特殊性,氣候條件不固定(晴天、雨天、霧霾天、雪天、大風、風沙)、光照條件不固定(順光、逆光、強光、雨天反光、陰影)、視頻場景復雜多樣(室內、室外)、人臉種類繁多等等,很難找到一種很好的具有很強辨別力的模型,能夠把不同類別的人臉樣本特征在特征空間中,完美的做聚類與劃分。
因此,基于人臉特征數據對人進行目標身份識別,應用范圍有限,只能在某些背景環境相對固定(出入口)、光照條件較好(白天)的場景下進行應用,尚無法推廣到各種復雜場景下。
發明內容
有鑒于此,本發明提供一種基于大數據的多源信息關聯方法和裝置。該方法和裝置用于關聯手機MAC地址和人臉。
該基于大數據的多源信息關聯方法包括:采集包含手機MAC地址和人臉的N個樣本,其中每一個樣本的手機MAC地址和人臉在同一地點采集;從N個樣本中篩選出出現次數超過第一預設閾值的手機MAC地址集合;針對集合中的每一個MAC地址,計算該MAC地址綁定其所在M個樣本中的每一組相同人臉的置信度R;如果該MAC地址綁定某一組相同人臉的置信度大于第二預設閾值,且與該MAC地址綁定其他任何一組相同人臉的置信度的差大于第三預設閾值,則該MAC地址綁定該某一組相同人臉成功;如果該MAC地址綁定任何一組相同人臉的置信度均小于第四預設閾值,則該MAC地址綁定人臉失敗;如果該MAC地址綁定一組相同人臉的置信度和綁定另一組人臉的置信度相同或者差值小于第五預設閾值,則該MAC地址綁定人臉失敗。
該基于大數據的多源信息關聯裝置包括:樣本采集模塊,用于采集包含 手機MAC地址和人臉的N個樣本,其中每一個樣本的手機MAC地址和人臉在同一地點采集;MAC地址篩選模塊,用于從N個樣本中篩選出出現次數超過第一預設閾值的手機MAC地址集合;置信度計算模塊,用于針對集合中的每一個MAC地址,計算該MAC地址綁定其所在M個樣本中的每一組相同人臉的置信度R;綁定模塊,用于如果該MAC地址綁定某一組相同人臉的置信度大于第二預設閾值,且與該MAC地址綁定其他任何一組相同人臉的置信度的差大于第三預設閾值,則該MAC地址綁定該某一組相同人臉成功;如果該MAC地址綁定任何一組相同人臉的置信度均小于第四預設閾值,則該MAC地址綁定人臉失敗;如果該MAC地址綁定一組相同人臉的置信度和綁定另一組人臉的置信度相同或者差值小于第五預設閾值,則該MAC地址綁定人臉失敗。
相較于現有技術,本發明的方案基于大數據的規律性定律,解決了視頻監控系統采集的人臉數據和WIFI AP采集的手機MAC地址兩個緯度的人員身份數據對同一目標建立綁定關系的問題。
附圖說明
圖1是本發明實施例流程圖。
圖2是數據采集區域示例圖。
圖3是樣本示例圖。
圖4是本發明實施例裝置邏輯結構圖。
具體實施方式
目前,智能手機越來越普及,已經逐步成為了人們的必備物品。智能手機上一般安裝了微信、網上銀行等與人員身份強綁定的服務軟件,因此手機MAC地址可以逐步成為人員身份的一種標識。
在城市的某些地點(比如賓館、咖啡店、機場等),免費WIFI已經成為一種比較普遍的服務。
利用智能手機自動掃描WIFI網絡的特性,提供WIFI服務的AP可以自動獲取到手機MAC地址、手機與AP的距離等信息。利用這些數據,可以進一步得到人員活動的時空軌跡。
但是通過WIFI AP采集到的數據,只有手機MAC地址數據,與安防監控系統的海量視頻數據之間沒有關聯關系。既無法通過視頻進行人員身份確認,同時也無法對人員的具體行為進行分析,在安防監控領域的應用有限。
本發明基于大數據的規律性定律,解決安防視頻監控系統采集的人臉、WIFI AP采集的手機MAC地址兩個維度的人員身份數據對同一目標(人)建立綁定關系的問題。
當對同一目標(人)建立多緯度的身份標識數據之后,后續只要能夠采集到任一緯度的數據,就可以認為目標在當前時空點出現,從而有效擴展人員定位的應用場景,為人員時空軌跡分析打下更好的數據基礎。以下通過具體實施例詳細說明。
實施例一
請參圖1所示的一種建立手機MAC地址和人臉綁定關系的流程圖。
S11、在同一地點采集包含手機MAC地址和人臉的N個樣本。
為保障在同一地點盡可能完整的采集到同一目標(人)的人臉和手機MAC數據,采集地點需要是封閉區域。在區域的出入口位置安裝人臉卡口相機,這樣只要人員進入該區域,就能夠采集到人臉。WIFI AP采集的手機MAC地址需要是進入該封閉區域的人員的手機MAC地址,所以WIFI AP需要能夠基于手機與AP的距離、AP與封閉區域邊緣的大致距離等進行數據過濾,只采集封閉區域內的手機MAC地址。采集地點最好是同一目標(人)頻繁出現的地點,比如小區、賓館、咖啡店、博物館、超市、銀行等。
請參圖2給出一個數據采集區域示例圖。圓形區域為WIFI AP的信號覆蓋范圍,該范圍內的智能手機全部能檢測到。扇形區域為攝像機的數據采集范圍,當人員進入該區域時,相機就捕獲進入該區域的人臉。
一個樣本采集的例子如下:該樣本是在一小區采集的數據,采集時間為 下午5點~8點進入小區的人的人臉數據和這些人的手機MAC地址,這些人臉數據和手機MAC地址構成一個樣本。連續采集N天,這樣就得到N個樣本。圖3給出了一個樣本的示例。
S12、從N個樣本中篩選出出現次數超過第一預設閾值的手機MAC地址集合。
比如說第一預設閾值可以設置為N/10,若N為1000,則第一預設閾值為100。當MAC1出現在樣本1、樣本5、樣本16、樣本32等100個以上樣本中時,MAC1被選出。通過該步驟S12,可以篩選出若干個MAC地址。
S13、針對集合中的每一個MAC地址,計算該MAC地址綁定其所在M個樣本中的每一組相同人臉的置信度R。
以MAC1為例,計算該MAC1綁定其所在M個樣本中的一組相同人臉的置信度R包括:1)獲取該M個樣本中的一組相同人臉各自的采集時間,計算每一個所述相同人臉采集時間與同一樣本中MAC1采集時間的差值T;2)根據每一個差值T計算子置信度;3)置信度R等于各子置信度的和。差值T越小,子置信度越大,置信度R越大。
以表1給出的數據為例來說明置信度R的計算過程。請參表1,該表的第1列表示MAC1出現的M個樣本,該表的第2列表示樣本包含的人臉。從該表可以看出,MAC1出現在樣本1、樣本5、樣本16……樣本S這M個樣本中;其中,樣本1包含人臉1、人臉2、人臉3、人臉4…...人臉n1;樣本5包含人臉1、人臉4、人臉7、人臉8……人臉n2;樣本16包含人臉1、人臉3、人臉4、人臉19……人臉n3;樣本S包含人臉1、人臉12、人臉19、人臉25……人臉ni。
樣本1人臉1、人臉2、人臉3、人臉4……人臉n1樣本5人臉1、人臉4、人臉7、人臉8……人臉n2樣本16人臉1、人臉3、人臉4、人臉19……人臉n3…………樣本S人臉1、人臉12、人臉19、人臉25……人臉ni
表1
樣本1中的人臉1、樣本5中的人臉1、樣本16中的人臉1以及其它相關樣本(相關樣本指MAC1所在樣本)中的人臉1是MAC1所在的M個樣本中一組相同人臉;樣本1中的人臉2以及其他相關樣本中的人臉2是MAC1所在M個樣本中的又一組相同人臉;樣本1中的人臉3、樣本16中的人臉3以及其他相關樣本中的人臉3是MAC1所在M個樣本中的又一組相同人臉。MAC1所在的M個樣本中存在若干組相同的人臉,這里不再一一舉例說明。
下面以MAC1綁定人臉1的置信度R為例來說明上述置信度R的計算過程。
獲取樣本1中的人臉1的采集時間t1、樣本5中的人臉1的采集時間t2、樣本16中的人臉1的采集時間t3以及其它相關樣本中的人臉1的采集時間。如果樣本1中的MAC1的采集時間為t1’,樣本5中的MAC1的采集時間為t2’,樣本16中的MAC1的采集時間為t3’,其他相關樣本中的MAC1的采集時間不再列舉;上述每一個人臉1的采集時間與同一樣本中MAC1采集時間的差值T分別為:|t1-t1’|,|t2-t2’|,|t3-t3’|……。||表示絕對值,省略號表示省略其他相關樣本中人臉采集時間與MAC1采集時間的差值。
每個人臉1的采集時間與同一樣本中MAC1采集時間的差值T越小,人臉1和MAC1屬于同一人的可能性越大,所以可以用小于1的常數的T次方來計算子置信度r,然后將各子置信度r相加得到置信度R。這里將小于1的常數k稱為置信度基數,可以選取經驗值0.8。為了計算方便,可以對差值T進行調整,比如說將T(以分鐘為單位)/60得到的結果作為時間差單元數i,然后以置信度基數的i次方作為子置信度,將所有的子置信度相加得到置信度R。按照前述例子,前述式子中,每一個加數為一個子置信度。這里的子置信度的計算方法是一個例子,本發明不排除其他子置信度的計算方法。
MAC1綁定其他組人臉,比如說人臉2、人臉3等的置信度的計算方法同上,這里不再贅述。
步驟S12中篩選出的除MAC1外的其他MAC地址綁定其所在樣本中的每一組相同人臉的置信度R的計算方法參照上文,這里也不再描述。
S14、根據置信度R確定該MAC地址綁定一組相同人臉是否成功。
如果該MAC地址綁定某一組相同人臉的置信度大于第二預設閾值,且與該MAC地址綁定其他任何一組相同人臉的置信度的差大于第三預設閾值,則該MAC地址綁定該某一組相同人臉成功;如果該MAC地址綁定任何一組相同人臉的置信度均小于第四預設閾值,則該MAC地址綁定人臉失敗;如果該MAC地址綁定一組相同人臉的置信度和綁定另一組人臉的置信度相同或者差值小于第五預設閾值,則該MAC地址綁定人臉失敗。
比如說MAC1綁定人臉1的置信度超過100,且遠遠大于MAC1綁定其他人臉的置信度,就可以認為該MAC1和人臉1綁定成功,即MAC1和人臉1屬于同一個人。如果MAC1綁定任何一組相同人臉的置信度均小于20,則該MAC1綁定人臉失敗,即不能找出該MAC1和哪個人臉屬于同一個人。如果MAC1綁定人臉1和綁定人臉2的置信度差別不大,比如說一個為110,一個為115,則不能確定該MAC1和人臉1是同一個人還是該MAC1和人臉2是同一個人,所以綁定失敗。
對于綁定失敗的情況,可以通過增加樣本的方式重新進行綁定。
實施例二
實施例二和實施例一的主要區別在于樣本不在唯一的一個地點采集,而是在多個地點進行采集。比如說,N個樣本,有的在咖啡館采集,有的在圖書館采集,有的則在小區采集等等。在進行手機MAC地址和人臉綁定置信度計算的時候不僅考慮時間相關性(對于同一樣本,如果某個手機MAC與某個人臉特征序列的采集時間越接近,則兩者存在綁定關系的置信度越高),而且還要考慮空間相關性(對于同一地點,某個手機MAC地址與某個人臉出現次數越多,則兩者存在綁定關系的置信度越高)。下面對實施例二進行詳細說明。
S21、采集包含手機MAC地址和人臉的N個樣本,其中每一個樣本的 手機MAC地址和人臉在同一地點采集。
一個樣本采集的例子如下:在某天的特定時間段,比如上午8點到12點,分別在20個不同的地點采集手機MAC地址和人臉,這樣就得到20個樣本;連續采集N/20天,這樣就得到N個樣本,N建議大于10000。不同地點也可以選擇不同的采集時間;數據采集時間可以選擇人流量大的時間。
同樣,為保障在同一地點盡可能完整的采集到同一目標(人)的人臉和手機MAC數據,采集地點需要是封閉區域。在區域的出入口位置安裝人臉卡口相機,WIFI AP采集的手機MAC地址需要是進入該封閉區域的人員的手機MAC地址。采集地點最好是同一目標(人)頻繁出現的地點,比如賓館、咖啡店、博物館、超市、銀行等。
S22、從N個樣本中篩選出出現次數超過第一預設閾值的手機MAC地址集合。
S23、針對集合中的每一個MAC地址,計算該MAC地址綁定其所在M個樣本中的每一組相同人臉的置信度R。
對于步驟S23,又可以分別計算影響置信度R的兩個因子:相同人臉在同一地點分別出現的次數Li(i為1時,L1表示相同人臉在地點1出現的次數)以及同一地點采集的該組相同人臉綁定MAC地址的置信度Ri(i表示地點,當i為1時,R1表示地點1采集的一組相同人臉綁定MAC1的置信度)。
然后根據上述兩個因子計算總的置信度R。
參表2,MAC1出現在樣本1、樣本5、樣本16……樣本S這M個樣本中;其中,樣本1的采集地點為:地點1,包含人臉1、人臉2、人臉3、人臉4…...人臉n1;樣本5的采集地點為:地點2,包含人臉1、人臉4、人臉7、人臉8……人臉n2;樣本16的采集地點為:地點1,包含人臉1、人臉3、人臉4、人臉19……人臉n3;樣本S的采集地點為:地點k,包含人臉1、人臉12、人臉19、人臉25……人臉ni。
樣本1地點1人臉1、人臉2、人臉3、人臉4……人臉n1樣本5地點2人臉1、人臉4、人臉7、人臉8……人臉n2
樣本16地點1人臉1、人臉3、人臉4、人臉19……人臉n3………………樣本S地點k人臉1、人臉12、人臉19、人臉25……人臉ni
表2
在計算MAC1綁定人臉1的置信度R的時候,確定人臉1在地點1出現的次數,從表2可以看出,樣本1、樣本16的采集地點均為地點1,這兩個樣本中均有人臉1,這樣人臉1就出現了2次;同樣,如果MAC1出現的其他樣本,采集地點為地點1,且該其他樣本中包含人臉1,則人臉1出現的次數再進行累加。這樣,就能基于MAC1所在的樣本得到人臉1在地點1出現的次數。同樣的,可以得到其他人臉在各地點出現的次數。
在計算同一地點采集的一組相同人臉綁定MAC地址的置信度Ri時,可以參考實施例一的方法。比如說,計算地點1采集的人臉1綁定MAC1的置信度時,只要計算出現在樣本1、樣本16等地點1采集的樣本中的人臉1綁定MAC1的置信度。
在根據一組相同人臉在同一地點出現的次數和同一地點采集的該組相同人臉綁定MAC地址的置信度Ri計算置信度R時可以采用下面的公式:
R=(Σ(Ri*LiΣLi))*ΣRia]]>
其中,ΣRi表示各地點采集的一組相同人臉綁定MAC地址的置信度之和;ΣLi表示一組相同人臉在不同地點出現的次數之和,a表示該組相同人臉出現地點的數量。
還是以MAC1綁定人臉1為例進行說明。假設MAC1出現在樣本1~樣本20,其中樣本1~樣本5的采集地點為地點1,樣本6~樣本10的采集地點為地點2,樣本11~樣本15的采集地點為地點3,樣本16~樣本20的采集地點為地點4。人臉1出現在樣本1~樣本4,樣本16~樣本18。這樣人臉1在地點1出現了4次,在地點4出現了3,總共出現了7次。所以,ΣLi的值為7。對于地點1,假設MAC1綁定人臉1的置信度為3,對于地點4,假設MAC1綁定人臉1的置信度為1.8,則R=(3*(4/7)+1.8*(3/7))*(3+1.8) /2。
MAC1綁定其他組人臉,比如說人臉2、人臉3等的置信度的計算方法同上,這里不再贅述。
步驟S22中篩選出的除MAC1外的其他MAC地址綁定其所在樣本中的每一組相同人臉的置信度R的計算方法參照上文,這里也不再描述。
本發明的方案基于大數據的規律性定律,解決了“視頻監控系統采集的人臉數據、WIFI AP采集的手機MAC地址等兩個緯度的人員身份數據對同一目標(人)建立綁定關系”的問題。對同一目標(人)建立多緯度的身份標識數據之后,后續只要能夠采集到任一緯度的數據,就可以認為目標在當前時空點出現,從而有效擴展人員定位的應用場景,從而為人員時空軌跡分析打下更好的數據基礎。
基于同樣的構思,本發明還提供一種基于大數據的多源信息關聯裝置,該裝置用于關聯手機MAC地址和人臉,該裝置包括:樣本采集模塊、MAC地址篩選模塊、置信度計算模塊和綁定模塊,請參圖4。
樣本采集模塊,用于采集包含手機MAC地址和人臉的N個樣本,其中每一個樣本的手機MAC地址和人臉在同一地點采集。
MAC地址篩選模塊,用于從N個樣本中篩選出出現次數超過第一預設閾值的手機MAC地址集合。
置信度計算模塊,用于針對集合中的每一個MAC地址,計算該MAC地址綁定其所在M個樣本中的每一組相同人臉的置信度R。
綁定模塊,用于如果該MAC地址綁定某一組相同人臉的置信度大于第二預設閾值,且與該MAC地址綁定其他任何一組相同人臉的置信度的差大于第三預設閾值,則該MAC地址綁定該某一組相同人臉成功;如果該MAC地址綁定任何一組相同人臉的置信度均小于第四預設閾值,則該MAC地址綁定人臉失敗;如果該MAC地址綁定一組相同人臉的置信度和綁定另一組人臉的置信度相同或者差值小于第五預設閾值,則該MAC地址綁定人臉失敗。
當N個樣本均在同一地點采集時,所述置信度計算模塊計算置信度包括:獲取所述M個樣本中的一組相同人臉各自的采集時間,計算該組相同人臉中的每一個的采集時間與同一樣本中的所述MAC地址采集時間的差值T;所述置信度R等于各個子置信度的和;其中,每個子置信度根據該組相同人臉中的每一個的采集時間與同一樣本中的所述MAC地址采集時間的差值T來計算;所述T越大,則子置信度越小。
置信度計算模塊計算子置信度包括:該子置信度等于置信度基數的i次方,其中,置信度基數為小于1的正數,i等于k*T,k為調節常數。
當N個樣本不是在同一地點采集的情況下,置信度計算模塊計算置信度包括:確定相同人臉在同一地點分別出現的次數Li以及計算同一地點采集的該組相同人臉綁定MAC地址的置信度Ri,根據所述Li和Ri以及該組人臉出現的地點數量a計算所述置信度R;該置信度模塊計算置信度Ri時包括:獲取同一地點采集的該組相同人臉各自的采集時間,計算同一地點采集的該組相同人臉中的每一個的采集時間與同一樣本中的所述MAC地址采集時間的差值T;所述置信度Ri等于各個子置信度的和;其中,每個子置信度根據同一地點該組相同人臉中的每一個的采集時間與同一樣本中的所述MAC地址采集時間的差值T來計算;所述T越大,則子置信度越小。
置信度計算模塊按照如下公式計算置信度R:其中,Ri表示各地點采集的一組相同人臉綁定MAC地址的置信度之和;ΣLi表示一組相同人臉在不同地點出現的次數之和。
以上所述僅為本發明的較佳實施例而已,并不用以限制本發明,凡在本發明的精神和原則之內,所做的任何修改、等同替換、改進等,均應包含在本發明保護的范圍之內。

關 鍵 詞:
一種 基于 數據 信息 關聯 方法
  專利查詢網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
關于本文
本文標題:一種基于大數據的多源信息關聯方法.pdf
鏈接地址:http://www.rgyfuv.icu/p-6353523.html
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服客服 - 聯系我們

[email protected] 2017-2018 zhuanlichaxun.net網站版權所有
經營許可證編號:粵ICP備17046363號-1 
 


收起
展開
山东11选5中奖结果走势图