• / 25
  • 下載費用:30 金幣  

用戶行為的風險評估方法及裝置.pdf

摘要
申請專利號:

CN201510342295.5

申請日:

2015.06.18

公開號:

CN106257507A

公開日:

2016.12.28

當前法律狀態:

實審

有效性:

審中

法律詳情: 實質審查的生效IPC(主分類):G06Q 10/06申請日:20150618|||公開
IPC分類號: G06Q10/06(2012.01)I 主分類號: G06Q10/06
申請人: 阿里巴巴集團控股有限公司
發明人: 沈雄
地址: 英屬開曼群島大開曼資本大廈一座四層847號郵箱
優先權:
專利代理機構: 北京博浩百睿知識產權代理有限責任公司 11134 代理人: 宋子良
PDF完整版下載: PDF下載
法律狀態
申請(專利)號:

CN201510342295.5

授權公告號:

|||

法律狀態公告日:

2017.01.25|||2016.12.28

法律狀態類型:

實質審查的生效|||公開

摘要

本發明公開了一種用戶行為的風險評估方法及裝置。其中,該方法包括:獲取第一賬戶在第一預設時間段內執行第一行為所對應的用戶行為頻率;獲取用戶行為頻率對應的反轉行為頻率;根據用戶行為頻率以及反轉行為頻率,得到第一行為對應的第一特征值;根據第一行為對應的第一特征值,計算第一特征值在所有賬戶的所有行為的特征值中所占的特征比例;基于特征比例以及預先獲取的用戶行為參數,得到第一賬戶在第一預設時間段內執行第一行為的風險評估結果。本發明解決了現有技術由于僅基于用戶行為頻率進行用戶行為的風險評估,造成的在一些特殊的情況下,風險評估結果錯誤率較高的技術問題。

權利要求書

1.一種用戶行為的風險評估方法,其特征在于,包括:
獲取第一賬戶在第一預設時間段內執行第一行為所對應的用戶行為頻率;
獲取所述用戶行為頻率對應的反轉行為頻率,其中,所述反轉行為頻率是根
據第一總數和第二總數得到的,所述第一總數是指在所述第一預設時間段內所有
賬戶的第一行為的數量,所述第二總數是指在所述第一預設時間段內所有賬戶的
所有行為的數量;
根據所述用戶行為頻率以及所述反轉行為頻率,得到所述第一行為對應的第
一特征值;
根據所述第一行為對應的所述第一特征值,計算所述第一特征值在所有賬戶
的所有行為的特征值中所占的特征比例;
基于所述特征比例以及預先獲取的用戶行為參數,得到所述第一賬戶在所述
第一預設時間段內執行所述第一行為的風險評估結果。
2.根據權利要求1所述的方法,其特征在于,所述獲取第一賬戶在第一預設時間段
內執行第一行為所對應的用戶行為頻率,包括:
確定第三總數和第四總數,其中,所述第三總數是指所述第一賬戶在所述第
一預設時間段內執行所述第一行為的數量,所述第四總數是指所述第一賬戶在所
述第一預設時間段內的所有行為的數量;
依據所述第三總數和所述第四總數,計算所述用戶行為頻率。
3.根據權利要求1所述的方法,其特征在于,所述獲取所述用戶行為頻率對應的反
轉行為頻率,包括:
確定所述第一總數和所述第二總數;
通過公式I=lg(k/q),計算所述反轉行為頻率,其中,I表示所述反轉行為
頻率,k表示所述第二總數,q表示所述第一總數。
4.根據權利要求1所述的方法,其特征在于,所述根據所述第一行為對應的所述第
一特征值,計算所述第一特征值在所有賬戶的所有行為的特征值中所占的特征比
例,包括:
通過公式得到所述第一特征值在所有賬戶的所有行為的
特征值中所占的特征比例,其中,aj表示所述第一特征值,P(aj)用于表示aj在
所有賬戶的所有行為的特征值所占的所述特征比例,j為大于0的整數。
5.根據權利要求2所述的方法,其特征在于,
所述依據所述第三總數和所述第四總數,計算所述用戶行為頻率,包括:
將所述第三總數除以所述第四總數,得到所述用戶行為頻率;
所述根據所述用戶行為頻率以及所述反轉行為頻率,得到所述第一行為對應
的第一特征值,包括:
將所述用戶行為頻率乘以所述反轉行為頻率,得到所述第一行為對應的第一
特征值。
6.根據權利要求1至5中任一項所述的方法,其特征在于,在所述預先獲取的用戶
行為參數包括條件概率參數以及分類比例的情況下,獲取所述條件概率參數以及
所述分類比例的步驟包括:
創建訓練樣本集合,其中,所述訓練樣本集合至少包括一個樣本特征值以及
所述至少一個樣本特征值對應的風險評估標簽;
根據所述至少一個樣本特征值以及所述至少一個樣本特征值對應的所述風險
評估標簽,得到所述條件概率參數以及所述分類比例。
7.根據權利要求6所述的方法,其特征在于,所述創建訓練樣本集合,其中,所述
訓練樣本集合至少包括一個樣本特征值以及所述至少一個樣本特征值對應的風險
評估標簽,包括:
獲取在第二預設時間段內至少一個樣本賬戶的至少一個樣本用戶行為;
計算所述至少一個樣本用戶行為的樣本用戶行為頻率,以及所述樣本用戶行
為頻率對應的樣本反轉行為頻率,其中,所述樣本反轉行為頻率是根據第五總數
和第六總數得到的,所述第五總數是指在所述第二預設時間段內所有賬戶的所述
至少一個樣本用戶行為的數量以及在第二預設時間段內所有賬戶的所有行為的總
數得到的;
根據所述樣本用戶行為頻率以及所述樣本反轉行為頻率,得到所述至少一個
樣本特征值;
依據所述至少一個樣本特征值以及所述至少一個樣本特征值對應的風險評估
標簽創建所述訓練樣本集合。
8.根據權利要求7所述的方法,其特征在于,所述計算所述至少一個樣本用戶行為
的樣本用戶行為頻率,以及所述樣本用戶行為頻率對應的樣本反轉行為頻率,包
括:
將在所述第二預設時間段內所述至少一個樣本賬戶的所述至少一個樣本用戶
行為的數量除以在所述第二預設時間段內所述至少一個樣本賬戶的所有行為的數
量,得到所述至少一個樣本用戶行為的所述樣本用戶行為頻率;以及
通過公式I′=lg(k′/q′),計算所述樣本反轉行為頻率,其中,I′表示所述樣本
反轉行為頻率,k′表示所述第五總數,q′表示所述第六總數。
9.根據權利要求6所述的方法,其特征在于,所述根據所述至少一個樣本特征值以
及所述至少一個樣本特征值對應的所述風險評估標簽,得到所述條件概率參數以
及所述分類比例,包括:
通過公式得到所述條件概率參數,其中,所述P(a′j|ci)
用于表示a′j屬于ci的所述條件概率參數,a′j表示樣本特征值,ci表示所述風險評
估標簽,Count(a′j|ci)表示屬于ci出現a′j的次數,Count(ci)表示屬于ci的次數,其
中,0<j<n,n為所述訓練樣本集合中的樣本總數,0<i<m,m為風險評估標簽的種
類數,i,j均為整數;以及
通過公式得到所述分類比例,其中,P(ci)用于表示ci在
所有風險評估標簽中所占的所述分類比例。
10.根據權利要求9所述的方法,其特征在于,所述基于所述特征比例以及預先獲取
的用戶行為參數,得到所述第一賬戶在所述第一預設時間段內執行所述第一行為
的風險評估結果,包括:
通過公式得到所述第一賬戶在所述第一預設
時間段內執行所述第一行為的所述風險評估結果,其中,cMAP為所述第一賬戶在
所述第一預設時間段內執行所述第一行為的所述風險評估結果。
11.一種用戶行為的風險評估裝置,其特征在于,包括:
第一獲取單元,用于獲取第一賬戶在第一預設時間段內執行第一行為所對應
的用戶行為頻率;
第二獲取單元,用于獲取所述用戶行為頻率對應的反轉行為頻率,其中,所
述反轉行為頻率是根據第一總數和第二總數得到的,所述第一總數是指在所述第
一預設時間段內所有賬戶的第一行為的數量,所述第二總數是指在所述第一預設
時間段內所有賬戶的所有行為的數量;
處理單元,用于根據所述用戶行為頻率以及所述反轉行為頻率,得到所述第
一行為對應的第一特征值;
第一計算單元,用于根據所述第一行為對應的所述第一特征值,計算所述第
一特征值在所有賬戶的所有行為的特征值中所占的特征比例;
風險評估單元,用于基于所述特征比例以及預先獲取的用戶行為參數,得到
所述第一賬戶在所述第一預設時間段內執行所述第一行為的風險評估結果。
12.根據權利要求11所述的裝置,其特征在于,所述第一獲取單元包括:
第一確定子單元,用于確定第三總數和第四總數,其中,所述第三總數是指
所述第一賬戶在所述第一預設時間段內執行所述第一行為的數量,所述第四總數
是指所述第一賬戶在所述第一預設時間段內的所有行為的數量;
第一計算子單元,用于依據所述第三總數和所述第四總數,計算所述用戶行
為頻率。
13.根據權利要求11所述的裝置,其特征在于,所述第二獲取單元包括:
第二確定子單元,用于確定所述第一總數和所述第二總數;
第二計算子單元,用于通過公式I=lg(k/q),計算所述反轉行為頻率,其中,
I表示所述反轉行為頻率,k表示所述第二總數,q表示所述第一總數。
14.根據權利要求11所述的裝置,其特征在于,所述第一計算單元用于執行以下步驟
根據所述第一行為對應的所述第一特征值,計算所述第一特征值在所有賬戶的所
有行為的特征值中所占的特征比例:
通過公式得到所述第一特征值在所有賬戶的所有行為的
特征值中所占的特征比例,其中,aj表示所述第一特征值,P(aj)用于表示aj在
所有賬戶的所有行為的特征值所占的所述特征比例,j為大于0的整數。
15.根據權利要求12所述的裝置,其特征在于,
所述第一計算子單元用于執行以下步驟依據所述第三總數和所述第四總數,
計算所述用戶行為頻率:將所述第三總數除以所述第四總數,得到所述用戶行為
頻率;
所述處理單元用于執行以下步驟根據所述用戶行為頻率以及所述反轉行為頻
率,得到所述第一行為對應的第一特征值:將所述用戶行為頻率乘以所述反轉行
為頻率,得到所述第一行為對應的第一特征值。
16.根據權利要求11至15中任一項所述的裝置,其特征在于,在所述預先獲取的用
戶行為參數包括條件概率參數以及分類比例的情況下,所述裝置還包括:
創建單元,用于創建訓練樣本集合,其中,所述訓練樣本集合至少包括一個
樣本特征值以及所述至少一個樣本特征值對應的風險評估標簽;
第二計算單元,用于根據所述至少一個樣本特征值以及所述至少一個樣本特
征值對應的所述風險評估標簽,得到所述條件概率參數以及所述分類比例。
17.根據權利要求16所述的裝置,其特征在于,所述創建單元包括:
獲取子單元,用于獲取在第二預設時間段內至少一個樣本賬戶的至少一個樣
本用戶行為;
第三計算子單元,用于計算所述至少一個樣本用戶行為的樣本用戶行為頻率,
以及所述樣本用戶行為頻率對應的樣本反轉行為頻率,其中,所述樣本反轉行為
頻率是根據第五總數和第六總數得到的,所述第五總數是指在所述第二預設時間
段內所有賬戶的所述至少一個樣本用戶行為的數量以及在第二預設時間段內所有
賬戶的所有行為的總數得到的;
第四計算子單元,用于根據所述樣本用戶行為頻率以及所述樣本反轉行為頻
率,得到所述至少一個樣本特征值;
創建子單元,用于依據所述至少一個樣本特征值以及所述至少一個樣本特征
值對應的風險評估標簽創建所述訓練樣本集合。
18.根據權利要求17所述的裝置,其特征在于,所述第三計算子單元用于執行以下步
驟計算所述至少一個樣本用戶行為的樣本用戶行為頻率,以及所述樣本用戶行為
頻率對應的樣本反轉行為頻率:
將在所述第二預設時間段內所述至少一個樣本賬戶的所述至少一個樣本用戶
行為的數量除以在所述第二預設時間段內所述至少一個樣本賬戶的所有行為的數
量,得到所述至少一個樣本用戶行為的所述樣本用戶行為頻率;以及
通過公式I′=lg(k′/q′),計算所述樣本反轉行為頻率,其中,I′表示所述樣本
反轉行為頻率,k′表示所述第五總數,q′表示所述第六總數。
19.根據權利要求16所述的裝置,其特征在于,所述第二計算單元用于執行以下步驟
根據所述至少一個樣本特征值以及所述至少一個樣本特征值對應的所述風險評估
標簽,得到所述條件概率參數以及所述分類比例:
通過公式得到所述條件概率參數,其中,所述P(a′j|ci)
用于表示a′j屬于ci的所述條件概率參數,a′j表示樣本特征值,ci表示所述風險評
估標簽,Count(a′j|ci)表示屬于ci出現a′j的次數,Count(ci)表示屬于ci的次數,其
中,0<j<n,n為所述訓練樣本集合中的樣本總數,0<i<m,m為風險評估標簽的種
類數,i,j均為整數;以及
通過公式得到所述分類比例,其中,P(ci)用于表示ci在
所有風險評估標簽中所占的所述分類比例。
20.根據權利要求19所述的裝置,其特征在于,所述風險評估單元用于執行以下步驟
基于所述特征比例以及預先獲取的用戶行為參數,得到所述第一賬戶在所述第一
預設時間段內執行所述第一行為的風險評估結果:
通過公式得到所述第一賬戶在所述第一預設
時間段內執行所述第一行為的所述風險評估結果,其中,cMAP為所述第一賬戶在
所述第一預設時間段內執行所述第一行為的所述風險評估結果。

說明書

用戶行為的風險評估方法及裝置

技術領域

本發明涉及互聯網領域,具體而言,涉及一種用戶行為的風險評估方法及裝置。

背景技術

隨著互聯網的飛速發展,越來越多的用戶會在互聯網上產生一些用戶行為,例如,
用戶在某個網站執行了搜索、瀏覽、打分、購買等行為。隨著各種用戶行為的產生,
基于用戶行為的風險評估也就應運而生,用戶行為的風險評估是指由于用戶可能會利
用系統漏洞或者用戶被盜號,非本人操作時,用戶行為和平時有區分度,通過計算區
分度來判別該用戶是否異常。

現有技術的用戶行為的風險評估方法一般是根據用戶行為頻率來進行判斷,然而,
如果僅基于用戶行為頻率進行用戶行為的風險評估,那么在一些特殊的情況下,例如
受到雙11,大促銷等的影響,會判斷出很多用戶出現異常,即風險評估結果錯誤率較
高,造成用戶行為的風險評估準確性較低的問題。

針對上述的問題,目前尚未提出有效的解決方案。

發明內容

本發明實施例提供了一種用戶行為的風險評估方法及裝置,以至少解決現有技術
由于僅基于用戶行為頻率進行用戶行為的風險評估,造成的在一些特殊的情況下,風
險評估結果錯誤率較高的技術問題。

根據本發明實施例的一個方面,提供了一種用戶行為的風險評估方法,包括:獲
取第一賬戶在第一預設時間段內執行第一行為所對應的用戶行為頻率;獲取上述用戶
行為頻率對應的反轉行為頻率,其中,上述反轉行為頻率是根據第一總數和第二總數
得到的,上述第一總數是指在上述第一預設時間段內所有賬戶的第一行為的數量,上
述第二總數是指在上述第一預設時間段內所有賬戶的所有行為的數量;根據上述用戶
行為頻率以及上述反轉行為頻率,得到上述第一行為對應的第一特征值;根據上述第
一行為對應的上述第一特征值,計算上述第一特征值在所有賬戶的所有行為的特征值
中所占的特征比例;基于上述特征比例以及預先獲取的用戶行為參數,得到上述第一
賬戶在上述第一預設時間段內執行上述第一行為的風險評估結果。

根據本發明實施例的另一方面,還提供了一種用戶行為的風險評估裝置,包括:
第一獲取單元,用于獲取第一賬戶在第一預設時間段內執行第一行為所對應的用戶行
為頻率;第二獲取單元,用于獲取上述用戶行為頻率對應的反轉行為頻率,其中,上
述反轉行為頻率是根據第一總數和第二總數得到的,上述第一總數是指在上述第一預
設時間段內所有賬戶的第一行為的數量,上述第二總數是指在上述第一預設時間段內
所有賬戶的所有行為的數量;處理單元,用于根據上述用戶行為頻率以及上述反轉行
為頻率,得到上述第一行為對應的第一特征值;第一計算單元,用于根據上述第一行
為對應的上述第一特征值,計算上述第一特征值在所有賬戶的所有行為的特征值中所
占的特征比例;風險評估單元,用于基于上述特征比例以及預先獲取的用戶行為參數,
得到上述第一賬戶在上述第一預設時間段內執行上述第一行為的風險評估結果。

在本發明實施例中,采用獲取第一賬戶在第一預設時間段內執行第一行為所對應
的用戶行為頻率;獲取用戶行為頻率對應的反轉行為頻率,其中,反轉行為頻率是根
據第一總數和第二總數得到的,第一總數是指在第一預設時間段內所有賬戶的第一行
為的數量,第二總數是指在第一預設時間段內所有賬戶的所有行為的數量;根據用戶
行為頻率以及反轉行為頻率,得到第一行為對應的第一特征值;根據第一行為對應的
第一特征值,計算第一特征值在所有賬戶的所有行為的特征值中所占的特征比例;基
于特征比例以及預先獲取的用戶行為參數,得到第一賬戶在第一預設時間段內執行第
一行為的風險評估結果的方式,通過獲取第一賬戶的用戶行為頻率以及反轉行為頻率,
得到第一行為的特征比例,進而基于預先獲取的用戶行為參數得到第一行為的風險評
估結果,達到了準確對用戶行為進行風險評估的目的,從而實現了增加風險評估正確
率的技術效果,進而解決了現有技術由于僅基于用戶行為頻率進行用戶行為的風險評
估,造成的在一些特殊的情況下,風險評估結果錯誤率較高的技術問題。

附圖說明

此處所說明的附圖用來提供對本發明的進一步理解,構成本申請的一部分,本發
明的示意性實施例及其說明用于解釋本發明,并不構成對本發明的不當限定。在附圖
中:

圖1是根據本發明實施例的一種運行用戶行為的風險評估方法的計算機終端的硬
件結構框圖;

圖2是根據本發明實施例的一種可選的用戶行為的風險評估方法的流程示意圖;

圖3是根據本發明實施例的另一種可選的用戶行為的風險評估方法的流程示意圖;

圖4是根據本發明實施例的又一種可選的用戶行為的風險評估方法的流程示意圖;

圖5是根據本發明實施例的一種可選的用戶行為的風險評估裝置的結構示意圖;

圖6是根據本發明實施例的一種可選的第一獲取單元的結構示意圖;

圖7是根據本發明實施例的一種可選的第二獲取單元的結構示意圖;

圖8是根據本發明實施例的另一種可選的用戶行為的風險評估裝置的結構示意圖;

圖9是根據本發明實施例的一種可選的創建單元的結構示意圖。

具體實施方式

為了使本技術領域的人員更好地理解本發明方案,下面將結合本發明實施例中的
附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例
僅僅是本發明一部分的實施例,而不是全部的實施例。基于本發明中的實施例,本領
域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都應當屬于
本發明保護的范圍。

需要說明的是,本發明的說明書和權利要求書及上述附圖中的術語“第一”、“第
二”等是用于區別類似的對象,而不必用于描述特定的順序或先后次序。應該理解這
樣使用的數據在適當情況下可以互換,以便這里描述的本發明的實施例能夠以除了在
這里圖示或描述的那些以外的順序實施。此外,術語“包括”和“具有”以及他們的
任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單元的過程、方
法、系統、產品或設備不必限于清楚地列出的那些步驟或單元,而是可包括沒有清楚
地列出的或對于這些過程、方法、產品或設備固有的其它步驟或單元。

實施例1

根據本發明實施例,還提供了一種用戶行為的風險評估方法的方法實施例,需要
說明的是,在附圖的流程圖示出的步驟可以在諸如一組計算機可執行指令的計算機系
統中執行,并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不同
于此處的順序執行所示出或描述的步驟。

本申請實施例一所提供的方法實施例可以在移動終端、計算機終端或者類似的運
算裝置中執行。以運行在計算機終端上為例,圖1是本發明實施例的一種用戶行為的
風險評估方法的計算機終端的硬件結構框圖。如圖1所示,計算機終端10可以包括一
個或多個(圖中僅示出一個)處理器102(處理器102可以包括但不限于微處理器MCU
或可編程邏輯器件FPGA等的處理裝置)、用于存儲數據的存儲器104、以及用于通信
功能的傳輸裝置106。本領域普通技術人員可以理解,圖1所示的結構僅為示意,其
并不對上述電子裝置的結構造成限定。例如,計算機終端10還可包括比圖1中所示更
多或者更少的組件,或者具有與圖1所示不同的配置。

存儲器104可用于存儲應用軟件的軟件程序以及模塊,如本發明實施例中的用戶
行為的風險評估方法對應的程序指令/模塊,處理器102通過運行存儲在存儲器104
內的軟件程序以及模塊,從而執行各種功能應用以及數據處理,即實現上述的應用程
序的漏洞檢測方法。存儲器104可包括高速隨機存儲器,還可包括非易失性存儲器,
如一個或者多個磁性存儲裝置、閃存、或者其他非易失性固態存儲器。在一些實例中,
存儲器104可進一步包括相對于處理器102遠程設置的存儲器,這些遠程存儲器可以
通過網絡連接至計算機終端10。上述網絡的實例包括但不限于互聯網、企業內部網、
局域網、移動通信網及其組合。

傳輸裝置106用于經由一個網絡接收或者發送數據。上述的網絡具體實例可包括
計算機終端10的通信供應商提供的無線網絡。在一個實例中,傳輸裝置106包括一個
網絡適配器(Network Interface Controller,NIC),其可通過基站與其他網絡設備
相連從而可與互聯網進行通訊。在一個實例中,傳輸裝置106可以為射頻(Radio
Frequency,RF)模塊,其用于通過無線方式與互聯網進行通訊。

在上述運行環境下,本申請提供了如圖2所示的用戶行為的風險評估方法。圖2
是根據本發明實施例一的用戶行為的風險評估方法的流程圖。

如圖2所示,該用戶行為的風險評估方法可以包括如下實現步驟:

步驟S202,獲取第一賬戶在第一預設時間段內執行第一行為所對應的用戶行為頻
率。

本申請上述步驟S202中第一行為即用戶行為,可以包括用戶在網站上發生的所有
行為,如搜索、瀏覽、打分、點評、加入購物車、取出購物筐、加入期待列表(WishList)、
購買、使用減價券和退貨等;甚至可以包括在第三方網站上的相關行為,如比價、看
相關評測、參與討論、社交媒體上的交流、與好友互動等。

其中,本發明實施例的用戶行為的風險評估裝置在對第一賬戶進行用戶行為的風
險評估時,可以按天、周、月或任意時間區間獲取第一賬戶的行為數據,即獲取第一
賬戶在第一預設時間段內執行的第一行為,這里的第一行為實質上可以是一個事件組
合,即包括具體行為和對象,如第一行為可以是購買-生活用品或瀏覽-頁面等。

用戶行為的風險評估裝置在獲取了第一賬戶在第一預設時間段內執行的第一行為
之后,可以計算其對應的用戶行為頻率(Behaviour Frequency,BF)。對于第一賬戶,
用戶行為頻率是指時間窗口內的一個行為出現的次數除以時間窗口內的該第一賬戶的
所有行為的總數,其中,時間窗口即上述的第一預設時間段。

以第一行為包括“購買-生活用品”為例,第一賬戶在第一預設時間內的所有行為
的總數是100個,而在第一預設時間段內“購買-生活用品”出現了3次,那么“購買
-生活用品”的用戶行為頻率為3/100=0.03。

步驟S204,獲取用戶行為頻率對應的反轉行為頻率,其中,反轉行為頻率是根據
第一總數和第二總數得到的,第一總數是指在第一預設時間段內所有賬戶的第一行為
的數量,第二總數是指在第一預設時間段內所有賬戶的所有行為的數量。

本申請上述步驟S204中,反轉行為頻率(Inverse Behaviour Frequency,IBF)
是指時間窗口內所有賬戶執行“購買-生活用品”的數量,除以時間窗口內所有賬戶的
所有行為的總數。

仍舊以第一行為包括“購買-生活用品”為例,在第一預設時間段內,如果“購買
-生活用品”出現過1,000次,而該第一預設時間段內的所有賬戶的所有行為的總數是
10,000,000個的話,其反轉行為頻率為lg(10,000,000/1,000)=4。

步驟S206,根據用戶行為頻率以及反轉行為頻率,得到第一行為對應的第一特征
值。

本申請上述步驟S206中,第一特征值可以作為第一賬戶的分類或者聚類的重要特
征,本發明實施例中,可以通過將上述得到的用戶行為頻率乘以上述得到的反轉行為
頻率,進而得到第一行為對應的第一特征值,其中,第一特征值越大,則說明該第一
行為越明顯。

仍以第一行為包括“購買-生活用品”為例,根據上述得出的用戶行為頻率為0.03,
反轉行為頻率為4,得到第一特征值為BF*IBF=0.03*4=0.12。

需要說明的是,這里只是以第一行為包括“購買-生活用品”為例進行說明,當第
一行為還包括其他行為時,如“瀏覽-頁面”,其計算方法與上述方法相同,此處不做
贅述。

步驟S208,根據第一行為對應的第一特征值,計算第一特征值在所有賬戶的所有
行為的特征值中所占的特征比例。

本申請上述步驟S208中,用戶行為的風險評估裝置在基于用戶行為頻率以及反轉
行為頻率得到第一行為對應的第一特征值之后,需要計算出第一特征值在所有賬戶的
所有行為的特征值中所占的特征比例,以便后續作為風險評估的輸入參數。

其中,上述的所有賬戶的所有行為的特征值均可以按照上述步驟S202至步驟S206
所述的方法進行計算,此處不再贅述。

步驟S210,基于特征比例以及預先獲取的用戶行為參數,得到第一賬戶在第一預
設時間段內執行第一行為的風險評估結果。

本申請上述步驟S210中,預先獲取的用戶行為參數可以包括條件概率參數以及分
類比例,其中,條件概率參數以及分類比例是通過預先創建訓練樣本集合,并基于樸
素貝葉斯模型得到的,具體方法后續實施例中會進行詳細描述。

本發明實施例的用戶行為的風險評估裝置基于特征比例以及預先獲取的用戶行為
參數,即可以對第一賬戶在第一預設時間段內執行第一行為進行風險評估。

由上可知,本申請上述實施例一所提供的方案,通過獲取第一賬戶的用戶行為頻
率以及反轉行為頻率,得到第一行為的特征比例,進而基于預先獲取的用戶行為參數
得到第一行為的風險評估結果,達到了準確對用戶行為進行風險評估的目的,從而實
現了增加風險評估正確率的技術效果,進而解決了現有技術由于僅基于用戶行為頻率
進行用戶行為的風險評估,造成的在一些特殊的情況下,風險評估結果錯誤率較高的
技術問題。

本申請上述實施例提供的一種可選方案中,上述步驟S202,獲取第一賬戶在第一
預設時間段內執行第一行為所對應的用戶行為頻率,可以包括:

S20,確定第三總數和第四總數,其中,第三總數是指第一賬戶在第一預設時間段
內執行第一行為的數量,第四總數是指第一賬戶在第一預設時間段內的所有行為的數
量。

本申請上述步驟S20中,用戶行為的風險評估裝置在要獲取第一賬戶在第一時間
段內執行第一行為所對應的用戶行為頻率時,需要獲得兩個數據,其一為第一賬戶在
第一預設時間段內執行第一行為的數量,即第三總數,其二為第一賬戶在第一預設時
間段內的所有行為的數量,即第四總數。

仍舊以第一行為包括“購買-生活用品”為例,第一賬戶在第一預設時間段內執行
第一行為的數量,即第三總數為3,第一賬戶在第一預設時間段內的所有行為的數量,
即第四總數為100。

S22,依據第三總數和第四總數,計算用戶行為頻率。

本申請上述步驟S20中,用戶行為的風險評估裝置在確定了第一賬戶在第一預設
時間段內執行第一行為的數量以及第一賬戶在第一預設時間段內的所有行為的數量之
后,可以依據該第一賬戶在第一預設時間段內執行第一行為的數量以及第一賬戶在第
一預設時間段內的所有行為的數量計算用戶行為頻率。

仍舊以第一行為包括“購買-生活用品”為例,由于用戶行為的風險評估裝置確定
第一賬戶在第一預設時間段內執行第一行為的數量,即第三總數為3,第一賬戶在第
一預設時間段內的所有行為的數量,即第四總數為100,那么用戶行為頻率即為
3/100=0.03。

本申請上述實施例提供的一種可選方案中,上述步驟S204,獲取用戶行為頻率對
應的反轉行為頻率,可以包括:

S30,確定第一總數和第二總數。

本申請上述步驟S30中,用戶行為的風險評估裝置在要獲取用戶行為頻率對應的
反轉行為頻率時,需要獲得兩個數據,其一為在第一預設時間段內所有賬戶的第一行
為的數量,即第一總數,其二為在第一預設時間段內所有賬戶的所有行為的數量,即
第二總數。

仍舊以第一行為包括“購買-生活用品”為例,在第一預設時間段內,如果“購買
-生活用品”出現過1,000次,而該第一預設時間段內的所有賬戶的所有行為的總數是
10,000,000個,那么在第一預設時間段內所有賬戶的第一行為的數量,即第一總數為
1,000,在第一預設時間段內所有賬戶的所有行為的數量,即第二總數為10,000,000。

S32,通過公式I=lg(k/q),計算反轉行為頻率,其中,I表示反轉行為頻率,k
表示第二總數,q表示第一總數。

本申請上述步驟S20中,用戶行為的風險評估裝置在確定了在第一預設時間段內
所有賬戶的第一行為的數量以及在第一預設時間段內所有賬戶的所有行為的數量之后,
可以依據該在第一預設時間段內所有賬戶的第一行為的數量以及在第一預設時間段內
所有賬戶的所有行為的數量計算反轉行為頻率。

仍舊以第一行為包括“購買-生活用品”為例,由于用戶行為的風險評估裝置確定
在第一預設時間段內所有賬戶的第一行為的數量,即第一總數為1,000,在第一預設
時間段內所有賬戶的所有行為的數量,即第二總數為10,000,000,那么用戶行為頻率
即為lg(10,000,000/1,000)=4。

本申請上述實施例提供的一種可選方案中,上述步驟S206,根據第一行為對應的
第一特征值,計算第一特征值在所有賬戶的所有行為的特征值中所占的特征比例,可
以包括:

通過公式得到第一特征值在所有賬戶的所有行為的特征值中
所占的特征比例,其中,aj表示第一特征值,P(aj)用于表示aj在所有賬戶的所有行
為的特征值所占的特征比例,j為大于0的整數。

可選地,依據第三總數和第四總數,計算用戶行為頻率,包括:將第三總數除以
第四總數,得到用戶行為頻率。

可選地,根據用戶行為頻率以及反轉行為頻率,得到第一行為對應的第一特征值,
包括:將用戶行為頻率乘以反轉行為頻率,得到第一行為對應的第一特征值。

本申請上述實施例提供的一種可選方案中,如圖3所示,在預先獲取的用戶行為
參數包括條件概率參數以及分類比例的情況下,獲取條件概率參數以及分類比例的步
驟可以包括:

S302,創建訓練樣本集合,其中,訓練樣本集合至少包括一個樣本特征值以及至
少一個樣本特征值對應的風險評估標簽。

本申請上述步驟S302中,用戶行為的風險評估裝置在對第一賬戶在第一預設時間
段內執行的第一行為進行風險評估之前,可以創建訓練樣本集合,建立基于樸素貝葉
斯的模型。

其中,訓練樣本集合至少包括一個樣本特征值以及至少一個樣本特征值對應的風
險評估標簽,與上述第一特征值的計算過程類似的,訓練樣本集合中的至少一個樣本
特征值也可以是由樣本賬戶的樣本行為對應的樣本用戶行為頻率以及樣本用戶行為頻
率對應的樣本反轉行為頻率得到的。可選地,風險評估標簽可以是0或1,例如0表
示無風險,1表示有風險。

可選地,上述步驟S302創建訓練樣本集合,其中,訓練樣本集合至少包括一個樣
本特征值以及至少一個樣本特征值對應的風險評估標簽,可以包括:

S40,獲取在第二預設時間段內至少一個樣本賬戶的至少一個樣本用戶行為。

本申請上述步驟S40中,用戶行為的風險評估裝置所創建的訓練樣本集合,也是
基于某一時間段的某些用戶的行為,為了上述第一賬戶、第一行為進行區分,這里我
們將訓練樣本集合中的賬戶稱為樣本賬戶,將行為稱為樣本用戶行為,其中,樣本用
戶行為同樣可以包括用戶在網站上發生的所有行為,如搜索、瀏覽、打分、點評、加
入購物車、取出購物筐、加入期待列表、購買、使用減價券和退貨等;甚至可以包括
在第三方網站上的相關行為,如比價、看相關評測、參與討論、社交媒體上的交流、
與好友互動等。

S42,計算至少一個樣本用戶行為的樣本用戶行為頻率,以及樣本用戶行為頻率對
應的樣本反轉行為頻率,其中,樣本反轉行為頻率是根據第五總數和第六總數得到的,
第五總數是指在第二預設時間段內所有賬戶的至少一個樣本用戶行為的數量以及在第
二預設時間段內所有賬戶的所有行為的總數得到的。

本申請上述步驟S42中,與上述過程類似的,用戶行為的風險評估裝置在獲取了
在第二預設時間段內至少一個樣本賬戶的至少一個樣本用戶行為之后,需要計算至少
一個樣本用戶行為的樣本用戶行為頻率,以及樣本用戶行為頻率對應的樣本反轉行為
頻率,其中,樣本反轉行為頻率是根據第五總數和第六總數得到的,第五總數是指在
第二預設時間段內所有賬戶的至少一個樣本用戶行為的數量以及在第二預設時間段內
所有賬戶的所有行為的總數得到的。

可選地,計算至少一個樣本用戶行為的樣本用戶行為頻率,以及樣本用戶行為頻
率對應的樣本反轉行為頻率,可以包括:

在第二預設時間段內至少一個樣本賬戶的至少一個樣本用戶行為的數量除以在第
二預設時間段內至少一個樣本賬戶的所有行為的數量,得到至少一個樣本用戶行為的
樣本用戶行為頻率;以及通過公式I′=lg(k′/q′),計算樣本反轉行為頻率,其中,I′表
示樣本反轉行為頻率,k′表示第五總數,q′表示第六總數。

S44,根據樣本用戶行為頻率以及樣本反轉行為頻率,得到至少一個樣本特征值。

本申請上述步驟S44中,與上述過程類似的,用戶行為的風險評估裝置在計算出
至少一個樣本用戶行為的樣本用戶行為頻率,以及樣本用戶行為頻率對應的樣本反轉
行為頻率之后,可以根據樣本用戶行為頻率以及樣本反轉行為頻率,得到至少一個樣
本特征值。

可選地,根據樣本用戶行為頻率以及樣本反轉行為頻率,得到至少一個樣本特征
值,包括:將樣本用戶行為頻率乘以樣本反轉行為頻率,得到至少一個樣本特征值。

S46,依據至少一個樣本特征值以及至少一個樣本特征值對應的風險評估標簽創建
訓練樣本集合。

本申請上述步驟S46中,用戶行為的風險評估裝置在得到上述至少一個樣本特征
值之后,基于至少一個樣本特征值以及至少一個樣本特征值對應的風險評估標簽創建
訓練樣本集合。

需要補充的是,在得到至少一個樣本特征值以及至少一個樣本特征值對應的風險
評估標簽之后,用戶行為的風險評估裝置還可以對該至少一個樣本特征值以及至少一
個樣本特征值對應的風險評估標簽進行優化,即可以在至少一個樣本特征值以及至少
一個樣本特征值對應的風險評估標簽所構成的集合中先有放回的抽取T份數據,每份
數據包括N個樣本特征值及其對應的風險評估標簽,再對每份數據無放回抽取M個樣
本特征值及其對應的風險評估標簽,M=Z1/2,其中Z為總的樣本特征值的數量,T的值
略大于Z的值,例如Z=400,T=500,進而得到上述訓練樣本集合,然而,本發明實施
例對此并不做限定。

S304,根據至少一個樣本特征值以及至少一個樣本特征值對應的風險評估標簽,
得到條件概率參數以及分類比例。

本申請上述步驟S304中,與上述過程類似的,用戶行為的風險評估裝置在得到至
少一個樣本特征值以及至少一個樣本特征值對應的風險評估標簽之后,可以根據至少
一個樣本特征值以及至少一個樣本特征值對應的風險評估標簽,得到上述條件概率參
數以及分類比例。

可選地,步驟S304根據至少一個樣本特征值以及至少一個樣本特征值對應的風險
評估標簽,得到條件概率參數以及分類比例,可以包括:

通過公式得到條件概率參數,其中,P(a′j|ci)用于表示a′j
屬于ci的條件概率參數,a′j表示樣本特征值,ci表示風險評估標簽,Count(a′j|ci)表示
屬于ci出現a′j的次數,Count(ci)表示屬于ci的次數,其中,0<j<n,n為訓練樣本集合
中的樣本總數,0<i<m,m為風險評估標簽的種類數,i,j均為整數;以及

通過公式得到分類比例,其中,P(ci)用于表示ci在所有風險
評估標簽中所占的分類比例。

本申請上述實施例提供的一種可選方案中,上述步驟S210,基于特征比例以及預
先獲取的用戶行為參數,得到第一賬戶在第一預設時間段內執行第一行為的風險評估
結果,可以包括:

S50,通過公式得到第一賬戶在第一預設時間段內
執行第一行為的風險評估結果,其中,cMAP為第一賬戶在第一預設時間段內執行第一
行為的風險評估結果。

本申請上述步驟S50中,用戶行為的風險評估裝置在得到P(aj)之后,基于通過
訓練樣本集合得到的P(a′j|cj)和P(ci),得到第一賬戶在第一預設時間段內執行第一行
為的風險評估結果cMAP。

下面結合圖4,對本發明實施例的用戶行為的風險評估方法進行描述:

步驟A,采集第二預設時間段內的樣本賬戶的樣本行為。

其中,用戶行為的風險評估裝置所創建的訓練樣本集合,也是基于某一時間段的
某些用戶的行為,為了上述第一賬戶、第一行為進行區分,這里我們將訓練樣本集合
中的賬戶稱為樣本賬戶,將行為稱為樣本用戶行為,其中,樣本用戶行為同樣可以包
括用戶在網站上發生的所有行為,如搜索、瀏覽、打分、點評、加入購物車、取出購
物筐、加入期待列表、購買、使用減價券和退貨等;甚至可以包括在第三方網站上的
相關行為,如比價、看相關評測、參與討論、社交媒體上的交流、與好友互動等。

步驟B,計算樣本BF和樣本IBF。

其中,在第二預設時間段內至少一個樣本賬戶的至少一個樣本用戶行為的數量除
以在第二預設時間段內至少一個樣本賬戶的所有行為的數量,得到至少一個樣本用戶
行為的樣本用戶行為頻率;以及通過公式I′=lg(k′/q′),計算樣本反轉行為頻率,其中,
I′表示樣本反轉行為頻率,k′表示第五總數,q′表示第六總數。

步驟C,匯總樣本BF*樣本IBF及其對應的風險評估標簽,創建訓練樣本集合。

其中,用戶行為的風險評估裝置在計算出至少一個樣本用戶行為的樣本用戶行為
頻率,以及樣本用戶行為頻率對應的樣本反轉行為頻率之后,可以根據樣本用戶行為
頻率以及樣本反轉行為頻率,得到至少一個樣本特征值。

可選地,根據樣本用戶行為頻率以及樣本反轉行為頻率,得到至少一個樣本特征
值,包括:將樣本用戶行為頻率乘以樣本反轉行為頻率,得到至少一個樣本特征值。

用戶行為的風險評估裝置在得到上述至少一個樣本特征值之后,基于至少一個樣
本特征值以及至少一個樣本特征值對應的風險評估標簽創建訓練樣本集合。

步驟D,基于訓練樣本集得到用戶行為參數。

其中,用戶行為參數包括條件概率參數以及分類比例。

具體地,通過公式得到條件概率參數,其中,P(a′j|ci)用
于表示a′j屬于ci的條件概率參數,a′j表示樣本特征值,ci表示風險評估標簽,
Count(a′j|ci)表示屬于ci出現a′j的次數,Count(ci)表示屬于ci的次數,其中,0<j<n,n
為訓練樣本集合中的樣本總數,0<i<m,m為風險評估標簽的種類數,i,j均為整數;
以及

通過公式得到分類比例,其中,P(ci)用于表示ci在所有風險
評估標簽中所占的分類比例。

步驟E,對第一賬戶在第一預設時間段第一行為進行風險評估。

其中,與上述步驟S202至步驟S210相同的,用戶行為的風險評估裝置可以對第
一賬戶在第一預設時間段第一行為進行風險評估,得到第一賬戶在第一預設時間段第
一行為的風險評估結果。

在本發明實施例中,采用獲取第一賬戶在第一預設時間段內執行第一行為所對應
的用戶行為頻率;獲取用戶行為頻率對應的反轉行為頻率,其中,反轉行為頻率是根
據第一總數和第二總數得到的,第一總數是指在第一預設時間段內所有賬戶的第一行
為的數量,第二總數是指在第一預設時間段內所有賬戶的所有行為的數量;根據用戶
行為頻率以及反轉行為頻率,得到第一行為對應的第一特征值;根據第一行為對應的
第一特征值,計算第一特征值在所有賬戶的所有行為的特征值中所占的特征比例;基
于特征比例以及預先獲取的用戶行為參數,得到第一賬戶在第一預設時間段內執行第
一行為的風險評估結果的方式,通過獲取第一賬戶的用戶行為頻率以及反轉行為頻率,
得到第一行為的特征比例,進而基于預先獲取的用戶行為參數得到第一行為的風險評
估結果,達到了準確對用戶行為進行風險評估的目的,從而實現了增加風險評估正確
率的技術效果,進而解決了現有技術由于僅基于用戶行為頻率進行用戶行為的風險評
估,造成的在一些特殊的情況下,風險評估結果錯誤率較高的技術問題。

需要說明的是,對于前述的各方法實施例,為了簡單描述,故將其都表述為一系
列的動作組合,但是本領域技術人員應該知悉,本發明并不受所描述的動作順序的限
制,因為依據本發明,某些步驟可以采用其他順序或者同時進行。其次,本領域技術
人員也應該知悉,說明書中所描述的實施例均屬于優選實施例,所涉及的動作和模塊
并不一定是本發明所必須的。

通過以上的實施方式的描述,本領域的技術人員可以清楚地了解到根據上述實施
例的方法可借助軟件加必需的通用硬件平臺的方式來實現,當然也可以通過硬件,但
很多情況下前者是更佳的實施方式。基于這樣的理解,本發明的技術方案本質上或者
說對現有技術做出貢獻的部分可以以軟件產品的形式體現出來,該計算機軟件產品存
儲在一個存儲介質(如ROM/RAM、磁碟、光盤)中,包括若干指令用以使得一臺終端
設備(可以是手機,計算機,服務器,或者網絡設備等)執行本發明各個實施例所述
的方法。

實施例2

根據本發明實施例,還提供了一種用于實施上述方法實施例的裝置實施例,本申
請上述實施例所提供的裝置可以在計算機終端上運行。

圖5是根據本申請實施例的用戶行為的風險評估裝置的結構示意圖。

如圖5所示,該用戶行為的風險評估裝置可以包括第一獲取單元502、第二獲取
單元504、處理單元506、第一計算單元508以及風險評估單元510。

其中,第一獲取單元502,用于獲取第一賬戶在第一預設時間段內執行第一行為
所對應的用戶行為頻率;第二獲取單元504,用于獲取所述用戶行為頻率對應的反轉
行為頻率,其中,所述反轉行為頻率是根據第一總數和第二總數得到的,所述第一總
數是指在所述第一預設時間段內所有賬戶的第一行為的數量,所述第二總數是指在所
述第一預設時間段內所有賬戶的所有行為的數量;處理單元506,用于根據所述用戶
行為頻率以及所述反轉行為頻率,得到所述第一行為對應的第一特征值;第一計算單
元508,用于根據所述第一行為對應的所述第一特征值,計算所述第一特征值在所有
賬戶的所有行為的特征值中所占的特征比例;風險評估單元510,用于基于所述特征
比例以及預先獲取的用戶行為參數,得到所述第一賬戶在所述第一預設時間段內執行
所述第一行為的風險評估結果。

由上可知,本申請上述實施例一所提供的方案,通過獲取第一賬戶的用戶行為頻
率以及反轉行為頻率,得到第一行為的特征比例,進而基于預先獲取的用戶行為參數
得到第一行為的風險評估結果,達到了準確對用戶行為進行風險評估的目的,從而實
現了增加風險評估正確率的技術效果,進而解決了現有技術由于僅基于用戶行為頻率
進行用戶行為的風險評估,造成的在一些特殊的情況下,風險評估結果錯誤率較高的
技術問題。

此處需要說明的是,上述第一獲取單元502、第二獲取單元504、處理單元506、
第一計算單元508以及風險評估單元510對應于實施例一中的步驟S202至步驟S210,
五個模塊與對應的步驟所實現的示例和應用場景相同,但不限于上述實施例一所公開
的內容。需要說明的是,上述模塊作為裝置的一部分可以運行在實施例一提供的計算
機終端10中,可以通過軟件實現,也可以通過硬件實現。

可選地,如圖6所示,所述第一獲取單元502可以包括:第一確定子單元602和
第一計算子單元604。

其中,第一確定子單元602,用于確定第三總數和第四總數,其中,所述第三總
數是指所述第一賬戶在所述第一預設時間段內執行所述第一行為的數量,所述第四總
數是指所述第一賬戶在所述第一預設時間段內的所有行為的數量;第一計算子單元
604,用于依據所述第三總數和所述第四總數,計算所述用戶行為頻率。

此處需要說明的是,上述第一確定子單元602和第一計算子單元604對應于實施
例一中的步驟S20至步驟S22,兩個模塊與對應的步驟所實現的示例和應用場景相同,
但不限于上述實施例一所公開的內容。需要說明的是,上述模塊作為裝置的一部分可
以運行在實施例一提供的計算機終端10中,可以通過軟件實現,也可以通過硬件實現。

可選地,如圖7所示,所述第二獲取單元504可以包括:第二確定子單元702和
第二計算子單元704。

第二確定子單元702,用于確定所述第一總數和所述第二總數;第二計算子單元
704,用于通過公式I=lg(k/q),計算所述反轉行為頻率,其中,I表示所述反轉行為
頻率,k表示所述第二總數,q表示所述第一總數。

此處需要說明的是,上述第二確定子單元702和第二計算子單元704對應于實施
例一中的步驟S30至步驟S32,兩個模塊與對應的步驟所實現的示例和應用場景相同,
但不限于上述實施例一所公開的內容。需要說明的是,上述模塊作為裝置的一部分可
以運行在實施例一提供的計算機終端10中,可以通過軟件實現,也可以通過硬件實現。

可選地,第一計算單元508用于執行以下步驟根據所述第一行為對應的所述第一
特征值,計算所述第一特征值在所有賬戶的所有行為的特征值中所占的特征比例:通
過公式得到所述第一特征值在所有賬戶的所有行為的特征值中所
占的特征比例,其中,aj表示所述第一特征值,P(aj)用于表示aj在所有賬戶的所有
行為的特征值所占的所述特征比例,j為大于0的整數。

可選地,第一計算子單元604用于執行以下步驟依據所述第三總數和所述第四總
數,計算所述用戶行為頻率:將所述第三總數除以所述第四總數,得到所述用戶行為
頻率;

處理單元506用于執行以下步驟根據所述用戶行為頻率以及所述反轉行為頻率,
得到所述第一行為對應的第一特征值:將所述用戶行為頻率乘以所述反轉行為頻率,
得到所述第一行為對應的第一特征值。

可選地,如圖8所示,在所述預先獲取的用戶行為參數包括條件概率參數以及分
類比例的情況下,用戶行為的風險評估裝置還可以包括:創建單元802和第二計算單
元804。

其中,創建單元802,用于創建訓練樣本集合,其中,所述訓練樣本集合至少包
括一個樣本特征值以及所述至少一個樣本特征值對應的風險評估標簽;第二計算單元
804,用于根據所述至少一個樣本特征值以及所述至少一個樣本特征值對應的所述風險
評估標簽,得到所述條件概率參數以及所述分類比例。

此處需要說明的是,上述創建單元802和第二計算單元804對應于實施例一中的
步驟S302至步驟S304,兩個模塊與對應的步驟所實現的示例和應用場景相同,但不
限于上述實施例一所公開的內容。需要說明的是,上述模塊作為裝置的一部分可以運
行在實施例一提供的計算機終端10中,可以通過軟件實現,也可以通過硬件實現。

可選地,如圖9所示,所述創建單元802可以包括:獲取子單元902、第三計算
子單元904、第四計算子單元906以及創建子單元908。

其中,獲取子單元902,用于獲取在第二預設時間段內至少一個樣本賬戶的至少
一個樣本用戶行為;第三計算子單元904,用于計算所述至少一個樣本用戶行為的樣
本用戶行為頻率,以及所述樣本用戶行為頻率對應的樣本反轉行為頻率,其中,所述
樣本反轉行為頻率是根據第五總數和第六總數得到的,所述第五總數是指在所述第二
預設時間段內所有賬戶的所述至少一個樣本用戶行為的數量以及在第二預設時間段內
所有賬戶的所有行為的總數得到的;第四計算子單元906,用于根據所述樣本用戶行
為頻率以及所述樣本反轉行為頻率,得到所述至少一個樣本特征值;創建子單元908,
用于依據所述至少一個樣本特征值以及所述至少一個樣本特征值對應的風險評估標簽
創建所述訓練樣本集合。

此處需要說明的是,上述獲取子單元902、第三計算子單元904、第四計算子單元
906以及創建子單元908對應于實施例一中的步驟S40至步驟S46,四個模塊與對應的
步驟所實現的示例和應用場景相同,但不限于上述實施例一所公開的內容。需要說明
的是,上述模塊作為裝置的一部分可以運行在實施例一提供的計算機終端10中,可以
通過軟件實現,也可以通過硬件實現。

可選地,第三計算子單元904用于執行以下步驟計算所述至少一個樣本用戶行為
的樣本用戶行為頻率,以及所述樣本用戶行為頻率對應的樣本反轉行為頻率:

將在所述第二預設時間段內所述至少一個樣本賬戶的所述至少一個樣本用戶行為
的數量除以在所述第二預設時間段內所述至少一個樣本賬戶的所有行為的數量,得到
所述至少一個樣本用戶行為的所述樣本用戶行為頻率;以及

通過公式I′=lg(k′/q′),計算所述樣本反轉行為頻率,其中,I′表示所述樣本反轉
行為頻率,k′表示所述第五總數,q′表示所述第六總數。

可選地,第二計算單元804用于執行以下步驟根據所述至少一個樣本特征值以及
所述至少一個樣本特征值對應的所述風險評估標簽,得到所述條件概率參數以及所述
分類比例:

通過公式得到所述條件概率參數,其中,所述P(a′j|ci)用
于表示a′j屬于ci的所述條件概率參數,a′j表示樣本特征值,ci表示所述風險評估標簽,
Coumt(a′j|ci)表示屬于ci出現a′j的次數,Count(ci)表示屬于ci的次數,其中,0<j<n,n
為所述訓練樣本集合中的樣本總數,0<i<m,m為風險評估標簽的種類數,i,j均為整
數;以及

通過公式得到所述分類比例,其中,P(ci)用于表示ci在所有
風險評估標簽中所占的所述分類比例。

可選地,風險評估單元510用于執行以下步驟基于所述特征比例以及預先獲取的
用戶行為參數,得到所述第一賬戶在所述第一預設時間段內執行所述第一行為的風險
評估結果:通過公式得到所述第一賬戶在所述第一預
設時間段內執行所述第一行為的所述風險評估結果,其中,cMAP為所述第一賬戶在所
述第一預設時間段內執行所述第一行為的所述風險評估結果。

在本發明實施例中,采用獲取第一賬戶在第一預設時間段內執行第一行為所對應
的用戶行為頻率;獲取用戶行為頻率對應的反轉行為頻率,其中,反轉行為頻率是根
據第一總數和第二總數得到的,第一總數是指在第一預設時間段內所有賬戶的第一行
為的數量,第二總數是指在第一預設時間段內所有賬戶的所有行為的數量;根據用戶
行為頻率以及反轉行為頻率,得到第一行為對應的第一特征值;根據第一行為對應的
第一特征值,計算第一特征值在所有賬戶的所有行為的特征值中所占的特征比例;基
于特征比例以及預先獲取的用戶行為參數,得到第一賬戶在第一預設時間段內執行第
一行為的風險評估結果的方式,通過獲取第一賬戶的用戶行為頻率以及反轉行為頻率,
得到第一行為的特征比例,進而基于預先獲取的用戶行為參數得到第一行為的風險評
估結果,達到了準確對用戶行為進行風險評估的目的,從而實現了增加風險評估正確
率的技術效果,進而解決了現有技術由于僅基于用戶行為頻率進行用戶行為的風險評
估,造成的在一些特殊的情況下,風險評估結果錯誤率較高的技術問題。

實施例3

本發明的實施例還提供了一種存儲介質。可選地,在本實施例中,上述存儲介質
可以用于保存上述實施例一所提供的用戶行為的風險評估方法所執行的程序代碼。

可選地,在本實施例中,上述存儲介質可以位于計算機網絡中計算機終端群中的
任意一個計算機終端中,或者位于移動終端群中的任意一個移動終端中。

可選地,在本實施例中,存儲介質被設置為存儲用于執行以下步驟的程序代碼:
獲取第一賬戶在第一預設時間段內執行第一行為所對應的用戶行為頻率;獲取所述用
戶行為頻率對應的反轉行為頻率,其中,所述反轉行為頻率是根據第一總數和第二總
數得到的,所述第一總數是指在所述第一預設時間段內所有賬戶的第一行為的數量,
所述第二總數是指在所述第一預設時間段內所有賬戶的所有行為的數量;根據所述用
戶行為頻率以及所述反轉行為頻率,得到所述第一行為對應的第一特征值;根據所述
第一行為對應的所述第一特征值,計算所述第一特征值在所有賬戶的所有行為的特征
值中所占的特征比例;基于所述特征比例以及預先獲取的用戶行為參數,得到所述第
一賬戶在所述第一預設時間段內執行所述第一行為的風險評估結果。

可選地,存儲介質還被設置為存儲用于執行以下步驟的程序代碼:確定第三總數
和第四總數,其中,所述第三總數是指所述第一賬戶在所述第一預設時間段內執行所
述第一行為的數量,所述第四總數是指所述第一賬戶在所述第一預設時間段內的所有
行為的數量;依據所述第三總數和所述第四總數,計算所述用戶行為頻率。

可選地,存儲介質還被設置為存儲用于執行以下步驟的程序代碼:確定所述第一
總數和所述第二總數;通過公式I=lg(k/q),計算所述反轉行為頻率,其中,I表示
所述反轉行為頻率,k表示所述第二總數,q表示所述第一總數。

可選地,存儲介質還被設置為存儲用于執行以下步驟的程序代碼:通過公式
得到所述第一特征值在所有賬戶的所有行為的特征值中所占的特
征比例,其中,aj表示所述第一特征值,P(aj)用于表示aj在所有賬戶的所有行為的
特征值所占的所述特征比例,j為大于0的整數。

可選地,存儲介質還被設置為存儲用于執行以下步驟的程序代碼:將所述第三總
數除以所述第四總數,得到所述用戶行為頻率。

可選地,存儲介質還被設置為存儲用于執行以下步驟的程序代碼:將所述用戶行
為頻率乘以所述反轉行為頻率,得到所述第一行為對應的第一特征值。

可選地,存儲介質還被設置為存儲用于執行以下步驟的程序代碼:創建訓練樣本
集合,其中,所述訓練樣本集合至少包括一個樣本特征值以及所述至少一個樣本特征
值對應的風險評估標簽;根據所述至少一個樣本特征值以及所述至少一個樣本特征值
對應的所述風險評估標簽,得到所述條件概率參數以及所述分類比例。

可選地,存儲介質還被設置為存儲用于執行以下步驟的程序代碼:獲取在第二預
設時間段內至少一個樣本賬戶的至少一個樣本用戶行為;計算所述至少一個樣本用戶
行為的樣本用戶行為頻率,以及所述樣本用戶行為頻率對應的樣本反轉行為頻率,其
中,所述樣本反轉行為頻率是根據第五總數和第六總數得到的,所述第五總數是指在
所述第二預設時間段內所有賬戶的所述至少一個樣本用戶行為的數量以及在第二預設
時間段內所有賬戶的所有行為的總數得到的;根據所述樣本用戶行為頻率以及所述樣
本反轉行為頻率,得到所述至少一個樣本特征值;依據所述至少一個樣本特征值以及
所述至少一個樣本特征值對應的風險評估標簽創建所述訓練樣本集合。

可選地,存儲介質還被設置為存儲用于執行以下步驟的程序代碼:將在所述第二
預設時間段內所述至少一個樣本賬戶的所述至少一個樣本用戶行為的數量除以在所述
第二預設時間段內所述至少一個樣本賬戶的所有行為的數量,得到所述至少一個樣本
用戶行為的所述樣本用戶行為頻率;以及通過公式I′=lg(k′/q′),計算所述樣本反轉行
為頻率,其中,I′表示所述樣本反轉行為頻率,k′表示所述第五總數,q′表示所述第
六總數。

可選地,存儲介質還被設置為存儲用于執行以下步驟的程序代碼:通過公式
得到所述條件概率參數,其中,所述P(a′j|ci)用于表示a′j屬于
ci的所述條件概率參數,a′j表示樣本特征值,ci表示所述風險評估標簽,Count(a′j|ci)
表示屬于ci出現a′j的次數,Count(ci)表示屬于ci的次數,其中,0<j<n,n為所述訓練
樣本集合中的樣本總數,0<i<m,m為風險評估標簽的種類數,i,j均為整數;以及通
過公式得到所述分類比例,其中,P(ci)用于表示ci在所有風險評
估標簽中所占的所述分類比例。

可選地,存儲介質還被設置為存儲用于執行以下步驟的程序代碼:通過公式
得到所述第一賬戶在所述第一預設時間段內執行所述
第一行為的所述風險評估結果,其中,cMAP為所述第一賬戶在所述第一預設時間段內
執行所述第一行為的所述風險評估結果。

可選地,在本實施例中,上述存儲介質可以包括但不限于:U盤、只讀存儲器(ROM,
Read-Only Memory)、隨機存取存儲器(RAM,Random Access Memory)、移動硬盤、磁
碟或者光盤等各種可以存儲程序代碼的介質。

可選地,本實施例中的具體示例可以參考上述實施例中所描述的示例,本實施例
在此不再贅述。

上述本發明實施例序號僅僅為了描述,不代表實施例的優劣。

在本發明的上述實施例中,對各個實施例的描述都各有側重,某個實施例中沒有
詳述的部分,可以參見其他實施例的相關描述。

在本申請所提供的幾個實施例中,應該理解到,所揭露的技術內容,可通過其它
的方式實現。其中,以上所描述的裝置實施例僅僅是示意性的,例如所述單元的劃分,
僅僅為一種邏輯功能劃分,實際實現時可以有另外的劃分方式,例如多個單元或組件
可以結合或者可以集成到另一個系統,或一些特征可以忽略,或不執行。另一點,所
顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,單元或模
塊的間接耦合或通信連接,可以是電性或其它的形式。

所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯
示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到
多個網絡單元上。可以根據實際的需要選擇其中的部分或者全部單元來實現本實施例
方案的目的。

另外,在本發明各個實施例中的各功能單元可以集成在一個處理單元中,也可以
是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中。上述集成
的單元既可以采用硬件的形式實現,也可以采用軟件功能單元的形式實現。

所述集成的單元如果以軟件功能單元的形式實現并作為獨立的產品銷售或使用時,
可以存儲在一個計算機可讀取存儲介質中。基于這樣的理解,本發明的技術方案本質
上或者說對現有技術做出貢獻的部分或者該技術方案的全部或部分可以以軟件產品的
形式體現出來,該計算機軟件產品存儲在一個存儲介質中,包括若干指令用以使得一
臺計算機設備(可為個人計算機、服務器或者網絡設備等)執行本發明各個實施例所
述方法的全部或部分步驟。而前述的存儲介質包括:U盤、只讀存儲器(ROM,Read-Only
Memory)、隨機存取存儲器(RAM,Random Access Memory)、移動硬盤、磁碟或者光盤
等各種可以存儲程序代碼的介質。

以上所述僅是本發明的優選實施方式,應當指出,對于本技術領域的普通技術人
員來說,在不脫離本發明原理的前提下,還可以做出若干改進和潤飾,這些改進和潤
飾也應視為本發明的保護范圍。

關 鍵 詞:
用戶 行為 風險 評估 方法 裝置
  專利查詢網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
關于本文
本文標題:用戶行為的風險評估方法及裝置.pdf
鏈接地址:http://www.rgyfuv.icu/p-6100835.html
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服客服 - 聯系我們

[email protected] 2017-2018 zhuanlichaxun.net網站版權所有
經營許可證編號:粵ICP備17046363號-1 
 


收起
展開
山东11选5中奖结果走势图