• / 30
  • 下載費用:30 金幣  

基于在線系統中的用戶動作詢問特征.pdf

摘要
申請專利號:

CN201380071807.8

申請日:

2013.11.25

公開號:

CN104956365A

公開日:

2015.09.30

當前法律狀態:

授權

有效性:

有權

法律詳情: 授權|||實質審查的生效 IPC(主分類):G06F 17/30申請日:20131125|||公開
IPC分類號: G06F17/30 主分類號: G06F17/30
申請人: 臉譜公司
發明人: 瑞安·艾倫·斯托特; 花鳴; 顏宏
地址: 美國加利福尼亞州
優先權: 13/690,225 2012.11.30 US
專利代理機構: 北京康信知識產權代理有限責任公司11240 代理人: 梁麗超; 陳鵬
PDF完整版下載: PDF下載
法律狀態
申請(專利)號:

CN201380071807.8

授權公告號:

||||||

法律狀態公告日:

2018.07.03|||2015.11.04|||2015.09.30

法律狀態類型:

授權|||實質審查的生效|||公開

摘要

在線系統,例如,社交網絡系統存儲描述在線系統中表現的實體之間的關系的特征。描述特征的信息被表示為圖譜。在線系統維護累積特征圖譜和漸進式特征圖譜。基于最新的用戶動作的特征值存儲在漸進式圖譜中,而基于先前動作的特征值存儲在累積圖譜中。周期性地,存儲在漸進式特征圖譜中的信息與存儲在累積特征圖譜中的信息合并。在合并期間,漸進式圖譜被標記為非活躍的,而基于新的用戶動作的信息被存儲在活躍的漸進式特征圖譜中。如果接收到對于特征信息的請求,那么從累積特征圖譜、非活躍的漸進式特征圖譜、和活躍的漸進式特征圖譜獲得的特征信息被結合以確定特征信息。

權利要求書

權利要求書
1.  一種計算機實現方法,具體用于處理用作預測器模型的輸入值的大量特征值,包括:
通過在線系統維護存儲根據在時間點之前進行的用戶動作確定的特征值的累積特征存儲器;
通過所述在線系統維護存儲根據在所述時間點之后進行的用戶動作確定的特征值的漸進式特征存儲器,維護包括響應于接收描述用戶動作的信息更新所述漸進式特征存儲器的特征值;
接收對特征值的請求,所述請求識別用戶和特征;
從所述累積特征存儲器接收第一部分結果,所述第一部分結果根據在所述時間點之前由所述用戶進行的類型的用戶動作確定;
從所述漸進式特征存儲器接收第二部分結果,所述第二部分結果根據在所述時間點之后由所述用戶進行的類型的用戶動作確定;
確定包括所述第一部分結果和所述第二部分結果的加權結合,其中所述第一部分結果由衰變因數加權;并且
返回所述加權結合作為所請求的特征值。

2.  根據權利要求1所述的計算機實現方法,其中,所述衰變因數是小于一的值。

3.  根據權利要求1或2所述的計算機實現方法,其中,所述衰變因數基于與所述特征相關聯的類型。

4.  根據權利要求1至3中任一項所述的計算機實現方法,其中,所述漸進式特征存儲器是第一漸進式特征存儲器,還包括:
通過所述在線系統維護第二漸進式特征存儲器;
將所述第一漸進式特征存儲器在后續時間點標記為非活躍的并且響應于所述后續時間點之后由所述在線系統接收的用戶動作更新所述第二漸進式特征存儲器的特征;并且
響應于接收所述請求,從所述第二漸進式特征存儲器接收第三部分結果。

5.  根據權利要求4所述的計算機實現方法,其中,所述加權結合進一步包括所述第三部分結果。

6.  根據權利要求4或5所述的計算機實現方法,其中,所述加權結合通過第二衰變因數加權所述第三部分結果。

7.  根據權利要求1至6中任一項所述的計算機實現方法,其中,特征被表示為基于描述用戶動作的一個或多個值的表達式或基于其他特征值的表達式,
其中,具體地,特征可以是基于描述所述在線系統的用戶或者所述在線系統的用戶與所述在線系統或所述在線系統中表現的實體的交互的信息的值,
如基于兩個或多個用戶之間的交互的速率的所述在線系統的所述兩個或多個用戶之間的親密程度,和/或
如基于描述用戶的信息的用戶對某些信息感興趣的可能性,所述描述用戶的信息例如由用戶指定的用戶興趣或例如由用戶在過去檢索的信息的類型的用戶交互,和/或
如用戶訪問描述某些信息的頁面的可能性,和/或
如用戶訪問所述在線系統上可用的圖像、視頻、或任何其他類型的內容的可能性。

8.  根據權利要求1至7中任一項所述的計算機實現方法,還包括:
將所述漸進式特征存儲器標記為非活躍的并且停止更新所述漸進式特征存儲器中存儲的特征值;
確定來自所述漸進式特征存儲器的特征值和來自所述累積特征存儲器的相應的特征值的加權結合,其中,來自所述累積特征存儲器的特征值通過衰變因數加權;并且
利用所述加權結合更新所述累積特征存儲器的特征值。

9.  根據權利要求1至8中任一項所述的計算機實現方法,其中,更新所述累積特征存儲器的特征值包括:
將所述漸進式特征存儲器與所述累積特征存儲器合并,其中
包括來自所述漸進式特征存儲器的新的特征,
修改所述漸進式特征存儲器和所述累積特征存儲器之間的重疊特征,并且
特征值的更新和/或聚集取決于所述特征本身。

10.  根據權利要求1至9中任一項所述的計算機實現方法,還包括:
將所述漸進式特征存儲器存儲在與用于所述累積特征存儲器的數據存儲器相比提供更快的數據存取的數據存儲器中。

11.  根據權利要求1至10中任一項所述的計算機實現方法,其中,所述漸進式特征存儲器存儲在隨機存取存儲器中。

12.  根據權利要求1至11中任一項所述的計算機實現方法,其中,每個特征與用戶、目標實體、和基于由與所述目標實體相關聯的用戶進行的用戶動作的特征值相關聯。

13.  一種或多種實施軟件的計算機可讀非易失性存儲介質,當所述軟件被執行時用以執行根據權利要求1至12中任一項所述的方法。

14.  一種系統,包括:一個或多個處理器;以及存儲器,耦接至所述處理器,所述存儲器包括能由所述處理器執行的指令,所述處理器在執行所述指令時能操作以執行根據權利要求1至12中任一項所述的方法。

15.  一種計算機程序產品,具有存儲計算機可執行的程序代碼的非易失性計算機可讀存儲介質,所述代碼包括:
在線系統的特征管理器模塊,被配置為:
維護存儲根據在時間點之前進行的用戶動作確定的特征值的累積特征存儲器;
維護存儲所述特征值的漸進式特征存儲器,維護包括響應于接收描述在所述時間點之后進行的用戶動作的信息更新所述漸進式特征存儲器的特征值;
請求處理器模塊,被配置為:
接收對特征值的請求,所述請求識別用戶和與一個類型的用戶動作相關聯的特征;
從所述累積特征存儲器接收第一部分結果,所述第一部分結果根據在所述時間點之前由所述用戶進行的類型的用戶動作確定;
從所述漸進式特征存儲器接收第二部分結果,所述第二部分結果根據在所述時間點之后由所述用戶進行的類型的用戶動作確定;
確定包括所述第一部分結果和所述第二部分結果的加權結合,其中,所述第一部分結果由衰變因數加權;并且
返回所述加權結合作為所請求的特征值。

16.  根據權利要求15所述的計算機程序產品,其中,所述衰變因數是小于一的值。

17.  根據權利要求15所述的計算機程序產品,其中,所述衰變因數基于與所述特征相關聯的類型。

18.  根據權利要求15所述的計算機程序產品,其中:
所述特征管理器進一步被配置為:
維護第二漸進式特征存儲器;
將第一漸進式特征存儲器在后續時間點標記為非活躍的并且響應于在所述后續時間點之后由所述在線系統接收的用戶動作更新所述第二漸進式特征存儲器的特征;并且
所述請求處理器模塊進一步被配置為
響應于接收所述請求,從所述第二漸進式特征存儲器接收第三部分結果。

19.  根據權利要求18所述的計算機程序產品,其中,所述加權結合進一步包括所述第三部分結果。

20.  根據權利要求18所述的計算機程序產品,其中,所述加權結合通過第二衰變因數加權所述第三部分結果。

21.  根據權利要求15所述的計算機程序產品,其中,特征被表示為基于描述用戶動作的一個或多個值的表達式或基于其他特征值的表達式。

22.  根據權利要求15所述的計算機程序產品,其中,所述特征管理器進一步被配置為:
將所述漸進式特征存儲器標記為非活躍的并且停止更新所述漸進式特征存儲器中存儲的特征值;
確定來自所述漸進式特征存儲器的特征值和來自所述累積特征存儲器的相應的特征值的加權結合,其中,來自所述累積特征存儲器的特征值通過衰變因數加權;并且
利用所述加權結合更新所述累積特征存儲器的所述特征值。

23.  根據權利要求15所述的計算機程序產品,其中,所述特征管理器進一步被配置為:
將所述漸進式特征存儲器存儲在與用于所述累積特征存儲器的數據存儲器相比提供更快的數據存取的數據存儲器中。

24.  根據權利要求15所述的計算機程序產品,其中,所述漸進式特征存儲器存儲在隨機存取存儲器中。

說明書

說明書基于在線系統中的用戶動作詢問特征
技術領域
本發明涉及描述例如社交網絡系統的在線系統中的用戶動作的更新特征,并且具體地,涉及基于在線系統中的用戶動作的實時更新的詢問特征。
背景技術
在線系統通常呈現對用戶有用的信息并且允許用戶與在線系統交互。在線系統可以使用各種技術在將信息呈現給用戶之前確定用戶可能感興趣的信息。如果將用戶喜歡的信息呈現給用戶,那么用戶更可能有規律地訪問在線系統。在線系統通常從廣告獲得收益。廣告商更喜歡在系統的用戶有規律地訪問的在線系統中做廣告。因此,用戶忠誠度確定了在線系統產生的收益。因此,在線系統將感興趣的信息呈現給用戶的能力通常影響在線系統獲得的收益。
在線系統通常使用過去的用戶動作來由在線系統進行有關動作的決定。例如,過去的用戶行為可以由在線系統使用以便將用戶可能感興趣的信息提出給用戶。在線系統的實例是允許用戶建立與彼此的聯系的社交網絡系統。社交網絡系統可使用過去的用戶動作確定用戶可能感興趣的新聞饋送報道或者確定用戶的潛在的朋友以便推薦給用戶。在線系統可使用確定用戶感興趣的信息的預測器模型,例如,機器學習模型。這些模型基于描述在線系統中的用戶和他們的動作的特征預測動作。
在線系統通常可以具有定期地與在線系統交互的大量用戶,例如,幾十或幾百萬用戶并且產生在線系統中的大量信息。產生的信息被用于確定由基于特征進行決定的在線系統的模型或者各個模塊使用的特征的值。通常,在線系統基于在過去發生的一組用戶動作維護特征。更新特征可以是 深入和復雜計算的操作。因此,特征值不能經常更新。因此,與在線系統的交互的模式的最新改變可能未在特征中反映直至很晚。例如,如果在線系統的用戶界面改變,那么用戶與在線系統的交互會顯著改變。相似地,如果存在技術上的改變,那么用戶與在線系統的交互會顯著改變。例如,如果先前經由移動設備不可訪問的在線系統變為經由移動設備可訪問的,那么用戶可能以先前不可能或不普遍的新的方式與在線系統交互。然而,如果在線系統的特征值不反映這些最新的改變,那么由在線系統基于特征值進行的決定不能反映用戶行為中的最新改變。因此,在線系統不再采取與用戶有關的動作或者在線系統將用戶不感興趣的信息呈現給用戶。
發明內容
本發明的實施方式允許在線系統查詢基于由用戶進行的動作表示用戶與實體之間的關系的特征值。例如,社交網絡系統可存儲基于用戶和與用戶聯系的另一個用戶之間的交互的特征值。每個特征與用戶、目標實體、和基于由用戶對于目標實體進行的用戶動作的值相關聯。在線系統維護累積特征存儲器和漸進式特征存儲器。累積特征存儲器存儲從給定在時間點之前進行的用戶動作確定的特征值并且漸進式特征存儲器存儲從給定時間點之后進行的用戶動作確定的特征值。
接收特征值的請求以識別用戶和特征類型。從給定在時間點之前進行的用戶動作確定的特征值的第一部分結果是從累積特征存儲器接收的。從給定時間點之后進行的用戶動作確定的第二部分結果是從漸進式特征存儲器接收的。特征值是通過將第一部分結果和第二部分結果結合為第一部分結果由衰變因數加權來確定的。確定的特征值被返回請求者。
在實施方式中,存儲在漸進式特征存儲器中的特征值是響應于由在線系統的用戶進行的當前用戶動作更新的。此外,在后續時間點停止對漸進式特征存儲器的更新。新的漸進式特征存儲器是為了存儲使用后續時間點之后發生的用戶動作確定的特征值而保持的。響應于特征的請求,使用后續時間間隔之后接收的用戶動作確定的第三部分結果值是從新的漸進式特征存儲器檢索的。特征值是通過結合第一部分結果、第二部分結果、和 第三部分結果的結果來確定的。部分結果的結合是通過由衰變因數加權第一部分結果進行的。第二部分結果可以由另一個衰變因數加權。來自漸進式特征存儲器的特征值可以與累積存儲器和重置的漸進式特征存儲器中的特征值合并。
在本發明內容部分和以下詳細說明中所述的特征和優勢不是包括一切的。從附圖、說明書、和權利要求書來看,許多另外的特征和優勢對本領域技術人員而言將是顯而易見的。
根據本發明的實施方式在針對方法、介質、和系統的所附權利要求中具體公開,其中一個權利要求種類中提到的任何特征,例如,方法,可以在另一個權利要求種類中要求保護,例如,系統。
在實施方式中,根據本發明提供一種計算機實現方法,包括:
通過在線系統維護存儲根據在時間點之前進行的用戶動作確定的特征值的累積特征存儲器;
通過在線系統維護存儲根據時間點之后進行的用戶動作確定的特征值的漸進式特征存儲器,維護包括響應于接收描述用戶動作的信息更新漸進式特征存儲器的特征值;
接收特征值的請求,該請求識別用戶和特征;
從累積特征存儲器接收第一部分結果,第一部分結果根據在時間點之前由用戶進行的類型的用戶動作確定;
從漸進式特征存儲器接收第二部分結果,第二部分結果根據在時間點之后由用戶進行的類型的用戶動作確定;
確定包括第一部分結果和第二部分結果的加權結合,其中第一部分結果由衰變因數加權;并且
返回加權結合作為請求的特征值。
衰變因數可以是小于一的值。
衰變因數還可以基于與特征相關聯的類型。
在同樣可以要求保護的本發明的另一個實施方式中,提供一種計算機實現方法,其中漸進式特征存儲器是第一漸進式特征存儲器,還包括:
通過在線系統維護第二漸進式特征存儲器;
將第一漸進式特征存儲器在后續時間點標記為非活躍的并且響應于后續時間點之后由在線系統接收的用戶動作更新第二漸進式特征存儲器的特征;并且
響應于接收請求,從第二漸進式特征存儲器接收第三部分結果。
優選地,加權結合進一步包括第三部分結果。
優選地,加權結合通過第二衰變因數加權第三部分結果。
特征可以被表示為基于描述用戶動作的一個或多個值的表達式或基于其他特征值的表達式。
在同樣可以要求保護的另一個實施方式中,提供一種計算機實現方法,包括:
將漸進式特征存儲器標記為非活躍的并且停止更新漸進式特征存儲器中存儲的特征值;
確定來自漸進式特征存儲器的特征值和來自累積特征存儲器的相應的特征值的加權結合,其中來自累積特征存儲器的特征值通過衰變因數加權;并且
利用加權結合更新累積特征存儲器的特征值。
計算機實現方法還可以包括:
將漸進式特征存儲器存儲在與用于累積特征存儲器的數據存儲器相比提供更快的數據存取的數據存儲器中。
漸進式特征存儲器可以存儲在隨機存取存儲器中。
每個特征可以與用戶、目標實體、和基于由與目標實體相關聯用戶進行的用戶動作的特征值相關聯。
在同樣可以要求保護的根據本發明的實施方式中,提供具有存儲計算機可執行的代碼的非易失性計算機可讀存儲介質的計算機程序產品,代碼包括:
在線系統的特征管理器模塊,被配置為:
維護存儲根據在時間點之前進行的用戶動作確定的特征值的累積特征存儲器;
維護存儲特征值的漸進式特征存儲器,維護包括響應于接收描述時間點之后進行的用戶動作的信息更新漸進式特征存儲器的特征值;
請求處理器模塊,被配置為:
接收特征值的請求,該請求識別用戶和與一個類型的用戶動作相關聯的特征;
從累積特征存儲器接收第一部分結果,第一部分結果根據在時間點之前由用戶進行的類型的用戶動作確定;
從漸進式特征存儲器接收第二部分結果,第二部分結果根據在時間點之后由用戶進行的類型的用戶動作確定;
確定包括第一部分結果和第二部分結果的加權結合,其中第一部分結果由衰變因數加權;并且
返回加權結合作為請求的特征值。
同樣可以要求保護的另一個實施方式,包括計算機程序產品,其中:
特征管理器進一步被配置為
通過在線系統維護第二漸進式特征存儲器;
將第一漸進式特征存儲器在后續時間點標記為非活躍的并且響應于后續時間點之后由在線系統接收的用戶動作更新第二漸進式特征存儲器的特征;并且
請求處理器模塊進一步被配置為
響應于接收請求,從第二漸進式特征存儲器接收第三部分結果。
特征管理器可以進一步被配置為:
將漸進式特征存儲器標記為非活躍的并且停止更新漸進式特征存儲器中存儲的特征值;
確定來自漸進式特征存儲器的特征值和來自累積特征存儲器的相應的特征值的加權結合,其中來自累積特征存儲器的特征值通過衰變因數加權;并且
利用加權結合更新累積特征存儲器的特征值。
特征管理器也可以被配置為:
將漸進式特征存儲器存儲在與用于累積特征存儲器的數據存儲器相比提供更快的數據存取的數據存儲器中。
同樣可以要求保護的另一實施方式包括計算機實現方法,具體用于處理用作預測器模型的輸入值的大量特征值,包括:
通過在線系統維護存儲根據在時間點之前進行的用戶動作確定的特征值的累積特征存儲器;
通過在線系統維護存儲根據時間點之后進行的用戶動作確定的特征值的漸進式特征存儲器,維護包括響應于接收描述用戶動作的信息更新漸進式特征存儲器的特征值;
接收特征值的請求,該請求識別用戶和特征;
從累積特征存儲器接收第一部分結果,第一部分結果根據在時間點之前由用戶進行的類型的用戶動作確定;
從漸進式特征存儲器接收第二部分結果,第二部分結果根據在時間點之后由用戶進行的類型的用戶動作確定;
確定包括第一部分結果和第二部分結果的加權結合,其中第一部分結果由衰變因數加權;并且
返回加權結合作為請求的特征值。
優選地,特征被表示為基于描述用戶動作的一個或多個值的表達式或基于其他特征值的表達式,
其中,具體地,特征可以是基于描述在線系統的用戶或在線系統的用戶與在線系統或者在線系統中表現的實體的交互的信息的值,
如基于兩個或多個用戶之間的交互的速率的在線系統的兩個或多個用戶之間的親密程度,和/或
如基于描述用戶的信息的用戶對某些信息感興趣的可能性,所述描述用戶的信息例如由用戶指定的用戶興趣或例如由用戶在過去檢索的信息的類型的用戶交互,和/或
如用戶訪問描述某些信息的頁面的可能性,和/或
如用戶訪問在線系統上可用的圖像、視頻、或任何其他類型的內容的可能性。
更新累積特征存儲器的特征值可以包括:
將漸進式特征存儲器與累積特征存儲器合并,其中
包括來自漸進式特征存儲器的新的特征,
將漸進式特征存儲器和累積特征存儲器之間的重疊特征修改,并且
特征值的更新和/或聚集取決于特征本身。
在同樣可以要求保護的本發明的另一實施方式中,提供一個或多個計算機可讀非易失性存儲介質,包含當執行時可操作以執行根據本發明的或者任意上述實施方式的方法的軟件。
在同樣可以要求保護的本發明的另一實施方式中,系統包括:一個或多個處理器;以及存儲器,耦接至包括由處理器可執行的指令的處理器,當執行指令時處理器可操作以執行根據本發明的或者任意上述實施方式的方法。
附圖說明
圖1是根據本發明的實施方式的用于維護基于用于例如社交網絡系統的在線系統的用戶動作的特征的系統環境的示圖。
圖2是示出根據本發明的實施方式的表示在線系統中表現的兩個實體之間的交互的特征的示圖。
圖3是示出根據本發明的實施方式的累積特征圖譜與漸進式特征圖譜的合并的示圖。
圖4A示出根據本發明的實施方式的使得特征對其他模塊可用的用于隨相應的用戶動作可用進行處理的例如社交網絡系統的在線系統的系統結構。
圖4B示出根據本發明的實施方式的允許管理在線系統中的特征的特征管理器模塊的子模塊。
圖5示出根據本發明的實施方式的漸進式特征存儲器與累積特征存儲器合并的總體過程。
圖6是示出根據本發明的實施方式的利用累積漸進式特征合并數據的活躍的漸進式特征存儲器與非活躍的漸進式特征存儲器的示圖。
圖7A-圖7C示出根據本發明的實施方式的與累積特征存儲器和漸進式特征存儲器相關聯的時間間隔。
圖8示出根據本發明的實施方式的處理對于維護漸進式特征存儲器和累積特征存儲器的系統的特征值的請求的總體過程。
附圖僅出于說明性的目的描述了本發明的各種實施方式。本領域技術人員從下列討論中容易認識到,在不背離此處所公開的本發明的原理的情況下,可以采用此處示出的結構和方法的替代實施方式。
具體實施方式
現將詳細地參考幾個實施方式,實施方式的實例在附圖中示出。應注意在任何地方切合實際的類似的或相同的參考標號可以用于附圖中和可指示類似的或相同的功能。附圖僅描述為了說明公開的系統(或方法)的實施方式。本領域技術人員從下列描述中容易認識到,在不背離此處所描述的原理情況下,可以采用本文中所示出的結構和方法的替代實施方式。
系統環境
圖1是根據本發明的實施方式的用于維護基于用于例如社交網絡系統的在線系統的用戶動作的特征的系統環境的示圖。本文中論述的本發明,盡管使用社交網絡系統示出,但可適用于允許用戶與在線系統交互的任何在線系統。具體地,社交網絡系統為其用戶提供與社交網絡系統的其他用戶通信和交互的能力。用戶加入社交網絡系統,然后添加與他們希望聯系的若干其他用戶的聯系。如在本文中使用,術語“朋友”是指用戶經由社交網絡系統與其已形成聯系、關聯、或者關系的任何其他用戶。
圖1和其他附圖使用相同的參考標號來確定相同元件。如“110a”的參考標號之后的字母表示該文本具體指具有該特定參考標號的元件。如“110”的文本中沒有后跟的字母的參考標號指附圖中具有該參考標號的任何或者所有元件(例如,文本中“110”指附圖中的參考標號“110a”和/或“110b”)。
用戶使用客戶端設備110與社交網絡系統200交互。在一個實施方式中,客戶端設備110可以是執行例如MICROSOFT窗口兼容操作系統 (OS)、蘋果OS X、和/或Linux分布程序的操作系統的個人計算機(PC)、臺式計算機、便攜式計算機、筆記本、平板電腦。在另一實施方式中,客戶端設備110可以是諸如個人數字助理(PDA)、移動電話、智能手機等的具有計算機功能的任何裝置。
在線系統100接收表現用戶與在線系統100的交互的各種信號105。描述這些信號105的信息存作為特征存儲于在線系統中。特征可以是基于描述在線系統的用戶或在線系統的用戶與在線系統100或者在線系統100表現的實體的交互的信息的值。例如,特征可以基于兩個用戶之間的交互描述在線系統的兩個用戶之間的親密程度。特征可以基于描述用戶(例如,由用戶指定的用戶興趣)或用戶交互(例如,由用戶在過去檢索的信息類型)的信息描述用戶對某些信息感興趣的可能性。特征可以表現用戶訪問描述某些信息的頁面的可能性,或者用戶訪問在線系統100上可用的圖像、視頻、或任何其他類型的內容的可能性。在一個實施方式中,在線系統100存儲系統中的對象對的特征向量,其中特征向量包含描述對象之間關系的若干特征。在社交網絡系統中,例如,可以為源用戶與目標用戶的關系存儲特征向量,其中特征向量包含特征,諸如源用戶觀看關于目標用戶的信息、發起與目標用戶的通信的頻率的度量以及描述源用戶和目標用戶之間的關系的各種其他度量。特征管理器150處理由在線系統100接收的信號105以確定各種特征值并且將特征值存儲在特征存儲器130中。
在線系統100可以使用特征存儲器130中可用的信息將在線系統中的表現的實體分級。例如,社交網絡系統可以將用戶的不同的朋友分級以確定一組親密的朋友。或者社交網絡系統可以將與目標用戶相關聯的一組用戶分級以確定向目標用戶建議的目標用戶的一組潛在的朋友。在線系統還可以使用特征值確定呈現給用戶的信息。
在線系統100可以將不同類型的信息呈現給用戶。例如,社交網絡系統可以將描述其他用戶、社會群體、社交活動、內容、圖像等的信息呈現給用戶。可能有與用戶相關聯的在線系統100中發生的大量動作。因為用戶通常具有在在線系統100上花費的有限的時間并且在線系統100的用戶界面中的可用空間的量同樣通常是有限的,所以在線系統100可以選擇將 用戶很可能感興趣的信息呈現給用戶。在線系統100可以結合從各種可用的選項中選擇呈現給用戶的信息的一個或多個建議模塊140。
建議模塊140可以使用特征存儲器中可用的信息基于呈現給用戶的信息確定用戶是否可能進行期望動作。例如,在線系統可以包括預測用戶行為的一個或多個預測器模型。建議模塊140可以基于預測的用戶行為向用戶進行建議115。預測器模型可以由建議模塊調用以決定呈現給用戶的信息。預測器模型利用特征存儲器中可用的信息預測用戶動作。例如,預測器模型可以使用特征存儲器130中可用的特征值訓練。例如,在線系統可以包括確定用戶請求與呈現給用戶的新鮮事項相關的更多信息的可能性的預測器模型。或者預測器模型可以確定用戶評論呈現給用戶的圖像的可能性。可替代地,預測器模型可以確定用戶發送與由社交網絡系統推薦的潛在聯系人進行聯系的請求的可能性。
在線系統100包括在一個或多個計算機處理器上執行的軟件模塊。系統100和系統110的一些實施方式具有與本文所述的實施方式不同和/或其他的模塊,且可以不同于此處描述的方式將功能在模塊之間分配。在線系統100可包括除圖1中示出之外的模塊,例如,在本文中將進一步描述的圖4中所示的模塊。
圖2是示出根據本發明的實施方式的表示在線系統中表現的實體220之間的交互的特征230的示圖。特征230可以表現源實體和目標實體之間的交互。例如,特征f11、f12、和f13表現源實體220m和220p之間的交互并且特征f21、f22、和f23表現源實體220m和220q之間的交互。例如,特征可以表現兩個用戶之間交互的速率,兩個用戶最近怎樣彼此交互,一個用戶檢索的關于實體的速率或信息量,或者用戶發布的關于實體的評論的數量和類型。特征同樣可以表現描述例如用戶的具體實體的信息。例如,特征可以表現用戶對具體主題感興趣的水平,用戶登錄在線系統的速率,或者描述關于用戶的人口統計信息的信息。
通常,在線系統100的各種特征可以表示為特征圖譜。每個特征可以與源實體、目標實體、和特征值相關聯。特征可被指定為基于描述源實體、目標實體、或源實體和目標實體之間的交互的值的表達式。特征表達式可 組合,即,特征表達式可以是其他特征表達式的函數。在線系統可具有大量用戶,例如,百萬乃至億萬。可以有用戶與在線系統的非常多的交互、用戶之間的交互、以及描述用戶的大量信息。因此由在線系統100表現的特征圖譜可以基于隨時接收的信息獲取持續更新。
圖3是示出根據本發明的實施方式的累積特征圖譜與漸進式特征圖譜的合并的示圖。各個節點220對應于在線系統100中表現的實體并且從源實體至目標實體的矢線230對應于與源實體和目標實體相關聯的特征。累積特征圖譜320a包括實體220a、220b、220c、220d、和220e和矢線230m、230n、230P、和230q。漸進式特征圖譜330表示對應于自給定時間點起由在線系統100接收的最近的用戶動作(例如,所有用戶動作)的特征圖譜。累積特征圖譜320表示基于給定在時間點之前出現的所有用戶動作的聚集信息的特征。如基于自給定時間點起的用戶動作的漸進式特征圖譜330所示,引入新的實體220f并且引入兩個新的矢線230r和230s。漸進式特征圖譜330還包括修改現有矢線230q的矢線230q’。
可以配置在漸進式特征圖譜480的特征值與累積特征圖譜合并之前漸進式特征圖譜480積聚特征的時間間隔的長度。例如,在線系統的系統管理程序可以確定與漸進式特征圖譜相關聯的時間間隔長度是一天、幾小時、或幾天。在實施方式中,對于具體組的用戶可配置時間間隔的長度。因此,具體組的用戶的漸進式特征存儲器的時間間隔的長度可以不同于另一組用戶。例如,如果一組用戶與更高的速率的用戶動作相關聯,那么這組用戶的時間間隔的長度可以被配置為小于較少經常使用在線系統進行用戶動作的一組用戶。在實施方式中,可以為每個個人用戶配置漸進式特征存儲器的時間間隔的長度。
修改的累積特征圖譜320b是通過將漸進式特征圖譜320與累積特征圖譜320a合并310獲得的。修改的累積特征圖譜320b包括來自漸進式特征圖譜320以及累積特征圖譜320a的部分。來自漸進式特征圖譜320的新的實體和矢線被包括在累積特征圖譜320b中。此外,對應于累積特征圖譜320a中的現有的矢線230q的漸進式特征圖譜320中的任何矢線230q’導致現有矢線230q修改為矢線230q”。矢線230q”是通過將對應 于矢線230q的特征值與對應于230q’的特征值聚集獲得的。特征值的聚集可以取決于特征。不同類型的特征需要不同的操作來合并成分量值。例如,矢線230q可以表現源實體請求來自目標實體的信息的速率并且矢線230q可以表現自給定時間點起源實體經常請求來自目標實體的信息。自給定時間點起的通信導致源實體請求來自目標實體的信息的總速率的修改,如矢線230q”示出的。
累積特征圖譜320在圖譜合并操作310期間更新。然而,在不進行合并操作時,沒有對累積特征圖譜320的更新。基于由在線系統接收的最新的用戶動作的更新在漸進式特征圖譜330中進行。在實施方式中,合并310操作期間,漸進式特征圖譜被標記為非活躍的并且停止更新非活躍的漸進式特征圖譜。新的漸進式特征圖譜被用于基于合并310操作期間的最新的用戶動作進行更新。因為沒有對正在合并的或者累積特征圖譜或者非活躍的漸進式特征圖譜的更新,所以可以有效進行合并操作。如果合并操作的兩個輸入圖譜在合并操作期間可以更新,那么圖譜的各個部分必須被鎖定,從而使得合并操作的效率變低。
圖3示出在累積特征圖譜和漸進式特征圖譜中具有幾個節點和矢線的實例。然而在具有大量用戶的在線系統中,累積特征圖譜和漸進式特征圖譜兩者均具有大量節點和矢線。累積特征圖譜對于在線系統100的其他模塊是可用的以請求特征值。
系統結構
圖4是作為在線系統100的實例的社交網絡系統200的實施方式的系統結構的示圖。盡管社交網絡系統200本文中描述為示例性在線系統,但本文中描述的原理可適用于其他在線系統。社交網絡系統200包括新聞饋送發生器435、網絡服務器415、動作記錄器440、動作日志245、聯系人存儲器430、用戶資料存儲器425、和建議模塊140、以及特征管理器150。在其他實施方式中,社交網絡系統200可包括用于各種應用的另外的、更少的、或者不同的模塊。為了不使該系統的細節變得模糊,未示出諸如網絡接口、安全機構、負荷平衡器、故障轉移服務器、管理和網絡操作平臺等常規部件。
社交網絡系統200將用戶資料存儲在用戶資料存儲器425中。用戶資料存儲器425存儲描述社交網絡系統200的用戶的信息,包括傳記、人口統計、以及其他類型的描述性信息,諸如工作經歷、教育經歷、性別、性偏好、愛好或偏好、位置等。用戶資料存儲器425還可以存儲由用戶提供的內容,例如,圖像、視頻、評論、以及狀態更新。在實施方式中,社交網絡系統200的用戶可以是組織,例如,企業、非收益性組織、制造商、供應商等。存儲在組織的用戶資料中的惡信息類型可以不同于個人的用戶資料中存儲的信息。例如,組織可以存儲描述企業類型、與組織相關聯金融信息、組織結構等的信息。用戶可以是可在社交網絡系統200中表現的任何類型的實體。
社交網絡系統200允許用戶增加與他們希望聯系的社交網絡系統200的若干其他用戶的聯系人。可由用戶明確添加聯系人,例如,用戶選擇特定的其他用戶成為其朋友,或者基于用戶的共同特征通過社交網絡系統自動創建聯系人(例如,作為同一教育機構的男校友的用戶)。社交網絡系統可以連同用戶的具體信息一起存儲描述用戶的聯系人的信息。
社交網絡系統200將描述不同會員之間的一個或者多個聯系的數據存儲在聯系人存儲器430中。聯系人信息可顯示具有相似或者共同工作經驗、組群成員資格、愛好、或者教育經歷的用戶。此外,社交網絡系統200包括不同用戶之間的用戶定義聯系,從而允許用戶指定其與其他用戶的關系。例如,這些用戶定義聯系允許會員產生與其諸如朋友、同事、伙伴等其他用戶(平行于用戶的實際生活關系)的關系。用戶可從預定義類型的聯系中選擇或者根據需要定義他們自己的聯系類型。描述每個用戶的用戶信息可以包括描述用戶的聯系人的信息。此外,描述用戶的聯系人的信息可以與由用戶進行的動作有關地訪問。例如,如果用戶將評論發布在社交網絡系統上,那么社交網絡系統可以提供描述用戶的聯系人的動作的信息。信息可以經由新聞饋送提供至用戶的聯系人。
社交網絡系統200可以通過數據庫或其他數據存儲庫中維護的信息將由用戶進行的動作與用戶的資料相關聯。這樣的動作可以包括,例如,將消息發送至其他用戶、讀取來自另一個用戶的消息、觀看與另一個用戶相 關聯的內容等。此外,與其他對象有關的進行的多個動作是針對特定用戶,所以這些動作也與那些用戶相關。
動作記錄器440能夠接收來自網絡服務器415的關于登錄和/或退出社交網絡系統200的用戶動作的信息。動作記錄器440利用關于用戶動作的信息填充動作日志445以追蹤他們。通過在數據庫或者其他數據存儲庫(諸如動作日志245)中維護的信息,特定用戶針對另一用戶采取的任何動作與每個用戶的資料相關聯。這些動作可包括例如添加與其他用戶的聯系、發送消息至其他用戶、讀取來自其他用戶的消息、觀看與其他用戶相關的內容、參加由另一用戶發布的事件等。
社交網絡系統200維護新聞饋送渠道,將社交網絡系統200中可用的信息的有規律的更新提供至用戶。經由新聞饋送渠道報道的信息由新聞饋送發生器435確定。新聞饋送發生器435基于動作日志445中存儲的動作為每個用戶生成關于可能與用戶有關的信息的消息。這些消息稱為“故事”;每個故事是包括基于與具體會員有關的動作日志中的一個或多個動作的一條或幾條信息的消息。例如,如果用戶的聯系人進行處理,那么該動作可以經由新聞饋送故事向用戶報告。經由新聞饋送報告的動作通常是由用戶的聯系人執行的動作,但不限于那些。例如,如果與用戶的聯系人不相關的某些信息被確定為對用戶有用的,那么該信息可以經由新聞饋送報告給用戶。
網絡服務器415經由網絡410鏈接至一個或多個客戶端設備110;網絡服務器415可用作網頁,以及其他網絡相關的內容,諸如Flash、XML等。網絡服務器415提供在社交網絡系統200和客戶端設備110之間接收和路由消息的功能。消息可以是即時消息、排隊消息(例如,電子郵件)、文本和SMS(短消息服務)消息、或者任何其他合適的消息技術。在一些實施方式中,社交網絡系統200的其他用戶可看到由一個用戶發送至另一用戶的消息,例如,被接收消息的用戶的聯系人看到。除消息的接收者之外,社交網絡系統200的其他用戶可看到的消息類型的實例是涂鴉墻。
社交網絡系統200提供用戶對通過網站支持的各種類型實體采取動作的能力。這些實體可以包括網站會員屬于的組或網絡(其中這里“網絡” 指的不是物理通信網絡,而是人們的社交網絡),會員可能感興趣的事件或日歷條目,會員可以經由網站使用的借助計算機的應用程序,以及允許會員經由網站購買、出售、拍賣、出租、或者交換項目的業務。用戶資料可存儲用戶與各個實體的關聯。
社交網絡系統200可以給用戶提供彼此通信或者獲得他們感興趣的信息的各個機制,例如,他們的朋友參與的活動,他們的朋友安裝的應用程序,朋友對其他朋友的活動進行的評論等。會員之間通信的機制稱為信道。如果用戶與另一個用戶通信,那么必須訪問兩個用戶的用戶信息,例如,將通信的動作與發送者和接收者相關聯。
特征管理器150從由社交網絡系統200接收的對應于用戶動作的信號105提取特征值。特征管理器150存儲提取的特征值并且將特征值提供至社交網絡系統200的各個模塊。特征管理器150是在圖1的描述中描述的并且本文中例如,在圖4B中更詳細地描述。
建議模塊140確定各個用戶感興趣的信息并且將信息發送至他們。例如,社交網絡系統200可以將描述由與用戶聯系的其他用戶采取的動作的故事發送給用戶。故事可以經由社交網絡系統200的通信信道,例如新聞饋送信道傳送給用戶。建議模塊140使用各個用戶的用戶資料中的可用的信息確定每個用戶感興趣的故事。建議模塊可以使用特征存儲器130中可用的信息確定呈現給用戶的信息。在一些實施方式中,建議模塊140可以使用例如機器學習模型的預測器模型選擇呈現給用戶的信息。這些預測器模型是使用從特征存儲器130獲得的數據訓練的。各個其他模塊可以使用特征存儲器130中存儲的信息進行決定。例如,模塊可以使用特征存儲器130中存儲的信息選擇給用戶建議的用戶的潛在的朋友。新聞饋送發生器435可以使用存儲在特征存儲器130中的信息選擇呈現給用戶的新聞饋送項。特征可以用于在線系統中的各種其他目的,例如,社交網絡系統可以為用戶分級各個實體,例如,分級用戶的朋友、用戶的潛在朋友、用戶可能感興趣的頁面、用戶可能感興趣的內容、給定用戶的提前鍵入的搜索詞、用戶可能感興趣的廣告等。
客戶端設備110執行瀏覽器405以允許用戶與社交網絡系統200交互。瀏覽器405允許用戶使用社交網絡系統200進行各種動作。這些動作包括檢索檢索用戶感興趣的信息、推薦內容至其他用戶、上傳內容至社交網絡系統200、與社交網絡系統的其他用戶交互、建立與社交網絡系統的用戶的聯系等。
客戶端設備110和在線系統100之間的交互通常經由網絡410,例如,經由因特網執行。網絡410使客戶裝置110和社交網絡系統200之間能夠通信。在一個實施方式中,網絡410使用標準的通信技術和/或協議。因此,網絡410可以包括使用以下技術的鏈接,諸如以太網、802.11、世界范圍互通的微波訪問(WiMAX)、3G、數字用戶線路(DSL)、異步傳輸模式(ATM)、InfiniBand、PCI表達高級切換等。相似地,在網絡410中使用的網絡協議可包括多協議標簽交換(MPLS)、傳輸控制協議/因特網協議(TCP/IP)、用戶數據報協議(UDP)、超文本傳輸協議(HTTP)、簡單郵件傳輸協議(SMTP)以及文件傳送協議(FTP)等。使用包括超文本標記語言(HTML)和可擴展標記語言(XML)等的技術和/或格式能夠表示在網絡410上交換的數據。此外,所有或一些鏈接可以使用以下常規的加密技術加密,諸如安全套接字層(SSL)、安全傳輸層協議(TLS)、虛擬專用網絡(VPN)、互聯網協議安全(IPsec)等。在另一實施方式中,實體可用自定義的和/或專用的數據通信技術來代替或者結合上述通信技術。根據實施方式,網絡410也可包括到其他網絡(諸如因特網)的鏈接。
圖4B是根據本發明的實施方式的社交網絡系統200的特征管理器150的系統結構的示圖。特征管理器150包括以下模塊,包括特征提取器455、請求處理器470、特征合并器475、調度器465、特征元數據存儲器420、累積特征存儲器490、和一個或多個漸進式特征存儲器480a、480b。特征管理器150處理用戶動作以確定特征存儲器480、490中存儲的特征值。特征管理器150從社交網絡系統200的各個模塊接收請求以提供了特征值。在一些實施方式中,特征管理器150可以從外部系統接收對特征值的請求,例如,經由應用程序編程界面(API)在社交網絡系統內功能激活的外部系統。
描述各種類型的特征的元數據存儲在特征元數據存儲器420中。特征可以表示為基于與社交網絡系統200中表現的實體和在社交網絡系統200中進行的動作相關聯的值的表達式。這些表示特征的表達式可以由專家提供并且由例如系統管理員的特許用戶添加到系統。在實施方式中,特征被表示為登錄社交網絡系統的動作的函數,即,feature=function(logged_actions)。特征還可以是其他特征的函數,例如,基于其他特征或動作,或者兩個的組合的表達式。作為表達式的特征的實例,如果目標是用戶,并且view_profile對應于觀看目標用戶的資料的源用戶,view_photo對應于觀看目標用戶照片的源用戶,并且view_comment對應于觀看目標用戶發布的評論的源用戶,那么稱為觀看的特征可以如下限定。
observation=view_profile+view_photo+0.5×view_comment
在以上等式中,術語的值,比方說view_profile,如果動作發生是1并且如果動作不發生是0。在另一個實施方式中,每個術語的值可以是基于描述具體動作的信息的計分值,例如,時間間隔內的由用戶進行的動作的數量,或者基于與諸如用戶在檢索不同的照片之前觀察照片的一段時間的動作相關聯的持續時間的記分。
在實施方式中,特征可以是基于由源用戶對于多個目標進行的動作的合計值。例如,特征可以為與源用戶聯系的所有其他用戶表現在給定時間間隔中由源用戶進行的所有頁面觀看的合計。另一個特征可以表現與用戶聯系的其他用戶發布用戶視圖圖像的速率。特征可以表現源用戶對于目標用戶進行的動作,該動作基于源用戶對于與源用戶聯系的所有其他用戶的行為標準化。例如,特征可以表現使用源用戶和與源用戶聯系的其他用戶的交互的平均數量標準化的源用戶與目標用戶的交互的頻率。特征元數據可以指定將與特征值相關聯的部分結果結合的表達式。例如,描述特征的表達式可以指定怎樣通過結合評估的兩個不同的時間間隔的特征的部分結果獲得特征值。
特征提取器455基于由社交網絡系統200的用戶進行的用戶動作提取特征值。特征提取器455基于描述特征的元數據提取特征。在實施方式中, 描述各個特征的元數據存儲在實現社交網絡系統200的處理器的存儲器中以便更快地訪問。每個特征類型可以與某些類型的用戶動作相關聯。例如,對應于源用戶和目標用戶之間的通信速率的特征可以與源用戶和目標用戶之間的每次通信相關聯。在實施方式中,短暫間隔內出現的具體類型的動作的多個實例被處理為用戶動作的單個實例。例如,如果用戶在幾分鐘以內點擊圖像幾次,那么特征管理器150將這些多次點擊處理為單個點擊動作。相似地,如果用戶在幾分鐘以內點擊顯示用戶喜歡的實體的用戶界面按鈕多次,那么特征管理器150將這些多個相同信號處理為表示用戶喜歡實體的單個用戶動作。這些一系列用戶動作被處理為單個用戶動作,因為與進行用戶動作的事實相比短間隔以內發生的多個情況不傳達任何顯著的附加信息。
當具體類型的用戶動作由用戶進行時,與該用戶動作相關聯所有特征可以被重新評價。在實施方式中,特征的情況可以存儲為可以結合以確定特征值的各個分量值。例如,兩個用戶之間的個人通信的計數可以是存儲為不同的時間間隔的。兩個用戶之間的通信的合計速率可以通過基于描述特征的表達式結合不同的計數值來獲得。如另一實例,如果特征基于用戶觀看照片的次數,那么每次用戶觀看照片會使得特征被重新評估。
在實施方式中,特征表存儲各個特征的值。例如,特征表可具有以下列,源ID、目標ID、目標類型、動作ID、以及各個特征。在實施方式中,各個特征的值可以表示為與源和目標的每個情況相關聯的名字值對。在另一個實施方式中,具體預測器模型產生的數據被表示為表I,其中每個源和目標與模型有關的各個特征相關聯。
表I
行ID源ID目標ID特征F1特征F2200110020020512200210020120630200310120215720
特征存儲器480和490存儲由特征提取器455提取的特征值。每個特征存儲器480a、480b、和490存儲具體時間間隔的特征值。累積特征存儲器490存儲基于給定在時間點之前出現的用戶動作的特征值。例如,在當前時間點,累積特征存儲器490可以存儲基于昨天或更早時候接收的用戶動作的特征值。相比之下,漸進式特征存儲器480a存儲自給定時間點起出現的用戶動作。例如,特征存儲器可以存儲基于現在出現的用戶動作的所有特征值。
基于當前用戶動作的特征值可以被確定并且存儲在漸進式特征存儲器480a中直至給定時間點,之后漸進式特征存儲器480a中存儲的特征值與累積特征存儲器490的特征值合并。特征合并器475進行來自漸進式特征存儲器480的特征值與來自累積特征存儲器490的特征值的合并。例如,在每天結束時,特征合并器475將漸進式特征存儲器480的特征值與累積特征存儲器490的特征值合并。
為了避免在合并特征值的同時更新漸進式特征存儲器480a,漸進式特征存儲器480a被標記為非活躍的。非活躍的漸進式特征存儲器480是不響應于當前發生的用戶動作更新的特征存儲器,而活躍的漸進式特征存儲器480是響應于社交網絡系統200中當前發生的用戶動作更新的特征存儲器。因此,在漸進式特征存儲器480中存儲的信息與累積特征存儲器490中存儲的信息合并的同時,停止對標記為非活躍的漸進式特征存儲器480a的更新。一旦漸進式特征存儲器480的特征值合并,漸進式特征存儲器480被重置,即,漸進式特征存儲器480被處理為空的。漸進式特征存儲器480b被標記為活躍的并且接收的用戶動作產生對漸進式特征存儲器480b中的特征值的更新。對特漸進式特征存儲器480b的更新可以繼續另一個時間間隔直至達到后續時間點。以上過程可以重復,即,為了將漸進式特征存儲器480b中的特征值與累積特征存儲器490中的特征值合并,將漸進式特征存儲器480b標記為非活躍的。在這個反復操作中,響應于漸進式特征存儲器480b被標記為非活躍的,漸進式特征存儲器480a可以標記為活躍的。在這個階段,假定先前存儲在漸進式特征存儲器480a中的信息與累積特征存儲器490中的信息合并并且漸進式特征存儲器480a被重置。 因此,漸進式特征存儲器480a可以用于更新新的時間間隔的特征值。因此,兩個漸進式特征存儲器480a和480b的狀態可以是交替切換。在一個時間間隔中,第一漸進式特征存儲器被標記為活躍的并接收更新,而第二漸進式特征存儲器被標記為非活躍的并且與累積特征存儲器合并。在下一個時間間隔中,第二漸進式特征存儲器被標記為活躍的并接收更新,而第一漸進式特征存儲器被標記為非活躍的并且與累積特征存儲器合并。在系統100或200運行時,這個過程可以繼續。調度器485安排漸進式特征存儲器與累積特征存儲器合并的任務以及如上所述在合適的時間改變每個漸進式特征存儲器的狀態的任務。
在實施方式中,漸進式特征存儲器480存儲在計算機系統的存儲器中,該存儲器與用于累積特征存儲器490的存儲器的存取時間相比具有更快的存取時間。因為累積特征存儲器490包括大量數據,其存儲在較慢的但昂貴的存儲器中,例如,瞬時存儲器。與此相反,漸進式特征存儲器480經常被訪問以便在進行用戶動作時更新特征。因此,漸進式特征存儲器480存儲在更快的存儲器中,例如,隨機存取存儲器(RAM)。RAM與輔助存儲器相比通常是昂貴的并且計算機系統的RAM存儲器的量通常小于可用的輔助存儲器的量,例如,瞬時存儲器。因為存儲在累積特征存儲器490中的數據的量可以是重要的,實施方式跨越多個計算機對累積特征存儲器490中的信息進行分區使得每個計算機被分配分區。例如,一組用戶可以分配到分區以及映射至分區的與用戶相關聯的特征。
請求處理器470接收來自社交網絡系統200的各個模塊的對特征值的請求。請求處理器470檢索特征值并且將特征值返回至請求者。在實施方式中,請求處理器470從每個特征存儲器檢索相應的特征值并且將他們結合以確定總特征值。例如,請求處理器470可以接收對于與源實體和目標實體相關聯的具體特征類型的特征值的請求。每個特征存儲器480a、480b、和490可以基于與每個特征存儲器相關聯的時間間隔中出現的用戶動作存儲與請求的特征相關聯的部分結果。請求處理器470從每個特征存儲器檢索特征值的部分結果并且將部分結果結合以確定基于由社交網絡系統200接收的相關聯的用戶動作的特征值。
在實施方式中,請求處理器470減弱與舊的時間間隔相關聯的部分結果值以將更高的比重給予最新的數據。例如,從累積特征存儲器獲得的部分結果可以乘以減弱因素(也稱為衰變因數)來確定結合的特征值。衰減因數的值可以是可配置的,例如,小于一的預配置值,比方說0.9。因此,累積數據存儲器中的舊的用戶動作的影響隨著時間的過去減弱。例如,如果特征值可以被認為是與不同的時間間隔相關聯的聚合部分結果,那么相當舊的時間間隔確定的部分結果會多次乘以減弱因數,而相對最近的時間間隔的部分結果僅乘以幾次減弱因數。因此,與舊的時間間隔相關聯的用戶動作的權重小于與新的時間間隔相關聯用戶動作。
用戶動作對于特征值的影響可以被認為是隨著時間的過去指數衰減。在一些實施方式中,衰變因數的值取決于特征的類型。每個特征可以與半衰期相關聯。半衰期的值可以用于確定特征的衰變因數。例如,一些特征可具有較長的半衰期,而其他特征可具有較短的半衰期。因此,具有較長的半衰期的特征具有使得舊的值緩慢衰變的衰變因數,而具有較短的半衰期的特征具有使得舊的值快速衰變的衰變因數。
存儲特征值的總體過程
圖5示出根據本發明的實施方式的漸進式特征存儲器與累積特征存儲器合并的總體過程。作為實例,當開始執行在圖5中示出的過程時,漸進式特征存儲器480a被假定為標記為活躍的并且漸進式特征存儲器480標記為非活躍的。網絡服務器415從用戶接收進行各個用戶動作的請求。這些動作可以由動作記錄器440記錄在動作日志445中。特征提取器455可以基于描述這些用戶動作的信息提取特征值或與特征值相關的部分結果。特征提取器455可以或者在接收用戶動作時從動作記錄器440獲得描述這些用戶動作的信息或者通過在信息記錄在動作日志445中之后處理動作記錄獲得描述這些用戶動作的信息。特征提取器455基于特征值或特征值的部分結果更新活躍的漸進式特征存儲器480a。接收用戶動作并更新漸進式特征存儲器480a的過程是持續給定時間間隔的。
調度器465檢查持續時間間隔是否超過閾值530以確定是否將漸進式特征存儲器480a中存儲的部分結果與累積存儲器490中的特征值合并。 在另一個實施方式中,調度器465可以根據其他標準決定何時將漸進式特征存儲器480a中存儲的部分結果與累積存儲器490中的特征值合并,例如基于漸進式特征存儲器480a中存儲的信息的量是否超過閾值或者接收的用戶動作的數量是否超過閾值。
如果調度器465決定漸進式特征存儲器480a中的結果準備與累積存儲器490中的特征值合并,那么調度器465將漸進式特征存儲器480a標記為非活躍的并且將漸進式特征存儲器480a標記為活躍的。因此,兩個漸進式特征存儲器480的狀態被切換。在實施方式中,特征管理器450可以分配下一個時間間隔存儲更新的新的漸進式特征存儲器480而不是在兩個漸進式特征存儲器之間切換。例如,漸進式特征存儲器可以選自漸進式特征存儲器的池(pool)。在實施方式中,可以為每個新的時間間隔分配新的漸進式特征存儲器。特征合并器475將來自漸進式特征存儲器480a的特征值合并至累積特征存儲器490。以上步驟510、520、530、540、和550被重復多次,例如,只要社交網絡系統200在運行。在實施方式中,特征合并器475執行為進行合并操作的后臺線程。
圖6是示出根據本發明的實施方式的利用累積漸進式特征合并數據的活躍的漸進式特征存儲器與非活躍的漸進式特征存儲器的示圖。圖6通過各個步驟示出特征管理器150的特征存儲器。如圖6所示,在步驟650a中,漸進式特征存儲器480a被標記為活躍的并且信號105引起對漸進式特征存儲器480a的更新。
在步驟650b中,漸進式特征存儲器480a被標記為非活躍的615,并且漸進式特征存儲器480b被標記為活躍的。因此,對漸進式特征存儲器480b進行基于信號105的更新并且停止對非活躍的漸進式特征存儲器480a的更新。在步驟650c中,來自非活躍的漸進式特征存儲器480a的特征值被合并至累積特征存儲器490625。合并操作625期間,信號105引起對漸進式特征存儲器480b的更新。在社交網絡系統200運行時,以上過程重復多次645,例如。
圖7A-圖7C示出根據本發明的實施方式的與累積特征存儲器和漸進式特征存儲器相關聯的時間間隔。圖7A示出對應于在圖6中示出的步驟 650a的時間間隔。圖7A示出時間點720a將時間線劃分成兩個時間間隔,710a和710b的時間線。時間間隔710a對應于時間點720a之前的時間并且時間間隔710b對應于時間點720a之后的時間。累積特征存儲器710a存儲使用時間間隔710a期間出現的用戶動作確定的特征值。漸進式特征存儲器480a存儲使用時間間隔710b期間出現的用戶動作確定的特征值并且響應于當前發生的用戶動作得到更新。當前時間可以由時間點720a右邊發生的點表示并且可以被認為是沿著時間線向右移動。當當前時間點到達720b時,漸進式特征存儲器480a被標記為非活躍的并且新的漸進式特征存儲器480b用作活躍的漸進式特征存儲器。圖7B示出對應于在圖6中示出的步驟650b的時間間隔。圖7B示出具有三個時間間隔的時間線,對應于時間點710a之前的時間的時間間隔710a,對應于時間點710a和710b之間的時間的時間間隔710b’,以及對應于自時間點710b起的時間的時間間隔710c。累積特征存儲器710a存儲使用時間間隔710a’期間出現的用戶動作確定的特征值。非活躍的漸進式特征存儲器480a存儲使用時間間隔710b’期間出現的用戶動作確定的特征值,而活躍的漸進式特征存儲器480b存儲使用時間間隔710c期間出現的用戶動作確定的特征值并且響應于當前發生的用戶動作得到更新。
圖7C示出對應于在圖6中示出的步驟650c的時間間隔。圖7C示出具有兩個時間間隔的時間線,對應于時間點710b之前的時間的時間間隔710a’和對應于自時間點710b起的時間的時間間隔710c。在這個步驟650c中,漸進式特征存儲器480a已經與累積特征存儲器490合并。累積特征存儲器710a存儲使用時間間隔710a’期間出現的用戶動作確定的特征值。活躍的漸進式特征存儲器480a存儲使用時間間隔710c期間出現的用戶動作確定的特征值并且響應于當前發生的用戶動作得到更新。
詢問特征值的總體過程
請求處理器470接收特征值的請求并且處理他們。請求提供確定需要的特征的信息,例如,請求可以確定與特征值相關聯的用戶、與特征值相關聯的目標實體、和確定特征類型的信息。不同的特征存儲器490、480a、480b存儲對應于具體特征值的部分結果,每個部分結果使用一組用戶動作 確定,例如,具體時間間隔期間發生的用戶動作。作為實例,如果特征值是通過合計與用戶動作相關聯的值確定的,那么對應于存儲器的部分結果值可以對應于使用那個存儲器以內的所有相關動作確定的合計值。因此,請求處理器470通過結合對應于從每個特征存儲器490、480a、480b獲得的特征值的部分結果來確定特征值。某些特征存儲器不具有對應于特征的任何部分結果值,例如,如果對應于特征存儲器的時間間隔中沒有出現相關的用戶動作。在這個情況下,請求處理器470將來自具有特征值的部分結果的特征存儲器的部分結果結合。
圖8示出根據本發明的實施方式的處理對于維護漸進式特征存儲器和累積特征存儲器的系統的特征值的請求的總體過程。請求處理器470接收特征值的請求810。請求處理器470接收對應于特征值來自累積特征存儲器490的第一部分結果820。第一部分結果使用更新累積特征存儲器490中的特征值的用戶動作來確定。請求處理器470接收對應于特征值的來自漸進式特征存儲器480a的第二部分結果830。第二部分結果使用更新漸進式特征存儲器480a中的特征值的用戶動作來確定。請求處理器470接收對應于特征值的來自漸進式特征存儲器480b的第三部分結果840。第三部分結果使用更新漸進式特征存儲器480b中的特征值的用戶動作來確定。請求處理器470確定第一部分結果、第二部分結果、和第三部分結果的加權結合,并且將結合的部分結果作為請求的特征值返回860。
通過請求處理器確定的加權的結合850通過衰變因數(也稱為衰減因數)加權與舊的用戶動作相關聯的部分結果。這個減弱了舊的用戶動作在特征值中的影響。衰變因數是小于一的值,例如,0.9。在實施方式中,每個特征可以與不同的衰變因數相關聯。在實施方式中,每個特征與半衰期相關聯并且特征的衰變因數基于半衰期來確定。例如,對于某些特征,與其他特征相比舊的用戶動作可能更多地相關。如果舊的用戶動作更相關,那么衰變因數可更大,使得舊的用戶動作更慢衰變。另一方面,如果舊的用戶動作特征的計算較少的相關,那么衰變因數可更小,使得舊的用戶動作更快衰變。在實施方式中,衰變因數值可以是可配置的。
請求的特征的部分結果可以是單個漸進式特征存儲器和累積特征存儲器中可用的,例如,如果特征的請求是在步驟650a期間接收的。這個情況下的特征值f可以使用方程(1)決定,其中x表示從漸進式特征存儲器480a獲得的部分結果并且y表示從累積特征存儲器490獲得的部分結果,并且α表示衰變因數。
f=x+α×y     (1)
請求的特征的部分結果可以是漸進式特征存儲器480a、漸進式特征存儲器480b、和累積特征存儲器中可用的,例如,如果對于特征的請求是在步驟650b期間接收的。這個情況下的特征值f可以使用方程(1)(此處應該是(2))決定,其中x表示從漸進式特征存儲器480a獲得的部分結果,y表示從累積特征存儲器490獲得的部分結果,z表示從漸進式特征存儲器480b獲得的部分結果,α表示來自漸進式特征存儲器480a的部分結果的衰變因數,并且β表示來自漸進式特征存儲器480b的部分結果的衰變因數。
f=x+α×y+β×z     (2)
方程(1)對應于進行將來自漸進式特征存儲器480的特征值合并至累積特征存儲器490550的計算,如在圖5中示出的或者合并625如在圖6中示出的。
可替代的應用
說明書中描述的特征及優勢并不是全部包括的,且具體地,對于本領域普通技術人員而言,根據附圖、說明書以及權利要求書,很多其他特征和優勢將變得顯而易見。此外,應注意,在說明書中使用的語言主要是為了可讀性和說明的目的而選擇的,且并非旨在描繪或限定本發明的主題。
例如,可以生成預測器模型并且用于其他類型的在線系統并且不限于社交網絡系統。例如,存儲用戶資料并允許用戶采取動作的在線系統可以生成用戶可以采取的各個動作的用戶預測器。例如,在線系統可以允許用戶接收各種類型數據反饋。可以開發預測器模型預測用戶是否想要開啟向用戶呈現的反饋。預測器模型可以由在線系統使用以排序向用戶呈現的反 饋,例如,反饋可以基于用戶想要開啟反饋或請求來自反饋的附加信息的可能性來安排。
出于說明性目的,已經呈現了本發明的實施方式的以上說明;它并非旨在窮盡或將本發明限制到所公開的精確形式。它不旨在是詳盡的或將本發明限制于所公開的確切形式,相關領域技術人員可以理解,根據以上公開可以有多種修改和變形。
該描述的某些部分就對信息操作的算法和符號表示方面描述了本發明的實施方式。這些算法描述和表示通常由數據處理領域中的技術人員使用,以將他們工作的實質有效地傳達給本領域其他技術人員。盡管功能上、計算性或邏輯性地描述了這些操作,但這些操作應被理解為由計算機程序或等效電路、微代碼等來實現。而且,也已證明有時便于參考作為模塊的操作布置,而不丟失一般性。所描述的操作及其相關模塊可被嵌入到軟件、固件、硬件或者其任何組合中。
單獨或者結合其他設備使用一個或者多個硬件或者軟件模塊可執行或者實施本公開中所描述的任一步驟、操作或者過程。在一種實施方式中,軟件模塊實施為包括含計算機程序代碼的計算機可讀介質的計算機程序產品,能夠由計算機處理器執行計算機程序產品以執行所述的任一或者所有步驟、操作或者過程。
本發明的實施方式還可與用于執行本公開中的操作的裝置有關。出于需要之目的,可特別構造該裝置和/或該裝置可包括由存儲在計算機中的計算機程序選擇性激活或者重新配置的通用計算設備。這種計算機程序可被存儲在適用于存儲電子指令的有形計算機可讀存儲介質或任何類型的介質中,并被耦合至計算機系統的總線。而且,本說明書中提及的任何計算系統可包括單一處理器或者可以是采用多處理器設計的結構,以提高計算能力。
最后,主要出于可讀性和指導性之目的選擇本說明書中使用的語言,并且選擇上述語言并不是為了描述或者限制本發明的主題。因此,旨在不由細節描述限制本發明的范圍,而是由基于此的申請中發布的任何權利要 求限制本發明的范圍。因此,所公開的本發明的實施方式旨在進行例證,而非限制所附權利要求中所規定的本發明范圍。

關 鍵 詞:
基于 在線 系統 中的 用戶 動作 詢問 特征
  專利查詢網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
關于本文
本文標題:基于在線系統中的用戶動作詢問特征.pdf
鏈接地址:http://www.rgyfuv.icu/p-6381514.html
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服客服 - 聯系我們

[email protected] 2017-2018 zhuanlichaxun.net網站版權所有
經營許可證編號:粵ICP備17046363號-1 
 


收起
展開
山东11选5中奖结果走势图