• / 28
  • 下載費用:30 金幣  

網絡信息資源的搜索方法、裝置和系統.pdf

摘要
申請專利號:

CN201510336480.3

申請日:

2015.06.17

公開號:

CN104991907A

公開日:

2015.10.21

當前法律狀態:

授權

有效性:

有權

法律詳情: 授權|||實質審查的生效IPC(主分類):G06F 17/30申請日:20150617|||公開
IPC分類號: G06F17/30 主分類號: G06F17/30
申請人: 深圳市騰訊計算機系統有限公司
發明人: 蒲俊峰
地址: 518000廣東省深圳市南山區高新區高新南一路飛亞達大廈5-10樓
優先權:
專利代理機構: 廣州華進聯合專利商標代理有限公司44224 代理人: 何平; 鄧云鵬
PDF完整版下載: PDF下載
法律狀態
申請(專利)號:

CN201510336480.3

授權公告號:

||||||

法律狀態公告日:

2018.04.06|||2015.11.18|||2015.10.21

法律狀態類型:

授權|||實質審查的生效|||公開

摘要

本發明涉及一種網絡信息資源的搜索方法、裝置和系統。所述方法包括以下步驟:接收包含字符型定向條件信息的定向信息資源請求;根據所述定向信息資源請求將字符型定向條件信息轉換為數值型定向條件信息;將包含數值型定向條件信息的定向信息資源請求發送給索引服務器,以使所述索引服務器將所述數值型定向條件信息拆分,獲取每類定向條件信息的目標標識,根據所述目標標識搜索對應的資源位標識。上述網絡信息資源的搜索方法、裝置和系統,通過將定向信息資源請求中的字符型定向條件信息轉換為數值型定向條件信息,定向內容大大減少,網絡傳輸消耗帶寬也減少,可快速處理,數值型信息處理速度高于字符型信息處理速度,從而大大提升了系統的吞吐量。

權利要求書

權利要求書
1.  一種網絡信息資源的搜索方法,包括以下步驟:
接收包含字符型定向條件信息的定向信息資源請求;
根據所述定向信息資源請求將字符型定向條件信息轉換為數值型定向條件信息;
將包含數值型定向條件信息的定向信息資源請求發送給索引服務器,以使所述索引服務器將所述數值型定向條件信息拆分,獲取每類定向條件信息的目標標識,根據所述目標標識搜索對應的資源位標識。

2.  根據權利要求1所述的方法,其特征在于,在接收包含字符型定向條件信息的定向信息資源請求的步驟之前,所述方法還包括:
預先采用統一的編碼建立字符型定向條件信息與數值型定向條件信息的映射關系;
所述根據所述定向信息資源請求將字符型定向條件信息轉換為數值型定向條件信息的步驟包括:
根據所述定向信息資源請求從預先建立的字符型定向條件信息與數值型定向條件信息的映射關系,將字符型定向條件信息轉換為數值型定向條件信息。

3.  根據權利要求2所述的方法,其特征在于,所述預先采用統一的編碼建立字符型定向條件信息與數值型定向條件信息的映射關系的步驟包括:
預先將字符型定向條件信息分類;
采用統一的編碼為每類字符型定向條件信息分配對應的數值型標識范圍;
為每類字符型定向條件信息中每條字符型定向條件信息在對應的數值型標識范圍內分配對應的一個數值型標識。

4.  根據權利要求3所述的方法,其特征在于,所述每類字符型定向條件信息分配的數值型標識范圍中數值型標識數量大于對應類字符型定向條件信息已分配的數值型標識數量。

5.  根據權利要求1至4中任一項所述的方法,其特征在于,所述定向條件信息包括信息資源人群、年齡、性別、地域、操作系統、流量標簽、時間范圍、資源位約束條件、網絡模式中一種或多種。

6.  一種網絡信息資源的搜索裝置,其特征在于,包括:
接收模塊,用于接收包含字符型定向條件信息的定向信息資源請求;
轉換模塊,用于根據所述定向信息資源請求將字符型定向條件信息轉換為數值型定向條件信息;
發送模塊,用于將包含數值型定向條件信息的定向信息資源請求發送給索引服務器,以使所述索引服務器將所述數值型定向條件信息拆分,獲取每類定向條件信息的目標標識,根據所述目標標識搜索對應的資源位標識。

7.  根據權利要求6所述的裝置,其特征在于,所述裝置還包括:
映射關系建立模塊,用于在接收包含字符型定向條件信息的定向信息資源請求之前,預先采用統一的編碼建立字符型定向條件信息與數值型定向條件信息的映射關系;
所述轉換模塊還用于根據所述定向信息資源請求從預先建立的字符型定向條件信息與數值型定向條件信息的映射關系,將字符型定向條件信息轉換為數值型定向條件信息。

8.  根據權利要求7所述的裝置,其特征在于,所述映射關系建立模塊還包括:
分類單元,用于預先將字符型定向條件信息分類;
分配單元,用于采用統一的編碼為每類字符型定向條件信息分配對應的數值型標識范圍,以及為每類字符型定向條件信息中每條字符型定向條件信息在對應的數值型標識范圍內分配對應的一個數值型標識。

9.  根據權利要求8所述的裝置,其特征在于,所述每類字符型定向條件信息分配的數值型標識范圍中數值型標識數量大于對應類字符型定向條件信息已分配的數值型標識數量。

10.  根據權利要求6至9中任一項所述的裝置,其特征在于,所述定向條件信息包括信息資源人群、年齡、性別、地域、操作系統、流量標簽、時間范圍、資源位約束條件、網絡模式中一種或多種。

11.  一種網絡信息資源的搜索系統,其特征在于,包括定向資源搜索服務器、信息資源服務器和索引服務器;
所述信息資源服務器用于實時發送信息資源給所述索引服務器;
所述定向資源搜索服務器用于接收包含字符型定向條件信息的定向信息資源請求,并根據所述定向信息資源請求將字符型定向條件信息轉換為數值型定向條件信息,以及將包含數值型定向條件信息的定向信息資源請求發送給所述索引服務器;
所述索引服務器用于接收所述信息資源服務器實時發送的信息資源,并記載所述信息資源,以及接收定向資源搜索服務器發送的包含數值型定向條件信息的定向資源請求,并將所述數值型定向條件信息拆分,獲取每類定向條件信息的目標標識,根據所述目標標識搜索對應的資源位標識,將所述資源位標識返回給所述定向資源搜索服務器。

12.  根據權利要求11所述的系統,其特征在于,所述定向資源搜索服務器還用于預先采用統一的編碼建立字符型定向條件信息與數值型定向條件信息的映射關系,并根據所述定向信息資源請求從預先建立的字符型定向條件信息與數值型定向條件信息的映射關系,將字符型定向條件信息轉換為數值型定向條件信息;所述索引服務器還用于存儲采用統一的編碼建立字符型定向條件信息與數值型定向條件信息的映射關系。

13.  根據權利要求12所述的系統,其特征在于,所述定向資源搜索服務器還用于預先將字符型定向條件信息分類,采用統一的編碼為每類字符型定向條件信息分配對應的數值型標識范圍,為每類字符型定向條件信息中每條字符型定向條件信息在對應的數值型標識范圍內分配對應的一個數值型標識。

14.  根據權利要求13所述的系統,其特征在于,所述每類字符型定向條件信息分配的數值型標識范圍中數值型標識數量大于對應類字符型定向條件信息已分配的數值型標識數量;所述定向條件信息包括信息資源人群、年齡、性別、地域、操作系統、流量標簽、時間范圍、資源位約束條件、網絡模式中一種或多種。

15.  根據權利要求11所述的系統,其特征在于,所述索引服務器還包括主索引服務器和從索引服務器;
所述信息資源服務器還用于實時發送信息資源給所述主索引服務器;
所述主索引服務器用于接收實時發送的信息資源,并更新第一名單和第二名單,第一名單用于記錄上線的信息資源,第二名單用于記錄下線的信息資源,以及將信息資源發送給所述從索引服務器;
所述從索引服務器用于接收所述主索引服務器發送的信息資源,并記載所述信息資源,以及接收定向資源搜索服務器發送的包含數值型定向條件信息的定向資源請求,并將所述數值型定向條件信息拆分,獲取每類定向條件信息的目標標識,根據所述目標標識搜索對應的資源位標識,并將所述資源位標識返回給所述定向資源搜索服務器。

說明書

說明書網絡信息資源的搜索方法、裝置和系統
技術領域
本發明涉及計算機應用領域,特別是涉及一種網絡信息資源的搜索方法、裝置和系統。
背景技術
隨著互聯網技術的發展,越來越多的用戶使用網絡搜索所需的信息資源。為了滿足用戶的搜索需求,在精準的信息資源推薦系統中,使用精準信息描繪用戶信息,用戶信息的精細度直接影響了信息資源的點擊率。因為精準的用戶信息需要大量的、精細的用戶定向屬性,從而導致用戶信息定向內容復雜,進而增加了信息資源推薦系統傳遞用戶信息的耗時,同時也加深了用戶信息到定向信息資源的轉換復雜度。因此,簡便、快速的索引用戶定向條件是精準信息資源推薦系統設計的關鍵點之一。
傳統的信息資源推薦系統中采用的是用戶定向條件保持字符型參數在信息資源推薦系統內部各子服務直接傳遞,在定向條件與資源位標識轉換中,通過遍歷索引定向條件,依次取出匹配的資源位標識,再通過用戶定向條件的邏輯操作生成最終的用戶身份列表。然而,傳統的信息資源推薦系統中,存在如下缺陷:
(1)網絡帶寬消耗大:用戶定向條件是字符型信息,其內容長度較大,網絡傳輸占用較大的帶寬,導致網絡帶寬消耗大;
(2)報文處理延遲大:定向條件在推薦系統各子服務器之間傳遞時,發送端封裝報文,接收端解析報文均消耗較大的系統處理時間,導致報文處理延遲大;
(3)可擴展性差:當需要增加、刪除定向信息時,不僅需要重新定義各子服務器的定向信息格式,同時還需要更新定向條件與信息資源位標識的映射信息,增加了工作量;
(4)容錯性差:當客戶端接收的定向條件未定義時,可能導致匹配不到合 適的資源位標識或根本無法匹配資源位標識;
(5)系統吞吐量低:由于定向條件匹配資源位標識時需要遍歷全部定向條件空間,導致匹配性能低。
發明內容
基于此,有必要針對傳統的信息資源推薦系統網絡帶寬消耗大、報文處理延遲大、系統吞吐量低的問題,提供一種網絡信息資源的搜索方法,能降低網絡帶寬消耗,提高報文處理速度和系統吞吐量高。
此外,還有必要提供一種網絡信息資源的搜索裝置和系統,能降低網絡帶寬消耗,提高報文處理速度和系統吞吐量高。
一種網絡信息資源的搜索方法,包括以下步驟:
接收包含字符型定向條件信息的定向信息資源請求;
根據所述定向信息資源請求將字符型定向條件信息轉換為數值型定向條件信息;
將包含數值型定向條件信息的定向信息資源請求發送給索引服務器,以使所述索引服務器將所述數值型定向條件信息拆分,獲取每類定向條件信息的目標標識,根據所述目標標識搜索對應的資源位標識。
一種網絡信息資源的搜索裝置,包括:
接收模塊,用于接收包含字符型定向條件信息的定向信息資源請求;
轉換模塊,用于根據所述定向信息資源請求將字符型定向條件信息轉換為數值型定向條件信息;
發送模塊,用于將包含數值型定向條件信息的定向信息資源請求發送給索引服務器,以使所述索引服務器將所述數值型定向條件信息拆分,獲取每類定向條件信息的目標標識,根據所述目標標識搜索對應的資源位標識。
一種網絡信息資源的搜索系統,其特征在于,包括定向資源搜索服務器、信息資源服務器和索引服務器;
所述信息資源服務器用于實時發送信息資源給所述索引服務器;
所述定向資源搜索服務器用于接收包含字符型定向條件信息的定向信息資 源請求,并根據所述定向信息資源請求將字符型定向條件信息轉換為數值型定向條件信息,以及將包含數值型定向條件信息的定向信息資源請求發送給所述索引服務器;
所述索引服務器用于接收所述信息資源服務器實時發送的信息資源,并記載所述信息資源,以及接收定向資源搜索服務器發送的包含數值型定向條件信息的定向資源請求,并將所述數值型定向條件信息拆分,獲取每類定向條件信息的目標標識,根據所述目標標識搜索對應的資源位標識,將所述資源位標識返回給所述定向資源搜索服務器。
上述網絡信息資源的搜索方法、裝置和系統,通過將定向信息資源請求中的字符型定向條件信息轉換為數值型定向條件信息,在搜索過程中均采用數值型定向條件信息,定向內容大大減少,網絡傳輸消耗帶寬也減少,對數值型定向條件信息進行處理,無論是封裝還是解析,均可快速處理,數值型信息處理速度高于字符型信息處理速度,從而大大提升了系統的吞吐量。
附圖說明
圖1為一個實施例中網絡信息資源的搜索系統的架構示意圖;
圖2為圖1中網絡信息資源的搜索系統的工作時序圖;
圖3為一個實施例中網絡信息資源的搜索方法的流程圖;
圖4為一個實施例中預先采用統一的編碼建立字符型定向條件信息與數值型定向條件信息的映射關系的步驟的具體流程圖;
圖5為一個實施例中網絡信息資源的搜索裝置的結構框圖;
圖6為另一個實施例中網絡信息資源的搜索裝置的結構框圖;
圖7為一個實施例中圖6中映射關系建立模塊的內部結構示意圖。
具體實施方式
為了使本發明的目的、技術方案及優點更加清楚明白,以下結合附圖及實施例,對本發明進行進一步詳細說明。應當理解,此處所描述的具體實施例僅僅用以解釋本發明,并不用于限定本發明。
圖1為一個實施例中網絡信息資源的搜索系統的架構示意圖。如圖1所示,一種網絡信息資源的搜索系統包括終端110、定向資源搜索服務器120、信息資源服務器130和索引服務器140。
終端110上安裝有客戶端,例如瀏覽器客戶端或其他應用程序客戶端。終端110上的客戶端可以獲取用戶通過鍵盤或鼠標或觸摸屏等輸入設備輸入的字符型定向條件信息的定向信息資源請求。終端110可為智能手機、臺式計算機、筆記本電腦、平板電腦、個人數字助理等。
字符型定向條件信息可包括信息資源人群、年齡、性別、地域、操作系統、流量標簽、時間范圍、資源位約束條件、網絡模式中一種或多種。
信息資源人群可為小孩、青年人、中年人、老年人等不同群體。
年齡可為1至127歲。性別可為未知、男、女。
地域可包括中國國內地域及國外地域。操作系統可分為未知、IOS系統、Android、WindowsPhone、Symbian、Java、S40asha、Webwx、Blackberry和Widows等類型。
流量標簽類型可包括教育、旅游、金融、汽車、房產、家具、服飾鞋包、奢侈品、餐飲美食、生活服務、商務服務、美容、電子數碼/軟件/互聯網、體育運動、醫療健康、母嬰、游戲、文學、漫畫動漫、音樂、科學、軍事、新聞資訊、影視、娛樂、政法及其它等。
時間范圍是指信息資源上線的時間范圍。例如,可將時間區域分兩層類型:第一層類型按星期制分七天,第二層將每一天以30分鐘粒度分為48個區間范圍。
網絡模式可包括未知模式、WiFi無線、2G、3G、4G等。
資源位約束條件是指設定的限制搜索條件。可將年齡、性別、地域、操作系統、流量標簽、網絡模式和時間范圍等組合在一起采用與、或、非等邏輯運算形成搜索條件。例如可設定年齡為1至3歲且時間范圍在星期二。
定向資源搜索服務器120用于預先采用統一的編碼建立字符型定向條件信息與數值型定向條件信息的映射關系。
進一步的,定向資源搜索服務器120預先采用統一的編碼建立字符型定向 條件信息與數值型定向條件信息的映射關系包括:預先將字符型定向條件信息分類,采用統一的編碼為每類字符型定向條件信息分配對應的數值型標識范圍,為每類字符型定向條件信息中每條字符型定向條件信息在對應的數值型標識范圍內分配對應的一個數值型標識。每類字符型定向條件信息分配的數值型標識范圍中數值型標識數量大于對應類字符型定向條件信息已分配的數值型標識數量。
具體地,統一的編碼可為64bit(比特位)編碼規則或128bit等。本實施例中,采用64bit編碼建立字符型定向條件信息和數值型定向條件信息建立映射關系。該映射關系包括以下映射規則:
(1)<!--區間64bit中采用Higher 20bit用于擴展特性,可以作為私有編碼使用-->;
(2)<!--Medium 12bit用于區分低32位的id(identity)類型-->;
(3)<!--lower 32bit標識類型指定后整個42億空間可以用于該類型編碼-->;
(4)<!lowerbound:區間下限,upperbound:區間上限,所有區間為左閉右開即[lowerbound,upperbound]-->;
(5)<!allocate表示已分配-->;
(6)<!reserves預留給將來使用-->;
(7)<!forbidden禁止在統一標識里面使用,可以在內部使用對外不可見-->。
為字符型定向條件信息資源分配對應的數值型標識,建立索引空間,以便于索引。首先,每類定向條件信息資源分配對應的數值型標識范圍。
例如,首先采用如下索引空間(即范圍)代碼將字符型定向條件信息資源分成三類大的數值型標識范圍,具體如下:


上述索引空間代碼中,將定向條件信息中年齡、性別、地域、操作系統、時間范圍、廣告位約束條件、網絡模式映射在system_targeting范圍內,作為一大類,可擴容999999990個定向條件,且為system_targeting規定了lowerbound下限10和upperbound上限1000000000。資源位映射為wechat_ad_position范圍,共1000W(萬)數量,且為wechat_ad_position規定了lowerbound下限0x100000000和upperbound上限0x200000000,當前系統支撐不到100W,預留空間足夠。流量標簽映射為wechat_flow_class范圍,且為wechat_flow_class規定了lowerbound下限0x200000000和upperbound上限0x300000000,共1000W數量。禁止編碼段:0x100000000000~0xffffffffffffffff,可做預留段。
再對每類定向條件信息資源中每類分配對應的數值型標識。信息資源此處以廣告資源為例,例如定向條件段標識范圍代碼:


各類定向條件信息資源所分配的對應數值型標識范圍如表1所示。
表1

其中,性別的數值型標識分配:性別領域分配8個target id(目標標識,即數值型標識),范圍涵蓋:[12,20)。將未知性別、男和女分別映射到target id12、13和14,當前預留5個。性別分配的代碼如下:

由上述性別分配代碼可知,采用11表示性別這一類,12表示性別未知,13表示男,14表示女。
年齡的數值型標識分配:年齡區域分配200數量target id,范圍涵蓋:[101~300)。分別將未知年齡、1~127歲分別映射target 101~228,當前預留73個。年齡分配的代碼如下:

由上述年齡分配代碼可知,采用100表示年齡這一類,101至228分別對應1歲至127歲。
網絡模式的數值型標識分配:網絡模式區域分配100數量target,范圍涵蓋:[301~400)。分別將未知模式、無線、2G、3G、4G映射target 301~305,當前預留95個。網絡模式分配代碼如下:


由上述網絡模式分配代碼可知,采用300表示網絡模式這一類。301表示未知的聯網方式,302表示無線,303表示2G網絡,304表示3G網絡,305表示4G網絡。
操作系統的數值型標識分配:操作系統區域分配100數量target,范圍涵蓋:[501~600)。分別將未知、IOS、Android、WindowsPhone、Symbian、Java、S40asha、Webwx、Blackberry和Windows類型映射target id 501~510,當前預留90個。

由上述操作系統分配的代碼可知,采用500表示操作系統這一類,采用501~510分別表示未知、IOS、Android、WindowsPhone、Symbian、Java、S40asha、Webwx、Blackberry和Windows操作系統。
時間范圍的數值型標識分配:時間映射共計分配1000數量target,范圍涵蓋:[100001~101000)。時間區域分兩層類型:第一層按星期制分七天,第二層將每一天以30分鐘粒度分為48個target id。在第一層,將日期分為星期日至星期六共七中,每天分配100數量target id。在第二層,每一天24小時時間按30分鐘粒度劃分為48個節點,節點id從0~47,當前預留52個。時間范圍分配的標識包括日期范圍標識和一天時間內時間范圍標識。
日期范圍標識分配代碼如下:


由上述日期分配代碼可知,采用100000表示時間范圍這一類,100001、100002、100003、100004、100005、100006和100007表示星期天、星期一、星期二、星期三、星期四、星期五和星期六。
一天時間內時間范圍標識分配如下代碼,以星期天內標識分配為例:

由上述星期天內的時間范圍標識分配可知,采用100100至100147分別表示星期天內的48個時間節點,同樣對于星期一采用100200至100247分別表示星期一內的48個時間節點,星期二采用100300至100347分別表示星期一內的48個時間節點,星期三采用100400至100447分別表示星期一內的48個時間節點,星期四采用100500至100547分別表示星期一內的48個時間節點;星期五采用100600至100647分別表示星期一內的48個時間節點;星期六采用100700至100747分別表示星期一內的48個時間節點。
地域的數值型標識分配:地域劃分分為兩層:中國國內地域劃分及國外地域劃分當前分配200萬數量target,涵蓋范圍:[2000001~4000000)。國內分配100萬,范圍:2000000~3000000;國外分配100萬,范圍:3000000~4000000。
國內地域:將34個直轄市、省級及自治區及未知映射如35個一級區域內,當前仍預留15個一級區域target;每個區域內按市級行政級別劃分target,對應target id分配規則:
[2000050+(省id-2000001)*50,2000050+(省id-2000001)*50+50)]
國外地域:列出一級類目-“洲”,可下拉二級類目-“國家”。洲級預留100個節點,國家級別預留1000個節點。中國地域部分分配代碼如下:

由上述地域分配標識可知,2000000表示地域這一類,20000001表示中國地區,3000000表示國外這一類。
流量標簽的數值型標識分配:流量標簽類型眾多,當前共有以下類型:教育、旅游、金融、汽車、房產、家具、服飾鞋包、奢侈品、餐飲美食、生活服務、商務服務、美容、電子數碼/軟件/互聯網、體育運動、醫療健康、母嬰、游 戲、文學、漫畫動漫、音樂、科學、軍事、新聞資訊、影視、娛樂、政法及其它,共計27項。流量標簽類型分配0x1 0000 0000數量target id,涵蓋范圍:[0x1 0000 0001 ~ 0x2 0000 0000)。在27個子項目中,每個項目X空間為:0x10000 0X01~ 0x10000 0XFF,每個子項均有256個target id。部分流量標簽分配代碼如下:

由上述流量標簽分配標識可知,0x100000000表示流量標簽這一類。
資源位的數值型標識分配:資源位置分配0x100000000數量target id,涵蓋范圍:[0x2 0000 0001 ~ 0x300000000)。系統當前支持四個資源位,擴展位置預留target id非常巨大。資源位的數值型標識分配以廣告位的數值型標識分配為例,代碼如下:


由上述資源位分配代碼可知,0x200000000表示資源位這一類。資源位是指資源位置。
需要說明的是,上述對索引空間的劃分、性別、年齡、、地域、操作系統、流量標簽、時間范圍、網絡模式的數值型標識的分配只是為了說明所列舉的例子并不局限于此分配,只需采用統一編碼方式對字符型定向條件信息進行編碼,均使用于本發明。
定向資源搜索服務器120還用于接收終端110發送的包含字符型定向條件信息的定向信息資源請求,并根據該定向信息資源請求將字符型定向條件信息轉換為數值型定向條件信息,以及將包含數值型定向條件信息的定向信息資源請求發送給索引服務器140。
此外,定向資源搜索服務器120還用于根據該定向信息資源請求從預先建立的字符型定向條件信息與數值型定向條件信息的映射關系,將字符型定向條件信息轉換為數值型定向條件信息。
具體地,接收的字符型定向條件信息可包括資源人群、年齡、性別、地域、操作系統、流量標簽、時間范圍、資源位約束條件、網絡環境中一種或多種。將字符型定向條件信息轉換為對應的數值型定向條件信息。
例如,如下代碼:



信息資源服務器130用于實時發送信息資源給索引服務器140。
具體地,信息資源可為廣告資源、物品資源或新聞資源等。信息資源可實時更新,一些新的信息資源上線,一些舊的信息資源下線。上線是指信息資源 展示在網絡上,供查看。下線是指信息資源不在網絡上展示,無法查看。
索引服務器140用于接收實時發送的信息資源,并更新第一名單和第二名單,第一名單用于記錄上線的信息資源,第二名單用于記錄下線的信息資源。
索引服務器140還用于記載該信息資源,以及接收定向資源搜索服務器120發送的包含數值型定向條件信息的定向資源請求,并將該數值型定向條件信息拆分,獲取每類定向條件信息的目標標識,根據該目標標識搜索對應的資源位標識,將該資源位標識返回給定向資源搜索服務器120。此外,還可根據資源位標識從信息資源中查找對應的信息資源,并將該對應的信息資源返回給定向資源搜索服務器120。索引服務器140還用于存儲采用統一的編碼建立字符型定向條件信息與數值型定向條件信息的映射關系。
具體地,目標標識是根據每類定向條件信息所確定的數值型標識。例如年齡定向條件的目標標識為20至25歲對應的數值型標識,性別定向條件的目標標識女性對應的數值型標識,根據20至25歲對應的數值型標識及女性對應的數值型標識查找對應的資源位標識。
此外,還需要預先建立目標標識與資源位標識之間的映射關系,根據目標標識查找到對應的資源位標識。資源位標識對應相應的信息資源。
此外,索引服務器140可包括主索引服務器142和從索引服務器144。
主索引服務器142用于接收信息資源服務器130發送的實時發送的信息資源,并更新第一名單和第二名單,第一名單用于記錄上線的信息資源,第二名單用于記錄下線的信息資源,以及將信息資源發送給從索引服務器144。
從索引服務器144用于接收主索引服務器142發送的信息資源,并記載該信息資源,以及接收定向資源搜索服務器120發送的包含數值型定向條件信息的定向資源請求,并將該數值型定向條件信息拆分,獲取每類定向條件信息的目標標識,根據該目標標識搜索對應的資源位標識,根據該資源位標識從信息資源中查找對應的信息資源,并將該對應的信息資源返回給定向資源搜索服務器120。定向資源搜索服務器120將對應的信息資源返回給終端110。
圖2為圖1中網絡信息資源的搜索系統的工作時序圖。如圖2所示,網絡信息資源的搜索系統的工作過程包括:
(1)終端110將包含字符型定向條件信息的定向信息資源請求發送給定向資源搜索服務器120;
(2)定向資源搜索服務器130將字符型定向條件信息轉換為數值型定向條件信息,并將包含數值型定向條件信息的定向信息資源請求發送給從索引服務器144;
(3)信息資源服務器130實時將信息資源發送給主索引服務器142;
(4)主索引服務器142記錄信息資源,并更新第一名單和第二名單,并將信息資源發送給從索引服務器144;
(5)從索引服務器144加載信息資源,對數值型定向條件信息進行拆分,獲取每類定向條件信息的目標標識,根據目標標識搜索對應的資源位標識,將資源位標識返回給資源搜索服務器。
上述網絡信息資源的搜索系統,具有以下優點:
(1)網絡帶寬消耗低:通過將定向信息資源請求中的字符型定向條件信息轉換為數值型定向條件信息,在搜索過程中均采用數值型定向條件信息,定向內容大大減少,網絡傳輸消耗帶寬也減少;
(2)報文處理快速:對數值型定向條件信息進行處理,無論是封裝還是解析,均可快速處理;
(3)良好的可擴展性:增加和刪除定向信息只需更新對應數值型映射關系表,具有良好的擴展性;
(4)采用統一化索引可以處理異常定向條件與資源位映射關系,其容錯性較好;
(5)數值型信息處理速度高于字符型信息處理速度,從而大大提升了系統的吞吐量。
圖3為一個實施例中網絡信息資源的搜索方法的流程圖。如圖3所示,一種網絡信息資源的搜索方法,包括以下步驟:
步驟302,接收包含字符型定向條件信息的定向信息資源請求。
具體地,定向資源搜索服務器120接收終端110發送的包含字符型定向條 件信息的定向信息資源請求。
字符型定向條件信息可包括信息資源人群、年齡、性別、地域、操作系統、流量標簽、時間范圍、資源位約束條件、網絡模式中一種或多種。
信息資源人群可為小孩、青年人、中年人、老年人等不同群體。
年齡可為1至127歲。性別可為未知、男、女。
地域可包括中國國內地域及國外地域。操作系統可分為未知、IOS系統、Android、WindowsPhone、Symbian、Java、S40asha、Webwx、Blackberry和Widows等類型。
流量標簽類型可包括教育、旅游、金融、汽車、房產、家具、服飾鞋包、奢侈品、餐飲美食、生活服務、商務服務、美容、電子數碼/軟件/互聯網、體育運動、醫療健康、母嬰、游戲、文學、漫畫動漫、音樂、科學、軍事、新聞資訊、影視、娛樂、政法及其它等。
時間范圍是指信息資源上線的時間范圍。例如,可將時間區域分兩層類型:第一層類型按星期制分七天,第二層將每一天以30分鐘粒度分為48個區間范圍。
網絡模式可包括未知模式、WiFi無線、2G、3G、4G等。
資源位約束條件是指設定的限制搜索條件。可將年齡、性別、地域、操作系統、流量標簽、網絡模式和時間范圍等組合在一起采用與、或、非等邏輯運算形成搜索條件。例如可設定年齡為1至3歲且時間范圍在星期二。
步驟304,根據該定向信息資源請求將字符型定向條件信息轉換為數值型定向條件信息。
首先,預先采用統一的編碼建立字符型定向條件信息與數值型定向條件信息的映射關系。步驟304包括:根據該定向信息資源請求從預先建立的字符型定向條件信息與數值型定向條件信息的映射關系,將字符型定向條件信息轉換為數值型定向條件信息。
步驟306,將包含數值型定向條件信息的定向信息資源請求發送給索引服務器,以使該索引服務器將該數值型定向條件信息拆分,獲取每類定向條件信息的目標標識,根據該目標標識搜索對應的資源位標識。
具體地,目標標識是根據每類定向條件信息所確定的數值型標識。每類定向條件信息可得到對應的目標標識,根據每類定向條件的目標標識可確定對應的資源位標識,再根據資源位標識確定對應的信息資源。
例如年齡定向條件的目標標識為20至25歲對應的數值型標識,性別定向條件的目標標識女性對應的數值型標識,根據20至25歲對應的數值型標識及女性對應的數值型標識查找對應的資源位標識。
上述網絡信息資源的搜索方法,通過將定向信息資源請求中的字符型定向條件信息轉換為數值型定向條件信息,在搜索過程中均采用數值型定向條件信息,定向內容大大減少,網絡傳輸消耗帶寬也減少,對數值型定向條件信息進行處理,無論是封裝還是解析,均可快速處理,數值型信息處理速度高于字符型信息處理速度,從而大大提升了系統的吞吐量。
在一個實施例中,上述網絡信息資源的搜索方法還包括:在接收包含字符型定向條件信息的定向信息資源請求的步驟之前,預先采用統一的編碼建立字符型定向條件信息與數值型定向條件信息的映射關系。
圖4為一個實施例中預先采用統一的編碼建立字符型定向條件信息與數值型定向條件信息的映射關系的步驟的具體流程圖。如圖4所示,預先采用統一的編碼建立字符型定向條件信息與數值型定向條件信息的映射關系的步驟的具體流程圖包括:
步驟402,預先將字符型定向條件信息分類。
具體地,字符型定向條件信息分類包括信息資源人群、年齡、性別、地域、操作系統、流量標簽、時間范圍、資源位約束條件、網絡模式中一種或多種。
步驟404,采用統一的編碼為每類字符型定向條件信息分配對應的數值型標識范圍。
具體地,統一的編碼可為64bit(比特位)編碼規則或128bit等。本實施例中,采用64bit編碼建立字符型定向條件信息和數值型定向條件信息建立映射關系。該映射關系的映射規則如網絡信息資源的搜索系統中所描述,在此不再贅述。
為字符型定向條件信息資源分配對應的數值型標識,建立索引空間,以便 于索引。首先,每類定向條件信息資源分配對應的數值型標識范圍。
將定向條件信息中年齡、性別、地域、操作系統、時間范圍、廣告位約束條件、網絡模式映射在system_targeting范圍內,作為一大類,可擴容999999990個定向條件,且為system_targeting規定了lowerbound下限10和upperbound上限1000000000。資源位映射為wechat_ad_position范圍,共1000W(萬)數量,且為wechat_ad_position規定了lowerbound下限0x100000000和upperbound上限0x200000000,當前系統支撐不到100W,預留空間足夠。流量標簽映射為wechat_flow_class范圍,且為wechat_flow_class規定了lowerbound下限0x200000000和upperbound上限0x300000000,共1000W數量。禁止編碼段:0x100000000000~0xffffffffffffffff,可做預留段。
步驟406,為每類字符型定向條件信息中每條字符型定向條件信息在對應的數值型標識范圍內分配對應的一個數值型標識。
性別的數值型標識分配:性別領域分配8個target id(目標標識,即數值型標識),范圍涵蓋:[12,20)。將未知性別、男和女分別映射到target id12、13和14,當前預留5個。
年齡的數值型標識分配:年齡區域分配200數量target id,范圍涵蓋:[101~300)。分別將未知年齡、1~127歲分別映射target 101~228,當前預留73個。
網絡模式的數值型標識分配:網絡模式區域分配100數量target,范圍涵蓋:[301~400)。分別將未知模式、無線、2G、3G、4G映射target 301~305,當前預留95個。
操作系統的數值型標識分配:操作系統區域分配100數量target,范圍涵蓋:[501~600)。分別將未知、IOS、Android、WindowsPhone、Symbian、Java、S40asha、Webwx、Blackberry和Windows類型映射target id 501~510,當前預留90個。
時間范圍的數值型標識分配:時間映射共計分配1000數量target,范圍涵蓋:[100001~101000)。時間區域分兩層類型:第一層按星期制分七天,第二層將每一天以30分鐘粒度分為48個target id。在第一層,將日期分為星期日至星期六共七中,每天分配100數量target id。在第二層,每一天24小時時間按30分鐘粒度劃分為48個節點,節點id從0~47,當前預留52個。
地域的數值型標識分配:地域劃分分為兩層:中國國內地域劃分及國外地域劃分當前分配200萬數量target,涵蓋范圍:[2000001~4000000)。國內分配100萬,范圍:2000000~3000000;國外分配100萬,范圍:3000000~4000000。
國內地域:將34個直轄市、省級及自治區及未知映射如35個一級區域內,當前仍預留15個一級區域target;每個區域內按市級行政級別劃分target,對應target id分配規則:
[2000050+(省id-2000001)*50,2000050+(省id-2000001)*50+50)]
國外地域:列出一級類目-“洲”,可下拉二級類目-“國家”。洲級預留100個節點,國家級別預留1000個節點。
流量標簽的數值型標識分配:流量標簽類型眾多,當前共有以下類型:教育、旅游、金融、汽車、房產、家具、服飾鞋包、奢侈品、餐飲美食、生活服務、商務服務、美容、電子數碼/軟件/互聯網、體育運動、醫療健康、母嬰、游戲、文學、漫畫動漫、音樂、科學、軍事、新聞資訊、影視、娛樂、政法及其它,共計27項。流量標簽類型分配0x100000000數量target id,涵蓋范圍:[0x1 0000 0001~0x2 0000 0000)。在27個子項目中,每個項目X空間為:0x10000 0X01~0x10000 0XFF,每個子項均有256個target id。
資源位的數值型標識分配:資源位置分配0x100000000數量target id,涵蓋范圍:[0x2 0000 0001~0x300000000)。系統當前支持四個資源位,擴展位置預留target id非常巨大。描述不詳盡之處請參網絡信息資源的搜索系統描述。
上述通過采用統一化索引可以處理異常定向條件與資源位映射關系,其容錯性較好。
在一個實施例中,每類字符型定向條件信息分配的數值型標識范圍中數值型標識數量大于對應類字符型定向條件信息已分配的數值型標識數量。采用64位長度空間編碼,預留了大量空間,可用于擴展定向條件及未知定向信息,簡化了定向條件擴展工作,增加和刪除定向信息只需更新對應數值型映射關系表,具有良好的擴展性。
圖5為一個實施例中網絡信息資源的搜索裝置的結構框圖。如圖5所示, 一種網絡信息資源的搜索裝置,運行于定向資源搜索服務器上,包括接收模塊510、轉換模塊520、發送模塊530。其中:
接收模塊510用于接收包含字符型定向條件信息的定向信息資源請求。
具體地,定向資源搜索服務器120接收終端110發送的包含字符型定向條件信息的定向信息資源請求。
字符型定向條件信息可包括信息資源人群、年齡、性別、地域、操作系統、流量標簽、時間范圍、資源位約束條件、網絡模式中一種或多種。
信息資源人群可為小孩、青年人、中年人、老年人等不同群體。
年齡可為1至127歲。性別可為未知、男、女。
地域可包括中國國內地域及國外地域。操作系統可分為未知、IOS系統、Android、WindowsPhone、Symbian、Java、S40asha、Webwx、Blackberry和Widows等類型。
流量標簽類型可包括教育、旅游、金融、汽車、房產、家具、服飾鞋包、奢侈品、餐飲美食、生活服務、商務服務、美容、電子數碼/軟件/互聯網、體育運動、醫療健康、母嬰、游戲、文學、漫畫動漫、音樂、科學、軍事、新聞資訊、影視、娛樂、政法及其它等。
時間范圍是指信息資源上線的時間范圍。例如,可將時間區域分兩層類型:第一層類型按星期制分七天,第二層將每一天以30分鐘粒度分為48個區間范圍。
網絡模式可包括未知模式、WiFi無線、2G、3G、4G等。
資源位約束條件是指設定的限制搜索條件。可將年齡、性別、地域、操作系統、流量標簽、網絡模式和時間范圍等組合在一起采用與、或、非等邏輯運算形成搜索條件。例如可設定年齡為1至3歲且時間范圍在星期二。
轉換模塊520用于根據該定向信息資源請求將字符型定向條件信息轉換為數值型定向條件信息。
首先,預先采用統一的編碼建立字符型定向條件信息與數值型定向條件信息的映射關系。步驟304包括:根據該定向信息資源請求從預先建立的字符型定向條件信息與數值型定向條件信息的映射關系,將字符型定向條件信息轉換 為數值型定向條件信息。
發送模塊530用于將包含數值型定向條件信息的定向信息資源請求發送給索引服務器,以使該索引服務器將該數值型定向條件信息拆分,獲取每類定向條件信息的目標標識,根據該目標標識搜索對應的資源位標識。
具體地,目標標識是根據每類定向條件信息所確定的數值型標識。每類定向條件信息可得到對應的目標標識,根據每類定向條件的目標標識可確定對應的資源位標識,再根據資源位標識確定對應的信息資源。
例如年齡定向條件的目標標識為20至25歲對應的數值型標識,性別定向條件的目標標識女性對應的數值型標識,根據20至25歲對應的數值型標識及女性對應的數值型標識查找對應的資源位標識。
上述網絡信息資源的搜索裝置,通過將定向信息資源請求中的字符型定向條件信息轉換為數值型定向條件信息,在搜索過程中均采用數值型定向條件信息,定向內容大大減少,網絡傳輸消耗帶寬也減少,對數值型定向條件信息進行處理,無論是封裝還是解析,均可快速處理,數值型信息處理速度高于字符型信息處理速度,從而大大提升了系統的吞吐量。
圖6為另一個實施例中網絡信息資源的搜索裝置的結構框圖。如圖6所示,一種網絡信息資源的搜索裝置,運行于定向資源搜索服務器上,除了包括接收模塊510、轉換模塊520和發送模塊530,還包括映射關系建立模塊540。其中:
映射關系建立模塊540用于在接收包含字符型定向條件信息的定向信息資源請求之前,預先采用統一的編碼建立字符型定向條件信息與數值型定向條件信息的映射關系。
轉換模塊520還用于根據該定向信息資源請求從預先建立的字符型定向條件信息與數值型定向條件信息的映射關系,將字符型定向條件信息轉換為數值型定向條件信息。
圖7為一個實施例中圖6中映射關系建立模塊的內部結構示意圖。映射關系建立模塊540包括分類單元542和分配單元544。其中:
分類單元542用于預先將字符型定向條件信息分類。
該定向條件信息分類包括信息資源人群、年齡、性別、地域、操作系統、流量標簽、時間范圍、資源位約束條件、網絡模式中一種或多種。
分配單元544用于采用統一的編碼為每類字符型定向條件信息分配對應的數值型標識范圍,以及為每類字符型定向條件信息中每條字符型定向條件信息在對應的數值型標識范圍內分配對應的一個數值型標識。該每類字符型定向條件信息分配的數值型標識范圍中數值型標識數量大于對應類字符型定向條件信息已分配的數值型標識數量。
采用統一化索引可以處理異常定向條件與資源位映射關系,其容錯性較好。采用64位長度空間編碼,預留了大量空間,可用于擴展定向條件及未知定向信息,簡化了定向條件擴展工作,增加和刪除定向信息只需更新對應數值型映射關系表,具有良好的擴展性。
本領域普通技術人員可以理解實現上述實施例方法中的全部或部分流程,是可以通過計算機程序來指令相關的硬件來完成,所述的程序可存儲于一非易失性計算機可讀取存儲介質中,該程序在執行時,可包括如上述各方法的實施例的流程。其中,所述的存儲介質可為磁碟、光盤、只讀存儲記憶體(Read-Only Memory,ROM)等。
以上所述實施例僅表達了本發明的幾種實施方式,其描述較為具體和詳細,但并不能因此而理解為對本發明專利范圍的限制。應當指出的是,對于本領域的普通技術人員來說,在不脫離本發明構思的前提下,還可以做出若干變形和改進,這些都屬于本發明的保護范圍。因此,本發明專利的保護范圍應以所附權利要求為準。

關 鍵 詞:
網絡 信息資源 搜索 方法 裝置 系統
  專利查詢網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
關于本文
本文標題:網絡信息資源的搜索方法、裝置和系統.pdf
鏈接地址:http://www.rgyfuv.icu/p-6353427.html
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服客服 - 聯系我們

[email protected] 2017-2018 zhuanlichaxun.net網站版權所有
經營許可證編號:粵ICP備17046363號-1 
 


收起
展開
山东11选5中奖结果走势图