• / 24
  • 下載費用:30 金幣  

一種建立輸入建議的數據處理方法和系統.pdf

摘要
申請專利號:

CN201410080568.9

申請日:

2014.03.06

公開號:

CN104899214A

公開日:

2015.09.09

當前法律狀態:

授權

有效性:

有權

法律詳情: 授權|||實質審查的生效IPC(主分類):G06F 17/30申請日:20140306|||公開
IPC分類號: G06F17/30 主分類號: G06F17/30
申請人: 阿里巴巴集團控股有限公司
發明人: 董凡; 張一楠
地址: 英屬開曼群島大開曼
優先權:
專利代理機構: 北京三友知識產權代理有限公司11127 代理人: 黨曉林
PDF完整版下載: PDF下載
法律狀態
申請(專利)號:

CN201410080568.9

授權公告號:

||||||

法律狀態公告日:

2018.05.22|||2015.10.07|||2015.09.09

法律狀態類型:

授權|||實質審查的生效|||公開

摘要

本申請提供了一種建立輸入建議的數據處理方法,包括:生成長度小于或等于第一長度的前綴作為當前前綴,第一長度作為當前長度;合并相同的前綴,并為合并后的前綴和對應的詞條生成倒排索引;判斷每一前綴指向詞條的個數是否大于預設值N,對詞條個數大于N的前綴截取詞條;對前綴長度等于當前長度且詞條個數為(N+1)的前綴,更新當前前綴和當前長度,并返回至合并前綴的步驟重新處理,直至當前前綴指向詞條的個數均小于或等于N個,將倒排索引作為建立的輸入建議索引進行輸出;本申請提供的方法,形成了根據詞條數目分布的可變前綴長度的倒排索引,避免建立的倒排索引產生大量幾乎不會被用到的索引項,建立的輸入建議索引的冗余程度得到了降低。

權利要求書

權利要求書
1.  一種建立輸入建議的數據處理方法,其特征在于,包括:
為每一詞條生成長度小于或等于第一長度的前綴,并將所述前綴作為當前前綴,將所述第一長度作為當前長度;
合并所有當前前綴中內容相同的前綴,為合并后的當前前綴和對應的詞條生成倒排索引;
判斷所述倒排索引中每一前綴指向詞條的個數是否大于預設值N,以及:
若所述倒排索引中存在指向詞條個數大于N的前綴,對倒排索引中詞條個數大于N的前綴截取詞條;根據倒排索引中前綴長度等于當前長度且詞條個數為(N+1)的前綴,更新當前前綴和當前長度,將更新后的當前前綴和當前長度返回至合并前綴的步驟重新進行處理;
若每一前綴指向詞條的個數均小于或等于N,則將所述倒排索引作為建立的輸入建議索引進行輸出。

2.  如權利要求1所述的一種建立輸入建議的數據處理方法,其特征在于,所述對倒排索引中詞條個數大于N的前綴截取詞條,包括:對倒排索引中詞條個數大于N的前綴,若前綴長度小于當前長度,截取前綴指向的前N個詞條,若前綴長度等于當前長度,截取前綴所指向的前(N+1)個詞條。

3.  如權利要求1所述的一種建立輸入建議的數據處理方法,其特征在于,所述根據倒排索引中前綴長度等于當前長度且詞條個數為(N+1)的前綴,更新當前前綴和當前長度,包括:根據詞條內容將所述前綴長度等于當前長度且詞條個數為(N+1)的前綴增加一個字節,形成新的前綴,將新增了前綴的所有前綴的作為更新后的當前前綴,將當前長度加1作為更新后的當前長度。

4.  如權利要求1所述的一種建立輸入建議的數據處理方法,其特征在于,所述第一長度的取值最小為3。

5.  如權利要求1所述的一種建立輸入建議的數據處理方法,其特征在于,所述N的取值最小為5。

6.  如權利要求1所述的一種建立輸入建議的數據處理方法,其特征在于,所述方法中為每一詞條生成長度小于或等于第一長度的前綴之前,還包括:對詞條進行預處理;所述對詞條進行預處理至少包括下述方式之一:
去除詞條中無意義的字符;所述無意義的字符包括空格、標點符號;
將詞條內容中的大小寫以及簡繁體進行統一。

7.  一種建立輸入建議的數據處理系統,其特征在于,包括:前綴生成單元、倒排索引生成單元、第一判斷單元、判斷截取單元、更新單元;其中,
所述前綴生成單元,用于為每一詞條生成長度小于或等于第一長度的前綴,將所述前綴作為當前前綴,將所述第一長度作為當前長度;
所述倒排索引生成單元,用于合并當前前綴中內容相同的前綴,為合并后的當前前綴及前綴對應的詞條生成倒排索引;
所述第一判斷單元,用于判斷所生成的倒排索引中每一前綴指向詞條的個數是否大于N,若詞條個數大于N,則進入判斷截取單元進行處理,若每一前綴指向詞條的個數均小于或等于N,則將所述倒排索引作為建立的輸入建議索引進行輸出;
所述判斷截取單元,用于對倒排索引中對于詞條個數大于N的前綴截取詞條;
所述更新單元,用于根據倒排索引中前綴長度等于當前長度且詞條個數為(N+1)的前綴,更新當前前綴和當前長度,將更新后的當前前綴和當前長度返回至倒排索引生成單元重新進行處理。

8.  如權利要求7所述的一種建立輸入建議的數據處理系統,其特征在于,所述判斷截取單元包括:長度判斷單元、截取單元;其中,
所述長度判斷單元,用于判斷當前前綴中每一個前綴的長度是否小于當前長度;
所述截取單元,用于對長度判斷單元的結果中前綴長度小于當前長度的前綴所指向的詞條截取前N個詞條,對長度判斷單元結果中前綴長度等于當前長度的前綴所指向的詞條截取前(N+1)個詞條。

9.  如權利要求7所述的一種建立輸入建議的數據處理系統,其特征在于,所述更新單元包括:前綴更新單元、當前長度更新單元;其中,
所述前綴更新單元,用于對長度判斷單元的結果中前綴長度等于當前長度的前綴,根據詞條內容將所述前綴內容增加一個字節,形成新的前綴,將新增了前綴的所有前綴的更新為當前前綴;
所述當前長度更新單元,用于將當前長度加1作為更新后的當前長度。

10.  如權利要求7所述的一種建立輸入建議的數據處理系統,其特征在于,所述倒排索引生成單元包括:合并單元、索引單元;其中,
所述合并單元,用于對所有當前前綴中內容相同的前綴進行合并;
所述索引單元,用于為合并后的當前前綴和前綴對應的詞條生成倒排索引。

11.  如權利要求7所述的一種建立輸入建議的數據處理系統,其特征在于,所述第一判斷單元包括:個數判斷單元、輸出單元;其中,
所述個數判斷單元,用于判斷倒排索引生成單元生成的倒排索引中當前前綴中每一前綴指向的詞條的個數是否大于N個;
所述輸出單元,用于輸出倒排索引,具體地,若個數判斷單元的判斷結果中,每一前綴指向詞條的個數均小于或等于N個,則輸出倒排索引生成單元中的倒排索引結果。

12.  如權利要求7所述的一種建立輸入建議的數據處理系統,其特征在于,所述建立輸入建議的數據處理系統,還包括:詞條預處理單元;所述詞條預處理單元,用于為每一詞條進行預處理。

13.  一種基于權利要求1~6中任意一項所述方法建立的索引提供輸入建議的方法,其特征在于,包括:
設置第二長度,判斷接收到的查詢串的長度是否大于第二長度,對長度小于或者等于第二長度的查詢串,將其對應的倒排索引作為輸入建議的結果;
對于長度大于第二長度的查詢串,根據第二長度對所述查詢串進行截斷;
判斷截斷后的查詢串對應的倒排索引中詞條數是否大于N,詞條數大于N的,更新第二長度,返回更新后的第二長度重新進行截斷,直至查詢串截斷后所對應的詞條數小于或等于N;
對于長度大于第二長度且查詢串截斷后詞條數小于或等于N的查詢串,過濾掉不匹配的詞條;
輸出查詢串的輸入建議結果。

14.  如權利要求13所述的一種根據建立的輸入建議索引提供輸入建議的方法,其特征在于,所述更新第二長度包括:將第二長度加1作為更新后的第二長度。

15.  如權利要求13所述的一種根據建立的輸入建議索引提供輸入建議的方法,其特征在于,所述過濾掉不匹配的詞條,具體包括:將截斷的查詢串對應的所有詞條和查詢串從第一個字符開始進行一一比對,將詞條中前x個字符與查詢串不完全相同的詞條過濾掉;所述x表示查詢串的長度。

16.  如權利要求15所述的一種根據建立的輸入建議索引提供輸入建議的方法,其特征在于,所述將截斷的查詢串查找到的倒排索引中的所有詞條和查詢串進行一一比對,包括:在進行比對的過程中,當查詢串與詞條的字符不是相同的語言時,將查詢串和詞條中的內容都轉換為拼音后再進行比對。

17.  如權利要求13所述的一種根據建立的輸入建議索引提供輸入建議的方法,其特征在于,所述輸出查詢串的輸入建議結果,包括:對于查詢串長度小于第二長度的,直接輸出對應的詞條作為查詢串的輸入建議結果;對于截斷后查詢不到相同的索引的,返回空值作為 查詢串的輸入建議結果;對于截斷后進行查詢的索引,將過濾掉不匹配的詞條的結果作為查詢串的輸入建議結果。

18.  如權利要求13所述的一種根據建立的輸入建議索引提供輸入建議的方法,其特征在于,所述設置第二長度包括:設置第二長度的值等于第一長度的值。

19.  一種基于權利要求7~12中任意一項所述系統建立的索引提供輸入建議的系統,其特征在于,包括:長度查詢單元、查詢串截斷單元、判斷更新單元、過濾單元、建議輸出單元;其中,
所述長度查詢單元,用于設置第二長度,查詢接收到的查詢串的長度是否大于第二長度,對查詢串的長度小于或者等于第二長度的,將其對應的倒排索引作為輸入建議的結果;
所述查詢串截斷單元,用于對于長度大于第二長度的查詢串,根據第二長度對所述查詢串進行截斷;
所述判斷更新單元,用于判斷截斷后的查詢串對應的倒排索引中詞條數是否大于N,詞條數大于N的,更新第二長度值并返回至查詢串截斷單元重新進行截斷,直至查詢串截斷后詞條數小于或等于N;
所述過濾單元,用于對長度大于第二長度且查詢串截斷后詞條數小于或等于N的查詢串,過濾掉不匹配的詞條;
所述建議輸出單元,用于輸出查詢串的輸入建議結果。

20.  如權利要求19所述的一種根據建立的輸入建議索引提供輸入建議的系統,其特征在于,所述判斷更新單元,包括:詞條數判斷單元、第二長度更新單元、返回單元;其中,
所述詞條數判斷單元,用于判斷所述查詢串截斷單元截斷后的查詢串對應的倒排索引中詞條數是否大于N;
所述第二長度更新單元,用于將第二長度加1作為更新后的第二長度;
所述返回單元,用于將所述詞條數判斷單元中判斷結果為詞條數大于N的查詢串和所述第二長度更新單元更新后的第二長度,返回至查詢串截斷單元。

21.  如權利要求19所述的一種根據建立的輸入建議索引提供輸入建議的系統,其特征在于,所述過濾單元,包括:識別轉換單元、比對篩選單元;其中,
所述識別轉換單元,用于識別查詢串與詞條的內容是否屬于同一種語言,若不是,轉換查詢串或詞條的語言,使兩者的語言相同;
所述比對篩選單元,用于將截斷的查詢串對應的所有詞條和查詢串的內容從第一個字符開始進行一一比對,剔除不匹配的詞條。

說明書

說明書一種建立輸入建議的數據處理方法和系統
技術領域
本發明涉及搜索領域,尤其涉及一種建立輸入建議的數據處理方法和系統。
背景技術
搜索引擎是用于對互聯網上的信息資源進行搜集整理,然后為用戶提供查詢的系統,它包括信息搜集、信息整理和用戶查詢。通常,用戶在搜索引擎中輸入關鍵詞進行檢索,搜索引擎從索引數據庫中找到匹配該關鍵詞的內容反饋給用戶。
目前,許多搜索引擎提供與用戶原始搜索查詢相關的一系列建議的搜索查詢。所述一系列建議的搜索查詢又稱為輸入建議,是指在輸入框輸入的過程中,根據當前的部分輸入,提示建議的完整的輸入字符串。例如,搜索引擎可以包括接收文本輸入的查詢輸入區域,搜索服務提供針對該文本輸入的搜索查詢建議,用戶可以選擇一個搜索查詢建議作為搜索查詢詞。輸入建議,主要用于在用戶輸入的過程中根據已有的部分輸入,推薦用戶可能輸入的完整文本,輔助啟發用戶快速完成文本輸入。例如,用戶的原始搜索查詢是“中”,搜索引擎可以建議與之相關的搜索查詢為“中國”、“中心”、以及“中醫”等。
目前提供輸入建議的方法主要包括:生成輸入建議線下索引和提供線上輸入建議兩個部分。所述生成輸入建議線下索引部分,可以稱為建立輸入建議,可以包括:為全部推薦的詞條列舉出所有前綴;對于前綴相同的不同詞條進行合并,并為合并了前綴的推薦詞條生成倒排索引;對每一個前綴的倒排索引根據具體業務需要進行排序,然后截取最重要的前N個詞條作為該前綴的輸入建議,生成前綴索引。所述提供線上輸入建議可以包括:根據用戶在文本框中的當前輸入查找所述前綴索引,根據所述前綴索引返回索引記錄,所述索引記錄即為提供的輸入建議。
在實現本申請過程中,發明人發現現有的建立輸入建議的技術中至少存在如下問題:
由于推薦詞條數據較多,而每一個推薦詞條的完整列出的前綴數目也很多,因此全部推薦詞條所列舉出的所有前綴的數量非常龐大,而根據上述數量非常龐大的所有前綴所建立的倒排索引中,有大量的索引項幾乎不會被用到,例如一些前綴長度較長的索引項,如果較短前綴所指向的詞條較少,建立的索引中完全可以包括所述較長前綴所指向的詞條,那么該較長前綴的索引項就不會被用到。上述說明可以看出,該方法建立的輸入建議索引中存在冗余。
發明內容
本發明的目的在于提供一種提供輸入建議的方法和系統,以實現降低建立的輸入建議索引的冗余程度。
一種建立輸入建議的數據處理方法,包括:
為每一詞條生成長度小于或等于第一長度的前綴,并將所述前綴作為當前前綴,將所述第一長度作為當前長度;
合并所有當前前綴中內容相同的前綴,為合并后的當前前綴和對應的詞條生成倒排索引;
判斷所述倒排索引中每一前綴指向詞條的個數是否大于預設值N,以及:
若所述倒排索引中存在指向詞條個數大于N的前綴,對倒排索引中詞條個數大于N的前綴截取詞條;根據倒排索引中前綴長度等于當前長度且詞條個數為(N+1)的前綴,更新當前前綴和當前長度,將更新后的當前前綴和當前長度返回至合并前綴的步驟重新進行處理;
若每一前綴指向詞條的個數均小于或等于N,則將所述倒排索引作為建立的輸入建議索引進行輸出。
優選方案中,所述對倒排索引中詞條個數大于N的前綴截取詞條,包括:對倒排索引中詞條個數大于N的前綴,若前綴長度小于當前長度,截取前綴指向的前N個詞條,若前綴長度等于當前長度,截取前綴所指向的前(N+1)個詞條。
優選方案中,所述根據倒排索引中前綴長度等于當前長度且詞條個數為(N+1)的前綴,更新當前前綴和當前長度,包括:根據詞條內容將所述前綴長度等于當前長度且詞條個數為(N+1)的前綴增加一個字節,形成新的前綴,將新增了前綴的所有前綴的作為更新后的當前前綴,將當前長度加1作為更新后的當前長度。
優選方案中,所述第一長度的取值最小為3。
優選方案中,所述N的取值最小為5。
優選方案中,所述方法中為每一詞條生成長度小于或等于第一長度的前綴之前,還包括:對詞條進行預處理;所述對詞條進行預處理至少包括下述方式之一:
去除詞條中無意義的字符;所述無意義的字符包括空格、標點符號;
將詞條內容中的大小寫以及簡繁體進行統一。
一種建立輸入建議的數據處理系統,包括:前綴生成單元、倒排索引生成單元、第一判斷單元、判斷截取單元、更新單元;其中,
所述前綴生成單元,用于為每一詞條生成長度小于或等于第一長度的前綴,將所述前綴 作為當前前綴,將所述第一長度作為當前長度;
所述倒排索引生成單元,用于合并當前前綴中內容相同的前綴,為合并后的當前前綴及前綴對應的詞條生成倒排索引;
所述第一判斷單元,用于判斷所生成的倒排索引中每一前綴指向詞條的個數是否大于N,若詞條個數大于N,則進入判斷截取單元進行處理,若每一前綴指向詞條的個數均小于或等于N,則將所述倒排索引作為建立的輸入建議索引進行輸出;
所述判斷截取單元,用于對倒排索引中對于詞條個數大于N的前綴截取詞條;
所述更新單元,用于根據倒排索引中前綴長度等于當前長度且詞條個數為(N+1)的前綴,更新當前前綴和當前長度,將更新后的當前前綴和當前長度返回至倒排索引生成單元重新進行處理。
優選方案中,所述判斷截取單元包括:長度判斷單元、截取單元;其中,
所述長度判斷單元,用于判斷當前前綴中每一個前綴的長度是否小于當前長度;
所述截取單元,用于對長度判斷單元的結果中前綴長度小于當前長度的前綴所指向的詞條截取前N個詞條,對長度判斷單元結果中前綴長度等于當前長度的前綴所指向的詞條截取前(N+1)個詞條。
優選方案中,所述更新單元包括:前綴更新單元、當前長度更新單元;其中,
所述前綴更新單元,用于對長度判斷單元的結果中前綴長度等于當前長度的前綴,根據詞條內容將所述前綴內容增加一個字節,形成新的前綴,將新增了前綴的所有前綴的更新為當前前綴;
所述當前長度更新單元,用于將當前長度加1作為更新后的當前長度。
優選方案中,所述倒排索引生成單元包括:合并單元、索引單元;其中,
所述合并單元,用于對所有當前前綴中內容相同的前綴進行合并;
所述索引單元,用于為合并后的當前前綴和前綴對應的詞條生成倒排索引。
優選方案中,所述第一判斷單元包括:個數判斷單元、輸出單元;其中,
所述個數判斷單元,用于判斷倒排索引生成單元生成的倒排索引中當前前綴中每一前綴指向的詞條的個數是否大于N個;
所述輸出單元,用于輸出倒排索引,具體地,若個數判斷單元的判斷結果中,每一前綴指向詞條的個數均小于或等于N個,則輸出倒排索引生成單元中的倒排索引結果。
優選方案中,所述建立輸入建議的數據處理系統,還包括:詞條預處理單元;所述詞條預處理單元,用于為每一詞條進行預處理。
一種基于所述建立輸入建議的數據處理方法建立的索引提供輸入建議的方法,包括:
設置第二長度,判斷接收到的查詢串的長度是否大于第二長度,對長度小于或者等于第二長度的查詢串,將其對應的倒排索引作為輸入建議的結果;
對于長度大于第二長度的查詢串,根據第二長度對所述查詢串進行截斷;
判斷截斷后的查詢串對應的倒排索引中詞條數是否大于N,詞條數大于N的,更新第二長度,返回更新后的第二長度重新進行截斷,直至查詢串截斷后所對應的詞條數小于或等于N;
對于長度大于第二長度且查詢串截斷后詞條數小于或等于N的查詢串,過濾掉不匹配的詞條;
輸出查詢串的輸入建議結果。
優選方案中,所述更新第二長度包括:將第二長度加1作為更新后的第二長度。
優選方案中,所述過濾掉不匹配的詞條,具體包括:將截斷的查詢串對應的所有詞條和查詢串從第一個字符開始進行一一比對,將詞條中前x個字符與查詢串不完全相同的詞條過濾掉;所述x表示查詢串的長度。
優選方案中,所述將截斷的查詢串查找到的倒排索引中的所有詞條和查詢串進行一一比對,包括:在進行比對的過程中,當查詢串與詞條的字符不是相同的語言時,將查詢串和詞條中的內容都轉換為拼音后再進行比對。
優選方案中,所述輸出查詢串的輸入建議結果,包括:對于查詢串長度小于第二長度的,直接輸出對應的詞條作為查詢串的輸入建議結果;對于截斷后查詢不到相同的索引的,返回空值作為查詢串的輸入建議結果;對于截斷后進行查詢的索引,將過濾掉不匹配的詞條的結果作為查詢串的輸入建議結果。
優選方案中,所述設置第二長度包括:設置第二長度的值等于第一長度的值。
一種基于所述建立輸入建議的數據處理系統建立的索引提供輸入建議的系統,包括:長度查詢單元、查詢串截斷單元、判斷更新單元、過濾單元、建議輸出單元;其中,
所述長度查詢單元,用于設置第二長度,查詢接收到的查詢串的長度是否大于第二長度,對查詢串的長度小于或者等于第二長度的,將其對應的倒排索引作為輸入建議的結果;
所述查詢串截斷單元,用于對于長度大于第二長度的查詢串,根據第二長度對所述查詢串進行截斷;
所述判斷更新單元,用于判斷截斷后的查詢串對應的倒排索引中詞條數是否大于N,詞條數大于N的,更新第二長度值并返回至查詢串截斷單元重新進行截斷,直至查詢串截斷后詞條數小于或等于N;
所述過濾單元,用于對長度大于第二長度且查詢串截斷后詞條數小于或等于N的查詢串, 過濾掉不匹配的詞條;
所述建議輸出單元,用于輸出查詢串的輸入建議結果。
優選方案中,所述判斷更新單元,包括:詞條數判斷單元、第二長度更新單元、返回單元;其中,
所述詞條數判斷單元,用于判斷所述查詢串截斷單元截斷后的查詢串對應的倒排索引中詞條數是否大于N;
所述第二長度更新單元,用于將第二長度加1作為更新后的第二長度;
所述返回單元,用于將所述詞條數判斷單元中判斷結果為詞條數大于N的查詢串和所述第二長度更新單元更新后的第二長度,返回至查詢串截斷單元。
優選方案中,所述過濾單元,包括:識別轉換單元、比對篩選單元;其中,
所述識別轉換單元,用于識別查詢串與詞條的內容是否屬于同一種語言,若不是,轉換查詢串或詞條的語言,使兩者的語言相同;
所述比對篩選單元,用于將截斷的查詢串對應的所有詞條和查詢串的內容從第一個字符開始進行一一比對,剔除不匹配的詞條。
本申請建立輸入建議索引的數據處理方法和系統,建立前綴與詞條的對應關系后,對同一個前綴所指向的詞條的個數進行判斷,當同一個前綴相關的詞條數目太多時,就對該前綴增加前綴長度,使前綴得到進一步細化,再重新建立細化后的前綴與詞條的關系。這樣,隨著前綴長度的增加,前綴指向的詞條數就減少,形成了一個根據詞條數目分布的可變前綴長度的倒排索引,從而避免建立的倒排索引中產生大量幾乎不會被用到的索引項,這樣建立的輸入建議索引的冗余程度就得到了降低。
本申請根據建立的輸入建議索引提供輸入建議的方法和系統,當接收到的查詢串長度大于或等于第二長度時,根據第二長度對查詢串進行截斷,截斷后的查詢串對應的詞條數目大于N時,臨時提高第二長度的值對查詢串重新進行截斷,保證查詢到的詞條數目小于或等于N;另外,在查詢串原來長度大于第二長度且查詢到的詞條數小于或等于N的,可以通過比對的方法過濾掉與查詢串不匹配的詞條,保證詞條與接收到的查詢串相對應。上述方法采用動態增加前綴長度的方式,可以保證查詢到的詞條數目不超過N個,這樣在需要進行比對時,可以減少比對的計算量,提高提供輸入建議的效率。
此外,根據建立的輸入建議索引提供輸入建議的方法和系統,在比對過程中,如果將查詢串和詞條中的內容都轉換為utf-8編碼后再進行比對,還可以解決中文和拼音混和輸入的問題。
附圖說明
為了更清楚地說明本申請實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本申請中記載的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動性的前提下,還可以根據這些附圖獲得其他的附圖。
圖1是本申請建立輸入建議索引的數據處理方法實施例的流程圖;
圖2是本申請建立輸入建議索引的數據處理系統實施例的組成結構圖;
圖3是本申請數據處理系統實施例中倒排索引生成單元的組成結構圖;
圖4是本申請數據處理系統實施例中第一判斷單元的組成結構圖;
圖5是本申請數據處理系統實施例中判斷截取單元的組成結構圖;
圖6是本申請數據處理系統實施例中更新單元的組成結構圖;
圖7是本申請根據建立的輸入建議索引提供輸入建議的方法實施例的流程圖;
圖8是本申請根據建立的輸入建議索引提供輸入建議的系統實施例的組成結構圖;
圖9是本申請提供輸入建議的系統實施例中判斷更新單元的組成結構圖;
圖10是本申請提供輸入建議的系統實施例中過濾單元的組成結構圖。
具體實施方式
為了使本技術領域的人員更好地理解本申請中的技術方案,下面將結合本申請實施例中的附圖,對本申請實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本申請一部分實施例,而不是全部的實施例。基于本申請中的實施例,本領域普通技術人員在沒有作出創造性勞動前提下所獲得的所有其他實施例,都應當屬于本發明保護的范圍。
圖1是本申請中建立輸入建議索引的數據處理方法的流程圖。如圖1所示,本申請建立輸入建議索引的數據處理方法包括:
S101:為每一詞條生成長度小于或等于第一長度的前綴,將所述前綴作為當前前綴,將所述第一長度作為當前長度。
首先為每一詞條生成長度小于或等于第一長度的前綴。中文單字的utf-8編碼(8-bit Unicode Transformation Format,也稱為萬國碼)通常占用3個字節的長度,例如“中”的utf-8編碼為“\xe4\xb8\xad”;所以所述第一長度一般至少取3。通常一個英文字母占用一個字節的長度,因此,第一長度為3時,每一個詞條的拼音只生成包含三個字符及三個以下字符的前綴。將所述長度小于或等于第一長度的前綴作為當前前綴,將所述第一長度作為當前長度。
以“中國石化”這一詞條為例,長度小于或等于3的前綴可以包括:中文單字“中”和拼音“zhongguoshihua”中的“Z”、“ZH”、“ZHO”。
S102:合并所有當前前綴中內容相同的前綴,為合并后的當前前綴和對應的詞條生成倒排索引。
對于不同的詞條,可能會出現相同的前綴,為了生成的倒排索引中前綴具有唯一性,需要將內容相同的當前前綴進行合并,并為合并后的當前前綴生成倒排索引,所述倒排索引中包括前綴和前綴指向的詞條。
例如,對于兩個詞條“中國石化”和“中關村”,當前長度為3時,詞條“中國石化”的前綴與前綴指向的詞條的關系如表1所示,詞條“中關村”的前綴與前綴指向的詞條的關系如表2所示。
表1詞條“中國石化”的前綴與前綴指向的詞條的關系
前綴前綴指向的詞條中國石化Z中國石化ZH中國石化ZHO中國石化
表2詞條“中關村”的前綴與前綴指向的詞條的關系
前綴前綴指向的詞條中關村Z中關村ZH中關村ZHO中關村
將表1和表2中相同的前綴進行合并,并生成倒排索引,表3所示為合并前綴后生成的倒排索引中前綴與前綴指向的詞條的關系。
表3合并前綴后生成的倒排索引中前綴與前綴指向的詞條的關系
前綴前綴指向的詞條中國石化、中關村Z中國石化、中關村ZH中國石化、中關村ZHO中國石化、中關村
S103:判斷所述倒排索引中每一前綴指向詞條的個數是否大于預設值N,若詞條個數大于N,則進入截取詞條的步驟進行處理,若每一前綴指向詞條的個數均小于或等于N,則將所述倒排索引作為建立的輸入建議索引進行輸出。
該步驟中,N為預設值;所述N的值可以根據需要進行選取,一般N至少為5。若一個前綴對應的詞條數大于N個,表示該前綴對應的可以提供的建議過多,其中部分詞條可能不能被顯示出來,這就需要對這些前綴及其指向的詞條作進一步處理。若所述倒排索引中每一個前綴對應的詞條數均小于或等于N個,則表示每一個前綴對應的詞條都能夠作為輸入建議,不會產生冗余,此時所述倒排索引即為建立好的輸入建議索引。
例如,表4所示的是生成的倒排列索引中前綴與前綴指向的詞條之間的關系。若N取值為5,則表4中,前綴“Z”和“ZH”指向的詞條分別有6個,那么這兩個前綴及其指向的詞條需要進行進一步處理。而其余的前綴所指向的詞條均小于5個,不需要進行進一步處理。
表4倒排列索引中前綴與前綴指向的詞條之間的關系
前綴前綴指向的詞條中國石化、中關村、中國石油、中國人站長張揚Z中國石化、中關村、中國石油、中國人、站長、張揚ZH中國石化、中關村、中國石油、中國人、站長、張揚ZHO中國石化、中關村、中國石油、中國人ZHA站長、張揚
S104:對倒排索引中詞條個數大于N的前綴截取詞條。
對S103中所指向的詞條數目大于N個的前綴截取詞條,具體包括:對于前綴長度小于當前長度的前綴,截取其所指向的詞條中的前N個詞條,對于前綴長度等于當前長度的前綴,截取其所指向的詞條中的前(N+1)個詞條。
例如,表5所示為當前長度為3時生成的倒排索引中前綴與前綴指向的詞條之間的關系。按照上述截取原則截取后,結果如表6所示。
表5當前長度為3時生成的倒排索引中前綴與前綴指向的詞條之間的關系
前綴前綴指向詞條中國石化,中國人,中國,中關村,中國銀行,中國聯通,中通快遞,中國電信Z中國石化,中國人,中國,中關村,中國銀行,中國聯通,中通快遞,中國電信
ZH中國石化,中國人,中國,中關村,中國銀行,中國聯通,中通快遞,中國電信ZHO中國石化,中國人,中國,中關村,中國銀行,中國聯通,中通快遞,中國電信
表6截取后的前綴與前綴指向的詞條之間的關系
前綴前綴指向詞條中國石化,中國人,中國,中關村,中國銀行,中國聯通Z中國石化,中國人,中國,中關村,中國銀行ZH中國石化,中國人,中國,中關村,中國銀行ZHO中國石化,中國人,中國,中關村,中國銀行,中國聯通
S105:根據倒排索引中前綴長度等于當前長度且詞條個數為(N+1)的前綴,更新當前前綴和當前長度,將更新后的當前前綴和當前長度返回至合并前綴的步驟重新進行處理。
對倒排索引中前綴長度等于當前長度的前綴且詞條個數為(N+1)的,根據詞條內容將前綴內容增加一個字節,新增的字節可以是中文前綴所對應的每一個詞條中與前綴內容相鄰的下一個字節的中文utf-8編碼,也可以是拼音前綴對應每一個詞條中與前綴相鄰的下一個拼音字母;所述新增了字節的前綴形成新的前綴;將包括新的前綴的所有前綴作為更新后的當前前綴,將當前長度值加1作為更新后的長度值,將更新后的當前前綴和當前長度返回至合并前綴的步驟重新進行處理。
例如表6中的前綴及其指向的詞條,前綴“中”和“ZHO”的前綴長度等于3,且這兩個前綴指向的詞條個數大于5,那么,根據這兩個前綴指向的詞條將前綴的內容增加一個字節。增加的字節可以是中文前綴對應每一個詞條中與前綴相鄰的下一個中文utf-8編碼,例如中文前綴“中”對應的每一個詞條中與前綴“中”相鄰的下一個字節的中文utf-8編碼,包括:中文“國”、“關”、“通”的utf-8編碼中的第一個字節,“國”的utf-8編碼為\xe5\x9b\xbd,“關”的utf-8編碼為\xe5\x85\xb3,“通”的utf-8編碼為\xe9\x80\x9a,所以,增加的字節可以是“\xe5”或“\xe9”;增加的字節還可以是拼音前綴對應每一個詞條中與前綴相鄰的下一個拼音字母,例如與拼音前綴“ZHO”相鄰的拼音字母“N”。因此,對于表6中的前綴,新的前綴可以包括:“中\xe5”、“中\xe9”、“ZHON”。將包括了新的前綴的所有前綴作為更新后的當前前綴,并將當前長度值加1作為更新后的當前長度。將更新后的當前前綴和當前長度返回至S102-S105重新進行處理,直至滿足S103中所述當前前綴均滿足指向的詞條數小于或等于N。表7所示為更新了當前前綴后建立的倒排索引中,當前前綴及其指向的詞條之間的關系。
表7新增了前綴后的當前前綴及其指向的詞條之間的關系
前綴前綴指向詞條中國石化,中國人,中國,中關村,中國銀行,中國聯通中\xe5中國石化,中國人,中國,中關村,中國銀行,中國聯通,中國電信中\xe9中通快遞Z中國石化,中國人,中國,中關村,中國銀行ZH中國石化,中國人,中國,中關村,中國銀行ZHO中國石化,中國人,中國,中關村,中國銀行,中國聯通ZHON中國石化,中國人,中國,中關村,中國銀行,中國聯通,中通快遞,中國電信
上述提供的建立輸入建議索引的數據處理方法,其步驟S101~S105可以簡單地用代碼式表達方法表示為:

上述提供的建立輸入建議索引的數據處理方法,建立前綴與詞條的對應關系后,對同一個前綴所指向的詞條的個數進行判斷,當同一個前綴相關的詞條數目太多時,就對該前綴增加前綴長度,使前綴得到進一步細化,再重新建立細化后的前綴與詞條的關系。這樣,隨著前綴長度的增加,前綴指向的詞條數就減少,形成了一個根據詞條數目分布的可變前綴長度 的倒排索引,從而避免建立的輸入建議索引產生大量幾乎不會被用到的索引項,這樣建立的輸入建議索引的冗余程度就得到了降低。
圖2是本申請建立輸入建議索引的數據處理系統的組成結構圖。如圖2所示,申請建立輸入建議索引的數據處理系統包括:前綴生成單元21、倒排索引生成單元22、第一判斷單元23、判斷截取單元24、更新單元25。其中,
所述前綴生成單元21,用于為每一詞條生成長度小于或等于第一長度的前綴,并將所述前綴作為當前前綴,將所述第一長度作為當前長度。
所述倒排索引生成單元22,用于合并當前前綴中內容相同的前綴,并為合并后的當前前綴及前綴對應的詞條生成倒排索引。
所述第一判斷單元23,用于判斷倒排索引生成單元22生成的倒排索引中每一前綴指向的詞條的個數是否大于N個,若每一前綴指向詞條的個數均小于或等于N個,則將所述倒排索引作為建立的輸入建議索引進行輸出;若前綴指向詞條的個數大于N,則進入判斷截取單元24進行處理。
所述判斷截取單元24,用于對第一判斷單元23中詞條個數大于N的前綴截取詞條。
所述更新單元25,用于對倒排索引中前綴長度等于當前長度且詞條個數為(N+1)的前綴,更新當前前綴和當前長度,并將更新后的當前前綴和當前長度返回至合并前綴的步驟重新進行處理。
圖3是倒排索引生成單元的組成結構圖。如圖3所示,所述倒排索引生成單元22包括:合并單元221、索引單元222。其中,
所述合并單元221,用于對所有當前前綴中內容相同的前綴進行合并。
所述索引單元222,用于為合并后的當前前綴和前綴對應的詞條生成倒排索引。
圖4是第一判斷單元的組成結構圖。如圖4所示,所述第一判斷單元23包括:個數判斷單元231、輸出單元232。其中,
所述個數判斷單元231,用于判斷倒排索引生成單元22生成的倒排索引中每一前綴指向的詞條的個數是否大于N個。
所述輸出單元232,用于輸出倒排索引,具體地,若個數判斷單元231的判斷結果中,每一前綴指向詞條的個數均小于或等于N個,則輸出倒排索引生成單元22中的倒排索引結果。
圖5是判斷截取單元的組成結構圖。如圖5所示,所述判斷截取單元24包括:長度判斷單元241、截取單元242。其中,
所述長度判斷單元241,用于判斷每一個前綴的長度是否小于當前長度;
所述截取單元242,用于對長度判斷單元241的結果中前綴長度小于當前長度的前綴所指 向的詞條截取前N個詞條,對長度判斷單元241結果中前綴長度等于當前長度的前綴所指向的詞條截取前(N+1)個詞條。
圖6是更新單元的組成結構圖。如圖6所示,所述更新單元25包括:前綴更新單元251、當前長度更新單元252。其中,
所述前綴更新單元251,用于對長度等于當前長度且詞條個數為(N+1)的前綴,根據詞條內容將所述前綴內容增加一個字節,形成新的前綴,將包括了新的前綴的所有前綴的更新為當前前綴。
所述當前長度更新單元252,用于將當前長度加1作為更新后的當前長度。
上述提供的建立輸入建議索引的數據處理系統與建立輸入建議索引的數據處理方法相對應,可以實現數據處理方法中的各個步驟,所述數據處理系統建立的輸入建議索引能夠達到數據處理方法的實施效果。
下面介紹本申請建立輸入建議索引的數據處理方法的第二實施例。如圖1所示,本實施例與數據處理方法第一實施例的區別在于,所述建立輸入建議索引的數據處理方法還包括:為每一詞條進行預處理。具體可以包括:去除詞條中的空格、標點符號等無意義的字符,將詞條內容中的大小寫以及簡繁體進行統一,如將大小寫不同的字母統一轉換為大寫或者可以將簡體和繁體中文漢字統一轉換為簡體。例如可以將詞條“石油”轉換為“石油”;或可_以將詞條“中國石化”轉換為“中國石化”等。本實施例中的其他部分與數據處理方法第一實施例相同,不再詳細描述。
下面介紹建立輸入建議索引的數據處理系統的第二實施例。如圖2所示,與建立輸入建議索引的數據處理方法的第二實施例相對應,所述建立輸入建議索引的數據處理系統的第二實施例與輸入建議索引的數據處理系統的第一實施例的區別在于,所述建立輸入建議索引的數據處理系統還包括:詞條預處理單元26。所述詞條預處理單元26,用于為每一詞條進行預處理,包括:去除詞條中的空格、標點符號等無意義的詞,將詞條內容中的大小寫以及簡繁體進行統一,如將大小寫不同的字母統一轉換為大寫或者將簡體和繁體中文漢字統一轉換為簡體。本實施例中的其他部分與數據處理系統第一實施例相同,不再詳細描述。
上述建立輸入建議索引的數據處理方法的第二實施例,在建立輸入建議索引的數據處理方法第一實施例的基礎上增加了詞條預處理的步驟,能排除建立的輸入建議索引中出現的無意義的字符、同一詞條中的大小寫和簡繁體不統一。能夠為建立輸入建議索引的數據處理方法提供更準確的數據。
相應地,上述建立輸入建議索引的數據處理系統的第二實施例,在建立輸入建議索引的數據處理方法第一實施例的基礎上增加了詞條預處理單元,能夠實現數據處理方法的第二實 施例的數據處理過程,為建立輸入建議索引的數據處理方法提供更準確的數據。
圖7是本申請根據建立的輸入建議索引提供輸入建議的方法實施例的流程圖。如圖7所示,根據建立的輸入建議索引提供輸入建議的方法包括:
S701:設置第二長度,判斷接收到的查詢串的長度是否大于第二長度,對查詢串的長度小于或者等于第二長度的,將其對應的倒排索引作為輸入建議的結果。
將建立輸入建議索引的方法中的第一長度作為本方法的第二長度。當接收到的查詢串的長度小于或者等于所述第二長度時,則直接將其對應的倒排索引作為輸入建議的結果。若接收到的查詢串的長度大于所述第二長度,則進入下一步驟進行處理。
S702:對于長度大于第二長度的查詢串,根據第二長度對所述查詢串進行截斷。
對于長度大于第二長度的查詢串,該步驟根據第二長度對該查詢串進行截斷,具體地,截取所述查詢串前面的第二長度的內容。
S703:判斷截斷后的查詢串對應的倒排索引中詞條數是否大于N,詞條數大于N的,更新第二長度并返回重新進行截斷,直至查詢串截斷后詞條數小于或等于N。
對S702中截斷后的查詢串,根據倒排索引查找對應的詞條,判斷所述詞條的個數是否大于N,由于在建立倒排索引的過程中,對于需要進一步增加前綴字節的前綴,截取的詞條數為(N+1)個,所以詞條的個數大于N時,表示還可以增加前綴的長度,則將第二長度值加1作為更新后的第二長度值,并將所述詞條個數大于N的查詢串和第二長度返回至S702,根據更新后的第二長度值對查詢串重新進行截斷,截取所述查詢串的前面第二長度的內容,對重新截取后的查詢串根據倒排索引重新查詢對應的詞條,判斷重新查詢得到的詞條個數是否大于N,直至所有查詢到的詞條個數小于或等于N。
S704:對于長度大于第二長度且查詢串截斷后詞條數小于或等于N的查詢串,過濾掉不匹配的詞條。
對于長度大于第二長度且查詢串截斷后詞條數小于或等于N的查詢串,由于對所述查詢串采用截斷的方式查找對應的詞條,這就會導致部分詞條與接收到的查詢串的完整內容并不對應。那么需要將倒排索引中的詞條與查詢串的完整內容進行比對,過濾掉不匹配的詞條。具體地,將查詢串中的內容與每個詞條的內容從第一個字符開始進行一一比對,假設查詢串的長度為x,那么詞條中前x個字節與查詢串內容完全相同的,則認為是與查詢串對應的詞條,如不完全相同,則認為不是與查詢串對應的詞條,在該步驟被過濾掉。
例如,在建立輸入建議索引時,第一長度設為3,N值設為6,有一個前綴“abc”的對應詞條為“abcd,abce,abcf,abcp,abcea”這五個,那么不需要對前綴“abc”增加字節重新建立索引,建立的索引中包含“abc”→“abcd,abce,abcf,abcp,abcea”這一對應關 系。當接收到的查詢串為“abce”時,第二長度初始為3,N為6,需要截取查詢串“abce”中的前3個字節“abc”來進行查詢,得到對應的詞條為“abcd,abce,abcf,abcp,abcea”,滿足詞條個數小于6,但是,詞條中只有“abce,abcea”這兩個詞條是與查詢串“abce”對應的,其他三個詞條“abcd,abcf,abcp”與查詢串“abce”都不對應,就需要在該步驟將詞條“abcd,abcf,abcp”過濾掉。
需要說明的是,在進行比對的過程中,若查詢串與詞條的字符不屬于相同的語言,例如查詢串的字符為中文,而詞條的字符為字母,則可以將查詢串和詞條中的內容都轉換為拼音后再進行比對。
S705:輸出查詢串的輸入建議結果。
對于S701中查詢串長度小于第二長度的,直接輸出對應的詞條作為查詢串的輸入建議結果;對于S703中截斷后查詢不到相同的索引的,返回空值作為查詢串的輸入建議結果;對于S703中截斷后進行查詢的索引,經過S704過濾后,輸出S704過濾的結果作為查詢串的輸入建議結果。
上述根據建立的輸入建議索引提供輸入建議的方法,當接收到的查詢串長度大于或等于第二長度時,根據第二長度對查詢串進行截斷,截斷后的查詢串對應的詞條數目大于N時,臨時提高第二長度的值對查詢串重新進行截斷,保證查詢到的詞條數目小于或等于N;另外,在查詢串原來長度大于第二長度且查詢到的詞條數小于或等于N的,可以通過比對的方法過濾掉與查詢串不匹配的詞條,保證詞條與接收到的查詢串相對應。上述方法采用動態增加前綴長度的方式,可以保證查詢到的詞條數目不超過N個,這樣在需要進行比對時,可以減少比對的計算量,提高提供輸入建議的效率。
此外,在比對過程中,如果將查詢串和詞條中的內容都轉換為utf-8編碼后再進行比對,還可以解決中文和拼音混和輸入的問題。
圖8是本申請根據建立的輸入建議索引提供輸入建議的系統實施例的組成結構圖。如圖8所示,所述根據建立的輸入建議索引提供輸入建議的系統包括:長度查詢單元81、查詢串截斷單元82、判斷更新單元83、過濾單元84、建議輸出單元85。其中,
所述長度查詢單元81,用于設置第二長度,查詢接收到的查詢串的長度是否大于第二長度,對查詢串的長度小于或者等于第二長度的,將其對應的倒排索引作為輸入建議的結果。
所述查詢串截斷單元82,用于對于長度大于第二長度的查詢串,根據第二長度對所述查詢串進行截斷。
所述判斷更新單元83,用于判斷截斷后的查詢串對應的倒排索引中詞條數是否大于N,詞條數大于N的,更新第二長度并返回至查詢串截斷單元82重新進行截斷,直至查詢串截斷 后詞條數小于或等于N。
所述過濾單元84,用于對于長度大于第二長度且查詢串截斷后詞條數小于或等于N的查詢串,過濾掉不匹配的詞條。
所述建議輸出單元85,用于輸出查詢串的輸入建議結果。
圖9是判斷更新單元的組成結構圖。如圖9所示,所述判斷更新單元83,包括:詞條數判斷單元831、第二長度更新單元832、返回單元833。其中,
所述詞條數判斷單元831,用于判斷所述查詢串截斷單元82截斷后的查詢串對應的倒排索引中詞條數是否大于N;
所述第二長度更新單元832,將第二長度加1作為更新后的第二長度;
所述返回單元833,用于將所述詞條數判斷單元831中判斷結果為詞條數大于N的查詢串和所述第二長度更新單元832更新后的第二長度,返回至查詢串截斷單元82。
圖10是過濾單元的組成結構圖。如圖10所示,所述過濾單元84,包括:識別轉換單元841、比對篩選單元842。其中,
所述識別轉換單元841,用于識別查詢串與詞條的字符是否屬于同一種語言,若不是,轉換查詢串或詞條的語言,使兩者的語言相同。具體地可以將查詢串和詞條中的內容都轉換為拼音。
所述比對篩選單元842,用于將查詢串對應的倒排索引中的所有詞條和查詢串的內容進行一一比對,剔除不匹配的詞條。
上述根據建立的輸入建議索引提供輸入建議的系統,與根據建立的輸入建議索引提供輸入建議的方法相對應,可以實現方法實施例的過程,達到方法實施例的技術效果。
在20世紀90年代,對于一個技術的改進可以很明顯地區分是硬件上的改進(例如,對二極管、晶體管、開關等電路結構的改進)還是軟件上的改進(對于方法流程的改進)。然而,隨著技術的發展,當今的很多方法流程的改進已經可以視為硬件電路結構的直接改進。設計人員幾乎都通過將改進的方法流程編程到硬件電路中來得到相應的硬件電路結構。因此,不能說一個方法流程的改進就不能用硬件實體模塊來實現。例如,可編程邏輯器件(Programmable Logic Device,PLD)(例如現場可編程門陣列(Field Programmable Gate Array,FPGA))就是這樣一種集成電路,其邏輯功能由用戶對器件編程來確定。由設計人員自行編程來把一個數字系統“集成”在一片PLD上,而不需要請芯片制造廠商來設計和制作專用的集成電路芯片2。而且,如今,取代手工地制作集成電路芯片,這種編程也多半改用“邏輯編譯器(logic compiler)”軟件來實現,它與程序開發撰寫時所用的軟件編譯器相類似,而要編譯之前的原始代碼也得用特定的編程語言來撰寫,此稱之為硬件描述語言 (Hardware Description Language,HDL),而HDL也并非僅有一種,而是有許多種,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware Description Language)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(Ruby Hardware Description Language)等,目前最普遍使用的是VHDL(Very-High-Speed Integrated Circuit Hardware Description Language)與Verilog2。本領域技術人員也應該清楚,只需要將方法流程用上述幾種硬件描述語言稍作邏輯編程并編程到集成電路中,就可以很容易得到實現該邏輯方法流程的硬件電路。控制器可以按任何適當的方式實現,例如,控制器可以采取例如微處理器或處理器以及存儲可由該(微)處理器執行的計算機可讀程序代碼(例如軟件或固件)的計算機可讀介質、邏輯門、開關、專用集成電路(Application Specific Integrated Circuit,ASIC)、可編程邏輯控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存儲器控制器還可以被實現為存儲器的控制邏輯的一部分。
本領域技術人員也知道,除了以純計算機可讀程序代碼方式實現控制器以外,完全可以通過將方法步驟進行邏輯編程來使得控制器以邏輯門、開關、專用集成電路、可編程邏輯控制器和嵌入微控制器等的形式來實現相同功能。因此這種控制器可以被認為是一種硬件部件,而對其內包括的用于實現各種功能的裝置也可以視為硬件部件內的結構。或者甚至,可以將用于實現各種功能的裝置視為既可以是實現方法的軟件模塊又可以是硬件部件內的結構。
上述實施例闡明的系統、裝置、模塊或單元,具體可以由計算機芯片或實體實現,或者由具有某種功能的產品來實現。
為了描述的方便,描述以上裝置時以功能分為各種單元分別描述。當然,在實施本申請時可以把各單元的功能在同一個或多個軟件和/或硬件中實現。
通過以上的實施方式的描述可知,本領域的技術人員可以清楚地了解到本申請可借助軟件加必需的通用硬件平臺的方式來實現。基于這樣的理解,本申請的技術方案本質上或者說對現有技術做出貢獻的部分可以以軟件產品的形式體現出來,在一個典型的配置中,計算設備包括一個或多個處理器(CPU)、輸入/輸出接口、網絡接口和內存。該計算機軟件產品可以包括若干指令用以使得一臺計算機設備(可以是個人計算機,服務器,或者網絡設備等)執行本申請各個實施例或者實施例的某些部分所述的方法。該計算機軟件產品可以存儲在內存中,內存可能包括計算機可讀介質中的非永久性存儲器,隨機存取存儲器(RAM)和/或非易失性內存等形式,如只讀存儲器(ROM)或閃存(flash RAM)。內存是計算機可讀介質的示例。計 算機可讀介質包括永久性和非永久性、可移動和非可移動媒體可以由任何方法或技術來實現信息存儲。信息可以是計算機可讀指令、數據結構、程序的模塊或其他數據。計算機的存儲介質的例子包括,但不限于相變內存(PRAM)、靜態隨機存取存儲器(SRAM)、動態隨機存取存儲器(DRAM)、其他類型的隨機存取存儲器(RAM)、只讀存儲器(ROM)、電可擦除可編程只讀存儲器(EEPROM)、快閃記憶體或其他內存技術、只讀光盤只讀存儲器(CD-ROM)、數字多功能光盤(DVD)或其他光學存儲、磁盒式磁帶,磁帶磁磁盤存儲或其他磁性存儲設備或任何其他非傳輸介質,可用于存儲可以被計算設備訪問的信息。按照本文中的界定,計算機可讀介質不包括短暫電腦可讀媒體(transitory media),如調制的數據信號和載波。
本說明書中的各個實施例均采用遞進的方式描述,每個實施例重點說明的都是與其他實施例的不同之處,各個實施例之間相同相似的部分互相參見即可。尤其,對于系統實施例而言,由于其基本相似于方法實施例,所以描述的比較簡單,相關之處參見方法實施例的部分說明即可。本申請可用于眾多通用或專用的計算機系統環境或配置中。例如:個人計算機、服務器計算機、手持設備或便攜式設備、平板型設備、多處理器系統、基于微處理器的系統、置頂盒、可編程的消費電子設備、網絡PC、小型計算機、大型計算機、包括以上任何系統或設備的分布式計算環境等等。
本申請可以在由計算機執行的計算機可執行指令的一般上下文中描述,例如程序模塊。一般地,程序模塊包括執行特定任務或實現特定抽象數據類型的例程、程序、對象、組件、數據結構等等。也可以在分布式計算環境中實踐本申請,在這些分布式計算環境中,由通過通信網絡而被連接的遠程處理設備來執行任務。在分布式計算環境中,程序模塊可以位于包括存儲設備在內的本地和遠程計算機存儲介質中。
雖然通過實施例描繪了本申請,本領域普通技術人員知道,本申請有許多變形和變化而不脫離本申請的精神,希望所附的權利要求包括這些變形和變化而不脫離本申請的精神。

關 鍵 詞:
一種 建立 輸入 建議 數據處理 方法 系統
  專利查詢網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
關于本文
本文標題:一種建立輸入建議的數據處理方法和系統.pdf
鏈接地址:http://www.rgyfuv.icu/p-6373756.html
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服客服 - 聯系我們

[email protected] 2017-2018 zhuanlichaxun.net網站版權所有
經營許可證編號:粵ICP備17046363號-1 
 


收起
展開
山东11选5中奖结果走势图