• / 15
  • 下載費用:30 金幣  

基于瀏覽器的網頁收藏方法和裝置.pdf

摘要
申請專利號:

CN201510316329.3

申請日:

2015.06.10

公開號:

CN104915422A

公開日:

2015.09.16

當前法律狀態:

實審

有效性:

審中

法律詳情: 實質審查的生效IPC(主分類):G06F 17/30申請日:20150610|||公開
IPC分類號: G06F17/30 主分類號: G06F17/30
申請人: 安一恒通(北京)科技有限公司
發明人: 趙俊博; 陳慶偉; 王陽; 胡海濤; 郭俊杰
地址: 100091北京市海淀區東北旺西路8號中關村軟件園4號樓C座1-03
優先權:
專利代理機構: 北京英賽嘉華知識產權代理有限責任公司11204 代理人: 王達佐; 馬曉亞
PDF完整版下載: PDF下載
法律狀態
申請(專利)號:

CN201510316329.3

授權公告號:

|||

法律狀態公告日:

2015.10.14|||2015.09.16

法律狀態類型:

實質審查的生效|||公開

摘要

本申請公開了一種基于瀏覽器的網頁收藏方法和裝置。所述方法的一具體實施方式包括:接收收藏網頁的指令;提取網頁的特征信息;以及將特征信息自動保存至收藏目錄。其中,特征信息包括以下至少一項:關鍵字集合、標題以及摘要。該實施方式能夠保證用戶收藏的信息的有效性,并且能夠提升用戶收藏的信息的實時性和準確性。

權利要求書

權利要求書
1.  一種基于瀏覽器的網頁收藏方法,其特征在于,所述方法包括:
接收收藏網頁的指令;
提取所述網頁的特征信息;以及
將所述特征信息自動保存至收藏目錄;
其中,所述特征信息包括以下至少一項:關鍵字集合、標題以及摘要。

2.  根據權利要求1所述的方法,其特征在于,所述提取所述網頁的特征信息,包括以下至少一項:
基于統計特征提取所述網頁中出現的高頻詞,基于語義特征對所述高頻詞進行篩選,以獲取所述網頁的關鍵字集合;
基于文本密度對網頁進行解析,獲取所述網頁的標題;以及
基于語義特征提取所述網頁的摘要。

3.  根據權利要求1或2所述的方法,其特征在于,所述方法還包括:
響應于用戶對收藏目錄中特征信息的選中指令,利用搜索引擎檢索所述特征信息,以確定目標網頁;以及
跳轉至所述目標網頁。

4.  根據權利要求3所述的方法,其特征在于,所述利用搜索引擎檢索所述特征信息,以確定目標網頁,包括:
向所述搜索引擎發送包含所述特征信息的搜索命令;
從所述搜索引擎的檢索結果中獲取至少一個匹配的候選網頁及相應的匹配度值;
按照所述匹配度值的排序依次檢測所述候選網頁是否可用;以及
將可用且匹配度值最高的候選網頁作為目標網頁。

5.  根據權利要求4所述的方法,其特征在于,所述方法還包括:
在所述目標網頁的預設區域內提供其他可用的候選網頁的鏈接。

6.  根據權利要求5所述的方法,其特征在于,所述方法還包括:
響應于用戶對所述其他可用的候選網頁的鏈接的點擊行為,向搜索引擎上報所述點擊行為的相關數據,增加所點擊的候選網頁對應于所述特征信息的匹配度值。

7.  根據權利要求6所述的方法,其特征在于,所述點擊行為的相關數據包括點擊時間以及點擊次數。

8.  一種基于瀏覽器的網頁收藏裝置,其特征在于,所述裝置包括:
接收單元,配置用于接收收藏網頁的指令;
提取單元,配置用于提取所述網頁的特征信息,所述特征信息包括以下至少一項:關鍵字集合、標題以及摘要;以及
保存單元,配置用于將所述特征信息保存至收藏目錄。

9.  根據權利要求8所述的裝置,其特征在于,所述提取單元配置用于按如下方式中的至少一項提取所述網頁的特征信息:
基于統計特征提取所述網頁中出現的高頻詞,基于語義特征對所述高頻詞進行篩選,以獲取所述網頁的關鍵字集合;
基于文本密度對網頁進行解析,獲取所述網頁的標題;以及
基于語義特征提取所述網頁的摘要。

10.  根據權利要求8或9所述的裝置,其特征在于,所述裝置還包括:
檢索單元,配置用于響應于用戶對收藏夾中特征信息的選中指令,利用搜索引擎檢索所述特征信息,以確定目標網頁;以及
跳轉單元,配置用于跳轉至所述目標網頁。

11.  根據權利要求10所述的裝置,其特征在于,所述檢索單元配置用于按如下方式確定目標網頁:
向所述搜索引擎發送包含所述特征信息的搜索命令;
從所述搜索引擎返回的檢索結果中獲取至少一個匹配的候選網頁及相應的匹配度值;
按照所述匹配度值的排序依次檢測所述候選網頁是否可用;以及
將可用且匹配度值最高的候選網頁作為目標網頁。

12.  根據權利要求11所述的裝置,其特征在于,所述裝置還包括:
推薦單元,配置用于在所述目標網頁的預設區域內提供其他可用的候選網頁的鏈接。

13.  根據權利要求12所述的裝置,其特征在于,所述裝置還包括:
調整單元,配置用于響應于用戶對所述其他可用的候選網頁的鏈接的點擊行為,向搜索引擎上報所述點擊行為的相關數據,增加所點擊的候選網頁對應于所述特征信息的匹配度值。

14.  根據權利要求13所述的裝置,其特征在于,所述點擊行為的相關數據包括點擊時間以及點擊次數。

說明書

說明書基于瀏覽器的網頁收藏方法和裝置
技術領域
本申請涉及計算機技術領域,具體涉及終端技術領域,尤其涉及基于瀏覽器的網頁收藏方法和裝置。
背景技術
當前瀏覽器在收藏網頁時,都是基于網頁的統一資源定位符(Uniform Resource Locator,URL)來進行收藏的。瀏覽器將用戶感興趣的網頁的URL保存至收藏夾,從而保存用戶感興趣的網頁上的信息。所以用戶感興趣的信息是與收藏的URL相關聯的。
這種方法存在如下缺陷:如果用戶收藏的URL失效(例如網址過期或網站關閉),則用戶所希望保存的感興趣的信息會丟失;當用戶感興趣的網頁上的信息發生新的動態時,由于收藏夾中保存的URL不會對網頁信息進行更新,因此,用戶通過收藏夾中的URL再次訪問網頁時,無法獲取最新的信息,從而影響了收藏夾收藏信息的準確性。
發明內容
有鑒于此,期望能夠提供一種通過收藏夾獲取實時有效的信息的網頁動態收藏的方法。進一步地,還期望能夠通過所提供的網頁收藏方法從收藏夾收藏的網頁中獲取更多的信息。為解決上述一個或多個問題,本申請提供了基于瀏覽器的網頁收藏方法和裝置。
一方面,本申請提供了一種基于瀏覽器的網頁收藏方法。該方法包括:接收收藏網頁的指令;提取網頁的特征信息;將特征信息自動保存至收藏目錄。其中,特征信息包括以下至少一項:關鍵字集合、標題以及摘要。
在某些實現方式中,提取所述網頁的特征信息,包括以下至少一項:基于統計特征提取網頁中出現的高頻詞,基于語義特征對高頻詞 進行篩選,以獲取網頁的關鍵字集合;基于文本密度對網頁進行解析,獲取網頁的標題;以及基于語義特征提取網頁的摘要。
在某些實現方式中,基于瀏覽器的網頁收藏方法還包括:響應于用戶對收藏目錄中特征信息的選中指令,利用搜索引擎檢索特征信息,以確定目標網頁;以及跳轉至目標網頁。
在某些實現方式中,利用搜索引擎檢索所述特征信息,以確定目標網頁,包括:向搜索引擎發送包含特征信息的搜索命令;從搜索引擎的檢索結果中獲取至少一個匹配的候選網頁及相應的匹配度值;按照匹配度值的排序依次檢測所述候選網頁是否可用;將可用且匹配度值最高的候選網頁作為目標網頁。
在某些實現方式中,基于瀏覽器的網頁收藏方法還包括:在目標網頁的預設區域內提供其他可用的候選網頁的鏈接。
在進一步的實現方式中,基于瀏覽器的網頁收藏方法還包括:響應于用戶對其他可用的候選網頁的鏈接的點擊行為,向搜索引擎上報點擊行為的相關數據,增加所點擊的候選網頁對應于所述特征信息的匹配度值。
在進一步的實現方式中,點擊行為的相關數據包括點擊時間以及點擊次數。
第二方面,本申請提供了一種基于瀏覽器的網頁收藏裝置。該裝置包括:接收單元,配置用于接收收藏網頁的指令;提取單元,配置用于提取網頁的特征信息;以及保存單元,配置用于將特征信息自動保存至收藏目錄。其中,特征信息包括以下至少一項:關鍵字集合、標題以及摘要。
在某些實現方式中,提取單元配置用于按如下方式中的至少一項提取網頁的特征信息:基于統計特征提取網頁中出現的高頻詞,基于語義特征對高頻詞進行篩選,以獲取網頁的關鍵字集合;基于文本密度對網頁進行解析,獲取網頁的標題;以及基于語義特征提取網頁的摘要。
在某些實現方式中,基于瀏覽器的網頁收藏裝置還包括:檢索單元,配置用于響應于用戶對收藏夾中特征信息的選中指令,利用搜索 引擎檢索特征信息,以確定目標網頁,并跳轉至所述目標網頁。
在某些實現方式中,檢索單元配置用于按如下方式確定目標網頁:向搜索引擎發送包含特征信息的搜索命令;從搜索引擎返回的檢索結果中獲取至少一個匹配的候選網頁及相應的匹配度值;按照匹配度值的排序依次檢測候選網頁是否可用;將可用且匹配度值最高的候選網頁作為目標網頁。
在進一步的實現方式中,基于瀏覽器的網頁收藏裝置還包括:推薦單元,配置用于在目標網頁的預設區域內提供其他可用的候選網頁的鏈接。
在進一步的實現方式中,基于瀏覽器的網頁收藏裝置還包括:調整單元,配置用于響應于用戶對其他可用的候選網頁的鏈接的點擊行為,向搜索引擎上報點擊行為的相關數據,增加所點擊的候選網頁對應于特征信息的匹配度值。
在進一步的實現方式中,點擊行為的相關數據包括點擊時間以及點擊次數。
本申請提供的基于瀏覽器的網頁收藏方法和裝置,通過提取所要收藏的網頁中的特征信息,自動將特征信息保存至收藏目錄中,能夠保證用戶收藏的信息的有效性,并且,用戶通過收藏目錄中所收藏的信息獲取的網頁信息是實時的。因此,本申請提供的基于瀏覽器的網頁收藏方法和裝置提升了收藏信息的準確性。
附圖說明
通過閱讀參照以下附圖所作的對非限制性實施例詳細描述,本申請的其它特征、目的和優點將會變得更明顯:
圖1示出了根據本申請一個實施例的基于瀏覽器的網頁收藏方法的示例性流程圖;
圖2示出了根據本申請另一個實施例的基于瀏覽器的網頁收藏方法的示例性流程圖;
圖3示出了根據本申請一個實施例的利用搜索引擎確定目標網頁的方法的示例性流程圖;
圖4示出了根據本申請實施例提供的方法訪問收藏的網頁的效果示意圖;以及
圖5示出了根據本申請一個實施例的基于瀏覽器的網頁收藏裝置的結構示意圖。
具體實施方式
下面結合附圖和實施例對本申請作進一步的詳細說明。可以理解的是,此處所描述的具體實施例僅僅用于解釋相關發明,而非對該發明的限定。另外還需要說明的是,為了便于描述,附圖中僅示出了與有關發明相關的部分。
需要說明的是,在不沖突的情況下,本申請中的實施例及實施例中的特征可以相互組合。下面將參考附圖并結合實施例來詳細說明本申請。
在下面的描述中,大量具體細節被闡述以提供對本發明的實施例的完整描述。然而,本領域技術人員應該理解,本申請的實施例在沒有這些具體細節的情況下,也可以被實施。
請參考圖1,其示出了根據本申請一個實施例的基于瀏覽器的網頁收藏方法的示例性流程圖。為了便于理解,本實施例中,結合具有網絡通信功能的電子設備來舉例說明。本領域技術人員可以理解,該電子設備可以包括但不限于智能手機、平板電腦、智能手表、電子書閱讀器、膝上型便攜計算機和臺式計算機等等。
如圖1所示,在步驟101中,接收收藏網頁的指令。
用戶在通過瀏覽器瀏覽網頁過程中,如果對網頁內容感興趣,可以向瀏覽器發出收藏網頁的指令。這時,瀏覽器可以接收用戶所發出的收藏網頁的指令。用戶發出指令的方式可以為通過點擊瀏覽器的收藏選項或圖標發出。例如,在一些瀏覽器中,可以通過在網頁頁面中點擊右鍵后從下拉選項中選擇“添加到收藏夾”發出收藏網頁的指令。在一些實現中,網頁中可以包含收藏網頁的提示信息,例如網頁中可以包含“收藏本網站”的選項,這時,用戶可以通過點擊該選項來發出收藏網頁的指令。在一些可選的實現方式中,當電子設備具有音頻 輸入裝置時,用戶可以發出音頻指令。電子設備可以將音頻指令解析,并向瀏覽器發送。瀏覽器可以接收解析后的收藏網頁的指令。
在步驟102中,提取網頁的特征信息。
瀏覽器可以響應于收藏網頁的指令,對用戶感興趣的網頁進行收藏處理。在本實施例中,瀏覽器可以通過提取網頁的特征信息來保存用戶感興趣的網頁中的信息。其中特征信息可以包括以下至少一項:關鍵字集合、標題以及摘要。
瀏覽器可以對網頁中的文字內容進行分析處理,提取其中的特征信息。在一些實現中,瀏覽器可以采用機器學習的方法提取網頁中的關鍵字集合、標題以及摘要。例如可以采用文檔關鍵詞模型來提取網頁中的關鍵字,其中文檔關鍵字模型可以通過大量的文檔和網頁訓練得出。
在一些實現中,提取網頁的關鍵字集合可以通過如下方式進行:基于統計特征提取網頁中出現的高頻詞,基于語義特征對高頻詞進行篩選,以獲取網頁的關鍵字集合。瀏覽器可以首先從網頁中識別文字內容,當文字內容為中文等不包含分詞空格的語言格式時,可以基于預設的詞典或詞語頻率對文字內容進行分詞。其中詞語頻率可以為大量文檔或網頁的統計數據。之后瀏覽器可以統計分詞結果中所有詞語在用戶所要收藏的網頁中出現的頻率,將頻率高于某一預設閾值的詞語作為高頻詞;或者可以按照詞語在用戶所要收藏的網頁中出現的頻率進行排序,將排序為前預設位的詞語作為高頻詞。可選地,瀏覽器可以基于詞語的語義相似度將分詞后的詞語合并,例如可以將“插畫”和“插圖”合并為同一詞語,對合并后的詞語進行詞頻統計。經過詞頻統計后提取出的高頻詞中可能包含無實際意義的連詞、冠詞等,瀏覽器還可以基于語義特征對高頻詞進行篩選,例如可以濾除無實際意義的詞,從而得出網頁的關鍵詞集合。
在進一步的實現中,還可以通過網頁中的關鍵字標記來提取關鍵字集合。例如在一些網頁中重點部分采用與其他內容不同的字體(例如加粗)、顏色(例如高亮)或特殊符號(例如在文本前后加“#”符號)來進行標記。這時,可以直接將這些具有標記的文本內容提取出 來,然后對文本內容進行分詞操作,濾除無語法意義的詞,即可以獲取至少一部分的關鍵字集合。
可選地,除了基于語義特征和/或統計特征從網頁的文字內容中提取出的關鍵字之外,關鍵字集合中可以包括網頁名稱的簡稱。瀏覽器可以對網頁的地址進行分析,或從網頁中提取網頁名稱的簡稱,例如“專利局”,添加到關鍵字集合中。
在一些實現中,提取網頁的標題可以通過如下方式進行:基于文本密度對網頁進行解析,獲取網頁的標題。網頁的標題一般位于網頁壓面中的特定位置,例如頁面上方或左側,標題文本密度遠小于正文內容的文本密度。瀏覽器可以通過文本密度檢測確定網頁標題的位置,進而根據網頁標題的位置提取出網頁的標題。在另一些實現中,瀏覽器還可以采用經過訓練的網頁標題提取模型來獲取網頁的標題。該模型的訓練數據可以為隨機的網頁。
在一些實現中,網頁的摘要可以基于網頁文字內容的語義特征來提取。具體地,可以按如下方式提取摘要:提取文字內容中的特征詞(在對中文網頁進行處理時,提取特征詞之前需先進行分詞處理),基于詞頻統計確定特征詞的權重,根據特征詞的權重確定特征詞所在語句的權重。之后基于語義特征合并相似的語句,將語句根據權重相連接,形成網頁的摘要。在一些可選的實現方式中,網頁的摘要可以為一句話描述,該一句話描述的提取方式可以為從網頁中提取關鍵詞,之后通過添加連接詞等詞語將關鍵詞按照語義特征連接為一句話。
在步驟103中,將特征信息自動保存至收藏目錄。
在收藏網頁時,瀏覽器可以將網頁的URL保存至收藏目錄中,并且可以自動地或者由用戶為該URL配置一個標題,以便用戶通過標題訪問對應的網頁。在本實施例中,瀏覽器并不保存網頁的URL,而是將提取出的特征信息自動保存至收藏目錄,即收藏目錄中保存的是從網頁中提取出的關鍵字結合、標題或摘要,未保存網頁的超級鏈接。這樣,用戶在通過收藏目錄訪問所收藏的感興趣的網頁信息時,不直接通過URL定位到對應的網頁,而是通過收藏目中的特征信息進行網頁的訪問。用戶感興趣的信息與從網頁中提取出的特征信息相關聯, 而非與網頁的URL相關聯。用戶在收藏目錄中查找所保存的感興趣的信息時,查找結果為特征信息。由于特征信息不會因為網頁URL變化、網頁內容更新或網址失效等原因而發生變化,因而用戶所收藏的信息相對于傳統的保存URL的方式具有更好的實時性和準確性。
本申請上述實施例提供的基于瀏覽器的網頁收藏方法,通過提取所要收藏的網頁中的特征信息,自動將特征信息保存至收藏目錄中,當用戶所收藏的網頁URL失效時,用戶所希望保存的感興趣的信息不會丟失,從而保證了用戶收藏的信息的有效性。當用戶感興趣的網頁上的信息發生新的動態時,可以通過所保存的特征信息查找到更新后的網頁,獲取最新的信息,從而保證了用戶通過收藏目錄中所收藏的信息獲取實時準確的信息。
進一步參考圖2,其示出了根據本申請另一個實施例的基于瀏覽器的網頁收藏方法的示例性流程圖。
如圖2所示,在步驟201中,接收收藏網頁的指令。
在本實施例中,瀏覽器可以接收用戶所發出的收藏網頁的指令。接收的方式可以為響應于用戶點擊瀏覽器的收藏圖標或選中收藏選項而接收。也可以為通過電子設備的音頻輸入裝置獲取音頻收藏指令,然后通過音頻解析模塊獲取瀏覽器可以識別的收藏指令。
在步驟202中,提取網頁的特征信息。
特征信息可以包括以下至少一項:關鍵字集合、標題以及摘要。在本實施例中,瀏覽器可以基于統計特征和/或語義特征從網頁內容中提取特征信息。例如,可以基于統計特征提取網頁文本中的高頻詞,之后根據語義特征對高頻詞進行處理來獲取網頁的關鍵字集合;可以基于文本密度統計特征確定網頁的標題;可以基于語義特征生成摘要。
在步驟203中,將特征信息自動保存至收藏目錄。
在本實施例中,瀏覽器可以自動將特征信息添加至收藏目錄中。可選地,當信息特征所包含的信息超過預設信息量(例如關鍵詞數量超過預設數量或摘要字數超過預設字數)時還可以為特征信息設置標簽。當用戶通過收藏目錄訪問相關的網頁時,可以從對應的標簽下查找到特征信息。
上述結合圖2描述的實現流程中的步驟201、步驟202和步驟203分別與前述實施例中的步驟101、步驟102和步驟103相同,在此不再贅述。
接著,在步驟204中,響應于用戶對收藏夾目錄中特征信息的選中指令,利用搜索引擎檢索特征信息,以確定目標網頁。
當用戶通過收藏目錄中的特征信息訪問相關的網頁時,瀏覽器可以響應于用戶對特征信息的選中指令,利用搜索引擎來檢索特征信息,從而確定目標網頁。用戶可以通過目標網頁獲取感興趣的信息。
在一些實現中,用戶可以通過點擊收藏目錄中的特征信息來發出訪問相關網頁的指令,瀏覽器可以自動調用搜索引擎來進行檢索,檢索結果中可以包含多個網頁。用戶可以手動選擇多個網頁中感興趣的網頁作為目標網頁。瀏覽器也可以基于預定規則來選擇一個網頁作為目標網頁。其中預定規則可以包括網頁更新時間與當前訪問時間最接近,和/或與特征信息匹配度最高。
在本實施例中,用戶發出訪問請求時瀏覽器自動根據特征信息進行檢索,能夠保證檢索到的網頁為實時的。即當用戶所收藏的網頁的內容發生變化時,用戶可以通過搜索引擎定位到變化后的網頁。目標網頁可以提供用戶感興趣的信息,并且搜索引擎的檢索結果中的網頁通常為有效的網頁,因此可以避免收藏目錄中URL所定向的網頁失效。
進一步參考圖3,其示出了根據本申請一個實施例的利用搜索引擎確定目標網頁的方法的示例性流程圖。
如圖3所示,在步驟301中,向搜索引擎發送包含特征信息的搜索命令。
在本實施例中,瀏覽器可以啟動搜索引擎,將特征信息發送給搜索引擎,搜索引擎將接收到的特征信息作為檢索關鍵詞進行檢索。檢索結果的精確程度可以由所保存的特征信息的準確程度決定。特征信息越準確,則搜索引擎檢索到的網頁越精確。根據搜索引擎的檢索機制,可以對網頁進行過濾,將失效網頁從檢索結果中濾除之后呈現在瀏覽器中。因此利用搜索引擎進行檢索可以保證檢索出的網頁為有效 的網頁。同時,由于搜索引擎從服務器獲取的網頁信息為實時的信息,因此還可以保證檢索到的網頁上的內容為實時的內容。
在步驟302中,從搜索引擎的檢索結果中獲取至少一個匹配的候選網頁及相應的匹配度值。
搜索引擎可以將接收到搜索指令中的特征信息作為搜索詞,對搜索詞進行快速處理,如中文特有的分詞處理、去除停止詞、判斷是否需要啟動整合搜索、判斷是否有拼寫錯誤或錯別字等情況。對搜索詞處理后,搜索引擎可以從索引數據庫中查找出所有包含搜索詞的網頁,作為匹配的候選網頁。搜索引擎還可以根據網頁中搜索詞的匹配程度,搜索詞出現的位置/頻次,網頁鏈接的質量等計算出每個網頁的匹配度值。在一些實現中,搜索引擎還可以獲取網頁的更新時間,結合搜索詞的匹配程度,搜索詞出現的位置/頻次以及網頁鏈接的質量等計算出每個網頁的匹配度值。
在本實施例中,瀏覽器可以獲取搜索引擎的查找出的網頁,同時還可以從搜索引擎獲取每個網頁的匹配度值。
在步驟303中,按照匹配度值的排序依次檢測候選網頁是否可用。
搜索引擎可以對候選網頁按照匹配度值進行排序,并返回排序后的檢索結果。這時瀏覽器或搜索引擎可以按照搜索引擎的排序依次檢測每個候選網頁是否可用。在一些實現中,檢測每個候選網頁是否可用可以包括:檢測每個候選網頁在當前時刻是否為可訪問狀態,如果是,則可以確定候選網頁可用。
在步驟304中,將可用且匹配度值最高的候選網頁作為目標網頁。
在本實施例中,可以將步驟303中檢測到的第一個可用的候選網頁作為目標網頁,即將可用且匹配度值最高的候選網頁作為目標網頁。
上述結合圖3描述的實施例中,瀏覽器可以通過搜索引擎對大數據量的網頁進行分析,確定與特征信息相關的目標網頁。所確定的目標網頁為有效的網頁,且目標網頁包含實時的信息,可以為用戶提供更加準確、實時的內容。
返回圖2,在步驟205中,跳轉至目標網頁。
在確定目標網頁后,瀏覽器可以獲取目標網頁的URL,自動打開 新的窗口或新的選項卡,跳轉至目標網頁。用戶可以在新打開的頁面中瀏覽目標網頁。
在步驟206中,在目標網頁的預設區域內提供其他可用的候選網頁的鏈接。
在本實施例中,瀏覽器可以在新的頁面中顯示目標網頁的內容。還可以在目標網頁的預設區域(例如,空白區域)內呈現其他可用的候選網頁的鏈接。在一些實現中,可以以浮動窗口的形式呈現其他可用的候選網頁的鏈接。當用戶點擊鏈接時,瀏覽器可以自動跳轉到鏈接所指向的網頁頁面。
可選地,在用戶瀏覽目標網頁過程中,如果用戶未對所呈現的其他可用的候選網頁的鏈接進行點擊,則瀏覽器可以將所呈現的鏈接隱藏,或者從檢索出的其他可用候選網頁中重新選擇一個或多個網頁鏈接進行呈現。
在步驟207中,響應于用戶對其他可用的候選網頁的鏈接的點擊行為,向搜索引擎上報點擊行為的相關數據,增加所點擊的候選網頁對應于特征信息的匹配度值。
在本實施例中,瀏覽器可以實時地檢測用戶的點擊、拖拽等瀏覽行為。如果用戶對呈現在目標網頁中的其他候選網頁的鏈接進行點擊操作,則可以認為用戶對所點擊的網頁鏈接感興趣。瀏覽器可以響應于用戶的上述點擊操作,向搜索引擎上報數據。搜索引擎在接收到瀏覽器上報的數據后,可以增加所點擊的候選網頁對應于特征信息的匹配度值。例如,如果瀏覽器檢測到用戶點擊某一網頁鏈接,則可以向搜索引擎發出請求信息。該請求信息可以為增加所點擊的網頁鏈接與用戶選中的收藏目錄中的特征信息的匹配度值的信息。搜索引擎可以從多個瀏覽器獲取大量的點擊數據,從而對候選網頁對應于特征信息的匹配度值進行更新。
在一些可選的實現方式中,點擊行為的相關數據可以包括點擊時間以及點擊次數。搜索引擎可以根據點擊時間和/或點擊次數確定候選網頁對應于特征信息的匹配度值的增量。例如,可以根據如下規則確定匹配度值的增量:點擊次數越多,則匹配度值的增量越大;點擊時 間與用戶通過收藏夾中的特征信息訪問網頁的時間越接近,匹配度值的增量越大。
對于本申請的上述實施例,應用的場景可以為:用戶在瀏覽網頁過程中,如果發現感興趣的信息,可以發出收藏網頁的指令,瀏覽器可以自動將網頁的特征信息保存至收藏目錄。當用戶需要再次訪問該網頁時,可以點擊收藏目錄中的特征信息,瀏覽器可以通過搜索引擎以特征信息為搜索詞進行搜索,得出經過排序的多個匹配的網頁。之后,瀏覽器可以對匹配的網頁進行有效性檢測,并自動跳轉至有效且排序序號最小的網頁。在一些場景中,還可以在新打開的網頁中推薦與特征信息匹配的其他頁面供用戶選擇。如果用戶點擊所推薦的頁面,則向搜索引擎上報數據,增加用戶點擊的頁面與特征信息的關聯度。
進一步參考圖4,其示出了根據本申請實施例提供的方法訪問收藏的網頁的效果示意圖。如圖4所示,瀏覽器410的收藏夾欄411中包含三個已收藏的信息欄4111、4112和4113。其中已收藏的信息欄4111、4112和4113中的內容可以為用戶所收藏的網頁的關鍵字集合或一句話描述。例如,已收藏的信息欄4111中的內容可以為“機器學習,人工神經網絡,編程,應用”,則用戶點擊已收藏的信息欄4111時,瀏覽器410可以啟動搜索引擎以“機器學習”、“人工神經網絡”、“編程”、“應用”為檢索關鍵詞進行檢索。檢索完成后,瀏覽器可以在選項卡欄412中添加新的選項卡,在打開的頁面413中顯示檢索結果中可用且匹配度最高的網頁。在圖4中,頁面413內可以包括用于顯示檢索結果中其他可用的網頁鏈接的區域4131。用戶可以對區域4131中所顯示的網頁鏈接進行點擊操作。
進一步參考圖5,其示出了根據本申請一個實施例的基于瀏覽器的網頁收藏裝置的結構示意圖。如圖5所示,基于瀏覽器的網頁收藏裝置500可以包括接收單元501、提取單元502以及保存單元503。其中接收單元501可以配置用于接收收藏網頁的指令,提取單元502可以配置用于提取網頁的特征信息,保存單元503可以配置用于將提取單元502所提取出的特征信息自動保存至收藏目錄。
在一些可選的實現方式中,提取單元502可以配置用于按如下方 式中的至少一項提取網頁的特征信息:基于統計特征提取網頁中出現的高頻詞,基于語義特征對所述高頻詞進行篩選,以獲取網頁的關鍵字集合;基于文本密度對網頁進行解析,獲取網頁的標題;以及基于語義特征提取網頁的摘要。
在一些實施例中,基于瀏覽器的網頁收藏裝置500還可以包括檢索單元504、跳轉單元505、推薦單元506以及調整單元507(未示出)。其中,檢索單元504可以配置用于響應于用戶對收藏夾中特征信息的選中指令,利用搜索引擎檢索特征信息,以確定目標網頁;跳轉單元505可以配置用于跳轉至目標網頁;推薦單元506可以配置用于在目標網頁的預設區域內提供其他可用的候選網頁的鏈接;調整單元507可以配置用于響應于用戶對其他可用的候選網頁的鏈接的點擊行為,向搜索引擎上報點擊行為的相關數據,增加所點擊的候選網頁對應于特征信息的匹配度值。可選地,點擊行為包括點擊時間和點擊次數。
在一些可選的實現方式中,檢索單元504可以配置用于按如下方式確定目標網頁:向搜索引擎發送包含特征信息的搜索命令;從搜索引擎返回的檢索結果中獲取至少一個匹配的候選網頁及相應的匹配度值;按照匹配度值的排序依次檢測候選網頁是否可用;以及將可用且匹配度值最高的候選網頁作為目標網頁。
本申請上述實施例提供的基于瀏覽器的網頁收藏裝置,可以自動將用戶收藏的網頁的特征信息保存至收藏目錄中,能夠保證用戶收藏的信息的有效性,并且,用戶可以通過收藏目錄中所收藏的信息獲取更加實時和準確的信息。
應當理解,基于瀏覽器的網頁收藏裝置500中記載的諸單元參考圖1-3描述的方法中的各個步驟相對應。由此,上文針對方法描述的操作和特征同樣適用于基于瀏覽器的網頁收藏裝置500及其中包含的單元,在此不再贅述。
作為另一方面,本申請還提供了一種計算機可讀存儲介質,該計算機可讀存儲介質可以是上述實施例中所述裝置中所包含的計算機可讀存儲介質;也可以是單獨存在,未裝配入終端設備中的計算機可讀存儲介質。該計算機可讀存儲介質存儲有一個或者一個以上程序,該 程序可以包含用于執行流程圖所示的方法的程序代碼。
附圖中的流程圖和框圖,圖示了按照本發明各種實施例的系統、裝置、方法和計算機程序產品的可能實現的體系架構、功能和操作。在這點上,流程圖或框圖中的每個方框可以代表一個模塊、程序段、或代碼的一部分,所述模塊、程序段、或代碼的一部分包含一個或多個用于實現規定的邏輯功能的可執行指令。也應當注意,在有些作為替換的實現中,方框中所標注的功能也可以以不同于附圖中所標注的順序發生。例如,兩個接連地表示的方框實際上可以基本并行地執行,它們有時也可以按相反的順序執行,這依所涉及的功能而定。也要注意的是,框圖和/或流程圖中的每個方框、以及框圖和/或流程圖中的方框的組合,可以用執行規定的功能或操作的專用的基于硬件的系統來實現,或者可以用專用硬件與計算機指令的組合來實現。
以上描述僅為本申請的較佳實施例以及對所運用技術原理的說明。本領域技術人員應當理解,本申請中所涉及的發明范圍,并不限于上述技術特征的特定組合而成的技術方案,同時也應涵蓋在不脫離所述發明構思的情況下,由上述技術特征或其等同特征進行任意組合而形成的其它技術方案。例如上述特征與本申請中公開的(但不限于)具有類似功能的技術特征進行互相替換而形成的技術方案。

關 鍵 詞:
基于 瀏覽器 網頁 收藏 方法 裝置
  專利查詢網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
關于本文
本文標題:基于瀏覽器的網頁收藏方法和裝置.pdf
鏈接地址:http://www.rgyfuv.icu/p-6373600.html
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服客服 - 聯系我們

[email protected] 2017-2018 zhuanlichaxun.net網站版權所有
經營許可證編號:粵ICP備17046363號-1 
 


收起
展開
山东11选5中奖结果走势图