• / 19
  • 下載費用:30 金幣  

內容分類.pdf

摘要
申請專利號:

CN201380076169.9

申請日:

2013.05.01

公開號:

CN105164672A

公開日:

2015.12.16

當前法律狀態:

撤回

有效性:

無權

法律詳情: 發明專利申請公布后的視為撤回IPC(主分類):G06F 17/30申請公布日:20151216|||專利申請權的轉移IPC(主分類):G06F 17/30登記生效日:20180611變更事項:申請人變更前權利人:慧與發展有限責任合伙企業變更后權利人:安提特軟件有限責任公司變更事項:地址變更前權利人:美國德克薩斯州變更后權利人:美國加利福尼亞州|||專利申請權的轉移IPC(主分類):G06F 17/30登記生效日:20161021變更事項:申請人變更前權利人:惠普發展公司,有限責任合伙企業變更后權利人:慧與發展有限責任合伙企業變更事項:地址變更前權利人:美國德克薩斯州變更后權利人:美國德克薩斯州|||實質審查的生效IPC(主分類):G06F 17/30申請日:20130501|||公開
IPC分類號: G06F17/30 主分類號: G06F17/30
申請人: 惠普發展公司,有限責任合伙企業
發明人: 哈達什·科根; 多倫·謝克德; 希凡·阿爾巴利·基姆; 喬治·福曼
地址: 美國德克薩斯州
優先權:
專利代理機構: 北京德琦知識產權代理有限公司11018 代理人: 嚴芬; 康泉
PDF完整版下載: PDF下載
法律狀態
申請(專利)號:

CN201380076169.9

授權公告號:

||||||||||||

法律狀態公告日:

2018.12.18|||2018.06.29|||2016.11.09|||2016.01.13|||2015.12.16

法律狀態類型:

發明專利申請公布后的視為撤回|||專利申請權、專利權的轉移|||專利申請權、專利權的轉移|||實質審查的生效|||公開

摘要

公開了用于從數據對象(100)的內容確定分類的技術。使用來自于多個類別(200)中每個類別的一個或多個數據對象(100)的內容中的詞語,來確定類別(200)中的一個類別的子主題(210)。

權利要求書

權利要求書
1.  一種系統,包括:
數據存儲庫;
數據對象分析器,包括至少一個處理器,用于執行計算機程序代碼,以從多個類別中每個類別的一個或多個數據對象的內容中確定詞語,并將所述詞語整理在所述數據存儲庫中;
模式分析器,包括至少一個處理器,用于執行計算機程序代碼,以從所述數據存儲庫中的所述詞語中,為從所述多個類別中選出的一個類別確定子主題,該子主題包括詞語集合,該詞語集合為所選類別的所述數據對象中至少一個數據對象子集的內容所共有,且基本上不在所選類別之外的數據對象中。

2.  根據權利要求1所述的系統,其中所述模式分析器的至少一個處理器進一步執行計算機程序代碼以執行優化操作,從而為所述子主題選擇詞語。

3.  根據權利要求2所述的系統,其中所述模式分析器的至少一個處理器進一步執行計算機程序代碼以執行所述優化操作包括:使所述類別中具有為所述詞語集合所共有的內容的數據對象的數目最大化、以及使所述詞語集合中的詞語數目最小化。

4.  根據權利要求2所述的系統,其中所述模式分析器的至少一個處理器進一步執行計算機程序代碼以執行所述優化操作包括:使所述詞語集合的詞語在所述類別之外的數據對象的內容中出現的次數最小化。

5.  根據權利要求1所述的系統,其中所述數據對象分析器的至少一個處理器進一步執行計算機程序代碼,以從下列中的一個或多個確定每個數據對象的所述類別:
所述數據對象中關于所述類別的數據;與所述數據對象關聯的關于所述類別的數據;關于所述數據對象的元數據;從所述數據對象的內容確定的數據;所述數據對象的來源;所述數據對象的發送或接收機制;數據對象的類型;所述數據對象的作者;所述數據對象的作者的專業領域。

6.  根據權利要求1所述的系統,進一步包括至少一個處理器,用于執行計算機程序代碼,以接收指定所述類別的一個或多個用戶輸入。

7.  根據權利要求1所述的系統,進一步包括至少一個處理器,用于執行計算機程序代碼,使所述數據對象中至少所選的數據對象的圖形表現根據所選的數據對象的各自類別和子標題被成組地顯示。

8.  根據權利要求7所述的系統,進一步包括至少一個處理器,用于執行計算機程序代碼,以接收指定所述類別的一個或多個輸入,其中對于指定所述類別的每個用戶 輸入,所述模式分析器的至少一個處理器執行所述計算機程序代碼,以從所述數據存儲庫中的所述詞語中,以增加的粒度為所選類別確定子主題。

9.  根據權利要求7所述的系統,進一步包括至少一個處理器,用于執行計算機程序代碼,以接收指定第一類別和第二類別的輸入,所述模式分析器的至少一個處理器執行所述計算機程序代碼,以從所述數據存儲庫的所述詞語中,確定為所述第一類別所共有的、包括不在所述第二類別中的詞語的子主題。

10.  一種非暫時性計算機可讀存儲介質,包含用于為一類數據對象確定一個或多個子主題的指令,所述指令在由處理器執行時使所述處理器:
從多個類別中每個類別的一個或多個數據對象的內容確定詞語,并整理所述詞語;
從所述詞語中,為從所述多個類別中選出的一個類別確定子主題,該子主題包括詞語集合,該詞語集合為所選類別的所述數據對象中至少一個數據對象子集的內容所共有,且基本上不在所選類別之外的數據對象中。

11.  根據權利要求10所述的非易失性計算機可讀存儲介質,其中所述指令在由所述處理器執行時進一步使所述處理器執行優化操作,以為所述子主題選擇詞語,包括:使所述類別中具有為所述詞語集合所共有的內容的數據對象的數目最大化、使所述詞語集合中的詞語數目最小化、以及使所述詞語集合的詞語在所述類別之外的數據對象的內容中出現的次數最小化。

12.  根據權利要求10所述的非易失性計算機可讀存儲介質,其中所述指令在由所述處理器執行時進一步使所述處理器訪問數據,以從下列中的一個或多個確定每個數據對象的所述類別:
所述數據對象中關于所述類別的數據;與所述數據對象關聯的關于所述類別的數據;關于所述數據對象的元數據;從所述數據對象的內容確定的數據;所述數據對象的來源;所述數據對象的發送或接收機制;數據對象的類型;所述數據對象的作者;所述數據對象的作者的專業領域。

13.  根據權利要求10所述的非易失性計算機可讀存儲介質,其中所述指令在由所述處理器執行時進一步使所述處理器:致使所述數據對象中至少所選的數據對象的圖形表現根據所選的數據對象的各自類別和子標題被顯示在顯示器上。

14.  根據權利要求10所述的非易失性計算機可讀存儲介質,其中所述指令在由所述處理器執行時進一步使所述處理器:接收指定所述類別的一個或多個輸入,并且對于指定所述類別的每個用戶輸入,以增加的粒度為所選類別確定子主題。

15.  根據權利要求10所述的非易失性計算機可讀存儲介質,其中所述指令在由所述處理器執行時進一步使所述處理器:接收指定第一類別和第二類別的輸入,并為所 述第一類別的包括不在所述第二類別中的詞語的一個或多個數據對象確定子主題。

16.  根據權利要求10所述的非易失性計算機可讀存儲介質,其中所述指令在由所述處理器執行時進一步使所述處理器:從所選類別的一個或多個數據對象中確定多個候選子主題,每個候選子主題包括為所選類別的一個或多個數據對象的內容所共有的詞語集合;
依據度量對每個候選子主題評分,所述度量包括對所述候選子主題的詞語集合到所選類別的數據對象和非所選類別的數據對象的適用性的測量值;以及
依據分數從所述多個候選子主題中選出所述子主題。

17.  一種用于確定一個類別的數據對象的子主題的方法,所述類別是多個類別中的一個,所述方法包括:
從所述類別的一個或多個數據對象中確定多個候選子主題,每個候選子主題包括為所述類別的一個或多個數據對象的內容所共有的詞語集合;
依據度量對每個候選子主題評分,所述度量包括對所述候選子主題的詞語集合到所述類別的數據對象和非所述類別的數據對象的適用性的測量值;
依據分數,從所述多個候選子主題中選擇子主題;以及
將關于所選子主題的數據寫入存儲器,包括關于所述詞語集合的、以及關于與所述類別和具有為所述子主題的詞語所共有的內容的數據對象的關聯的數據。

18.  根據權利要求17所述的方法,其中在所述選擇子主題的步驟之前,所述方法進一步包括:對于每個候選子標題,
從所述詞語集合中的具有為該候選子標題的詞語所共有的內容的數據對象的所述內容中選擇詞語,使所述候選子主題達到最大度量分數;以及
將所述詞語添加到所述子主題中。

19.  根據權利要求18所述的方法,進一步包括重復選擇所述詞語的步驟和添加所述詞語的步驟。

20.  根據權利要求18所述的方法,其中所述選擇子主題的步驟進一步包括:依據所述度量為每個候選子主題評分,并依據每個候選子主題的分數為所述子主題選擇至少一個詞語子集。

關 鍵 詞:
內容 分類
  專利查詢網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
關于本文
本文標題:內容分類.pdf
鏈接地址:http://www.rgyfuv.icu/p-6409735.html
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服客服 - 聯系我們

[email protected] 2017-2018 zhuanlichaxun.net網站版權所有
經營許可證編號:粵ICP備17046363號-1 
 


收起
展開
山东11选5中奖结果走势图