• / 11
  • 下載費用:30 金幣  

一種基于模糊分詞的非多字詞錯誤自動校對方法.pdf

摘要
申請專利號:

CN201510361877.8

申請日:

2015.06.26

公開號:

CN104991889A

公開日:

2015.10.21

當前法律狀態:

授權

有效性:

有權

法律詳情: 授權|||實質審查的生效IPC(主分類):G06F 17/27申請日:20150626|||公開
IPC分類號: G06F17/27 主分類號: G06F17/27
申請人: 江蘇科技大學
發明人: 劉亮亮; 吳健康
地址: 212003江蘇省鎮江市夢溪路2號
優先權:
專利代理機構: 南京蘇高專利商標事務所(普通合伙)32204 代理人: 許丹丹
PDF完整版下載: PDF下載
法律狀態
申請(專利)號:

CN201510361877.8

授權公告號:

||||||

法律狀態公告日:

2018.02.02|||2015.11.18|||2015.10.21

法律狀態類型:

授權|||實質審查的生效|||公開

摘要

本發明公開了一種基于模糊分詞的非多字詞錯誤自動校對方法,該方法基于正確詞詞典與錯字詞詞典進行精確切分,生成詞圖,然后利用模糊匹配算法計算中文詞串的相似度,對精確切分的散串進行模糊匹配,將模糊匹配的結果加入到詞圖中,形成模糊詞圖,最后利用結合相似度的詞的二元模型來計算模糊詞圖的最短路徑,從而實現漢語非多字詞錯誤的自動校對。本發明提供的基于模糊分詞的非多字詞錯誤自動校對方法,系統響應快、精度符合實際應用需求,有效性和準確性高。

權利要求書

權利要求書
1.  一種基于模糊分詞的非多字詞錯誤自動校對方法,其特征在于通過模糊分詞的方法進行自動校對,包括以下步驟:
1)利用基于正確詞詞典和錯字詞詞典建立的雙數組Tire樹結構,采用最大匹配方法對中文句子進行精確切分,建立精確分詞詞圖,并對基于錯字詞詞典進行精確切分的結果進行標記,同時將所述中文句子與錯字詞詞典匹配的錯字詞對應的正確詞加入到詞圖中;
2)采用模糊匹配方法對精確切分的分詞結果中的散串進行模糊匹配,得到與散串對應的相似的詞及其相似度,將得到的與散串對應的相似的詞加入到精確分詞詞圖,形成模糊分詞詞圖;
3)基于結合相似度的詞的二元模型,計算模糊分詞詞圖的最短路徑,從而得到最終的切分結果,標記切分結果中的模糊匹配節點對應的原串為發現的錯誤,以實現漢語非多字詞錯誤自動校對。

2.  根據權利要求1所述的基于模糊分詞的非多字詞錯誤自動校對方法,其特征在于所述步驟1)包括以下步驟:
步驟11)建立正確詞詞典的雙數組Trie樹結構DicTrie;
步驟12)建立錯字詞詞典的雙數組Trie樹結構TypoDicTrie:(TypoWord,CorrectWord),其中TypoWord為錯字詞,CorrectWord為該錯字詞對應的正確詞;
步驟13)基于正確詞詞典的雙數組Trie樹結構DicTrie,采用最大匹配方法對所述中文句子進行精確切分,將切分后的詞加入到詞圖中建立精確分詞詞圖;
步驟14)基于錯字詞詞典的雙數組Trie樹結構TypoDicTrie,采用最大匹配方法對所述中文句子進行精確切分,并對句子進行標記:將句子中搜索出的錯字詞詞典中的錯字詞TypoWord標記為錯誤的詞,并標記出與其對應的正確詞CorrectWord;同時將句子中的各錯詞詞TypoWord對應的正確詞CorrectWord加入到精確分詞詞圖中。

3.  根據權利要求1所述的基于模糊分詞的非多字詞錯誤自動校對方法,其特征在于所述步驟2)包括:
遍歷通過步驟1)精確分詞后的中文句子中的字符,對各字符采用模糊匹配方法進行模糊匹配;計算模糊匹配上的字符串和與其對應的散串的相似度;判斷相似度是否不小于閾值tw,對相似度不小于閾值的模糊匹配上的字符串作為與其對應的散串的相似的詞,并將其作為模糊匹配節點加入到精確分詞詞圖中形成模糊分詞詞圖,直到句子中的字 符被遍歷完;
其中所述計算模糊匹配上的字符串W2和與其對應的散串W1的相似度為:
Sim(W1,W2)=1-editdis(W1W2)max(m,n)---(1);]]>
其中:中文串W1=c1c2...cn,W2=d1d2...dm,editdis(W1,W2)為兩個字符串的距離函數:
editdis(W1,W2)=max{editdis(c2...cn,d1...dm)+1editdis(c1...cn,d2...dm)+1editdis(c2...cn,d1...dm)+1(1-sim(c1,d1))---(2);]]>
其中:sim(ci,di)為漢字ci與di的相似度:

其中:PSim(ci,di)為漢字ci和漢字di的拼音相似度,SSim(ci,di)為漢字ci和漢字di的形相似度,α和β分別表示拼音相似度和形相似度的權重,α+β=1。

4.  根據權利要求3所述的基于模糊分詞的非多字詞錯誤自動校對方法,其特征在于:所述模糊匹配方法是通過單字替換、多字替換或缺字替換來進行的,所述單字替換為基于形相似的單字替換和/或基于音相似的單字替換。

5.  根據權利要求3所述的基于模糊分詞的非多字詞錯誤自動校對方法,其特征在于:對于用于用戶輸入法為拼音輸入法或語音輸入法的漢語非多字詞錯誤自動校對方法,所述拼音相似度的權重α=1,形相似度的權重β=0。

6.  根據權利要求3所述的基于模糊分詞的非多字詞錯誤自動校對方法,其特征在于:對于用于OCR識別糾錯的漢語非多字詞錯誤自動校對方法,所述拼音相似度的權重α=0,形相似度的權重β=1。

7.  根據權利要求3所述的基于模糊分詞的非多字詞錯誤自動校對方法,其特征在于:對于用于用戶輸入法為拼音輸入法和字形輸入法的漢語非多字詞錯誤自動校對方法,所述拼音相似度的權重α=0.5,形相似度的權重β=0.5。

8.  根據權利要求3所述的基于模糊分詞的非多字詞錯誤自動校對方法,其特征在于所述步驟3)包括以下步驟:
步驟31)基于步驟1)對句子進行精確分詞和步驟2)對句子進行模糊匹配后得 到的模糊分詞詞圖,得到多條路徑,結合步驟2)得到的與散串對應的相似的詞及其相似度,采用二元模型計算每種切分序列的概率:
W*=argmaxWP(W)=argmaxWp(W1)Πi=2np(Wi|Wi-1)*α(Wi-1,W)---(4);]]>
其中W為詞圖中的某一條分詞路徑,Wi為路徑中的第i個詞,n是分詞路徑中詞的個數;α(Wi-1,W′)表示對句子分詞過程中原串為與模糊匹配節點對應的散串給予的懲罰值,當當前詞是精確切分時α(Wi-1,W′)=1,否則α(Wi-1,W′)=sim(Wi-1,W′),即句子中模糊匹配的原串W′與匹配上的詞Wi-1的相似度,也稱為模糊匹配上的字符串Wi-1和與其對應的散串W′的相似度;
步驟32)根據步驟31)得到的模糊分詞詞圖,利用圖的Dijkstra算法求解最短路徑,從而得到最終的切分結果;
步驟33)對最短路徑中的模糊匹配節點,標記其對應的原串為含有錯別字的詞,并且模糊匹配得到的相似的詞為其對應正確的詞,從而實現了漢語非多字詞錯誤自動校對。

9.  根據權利要求3所述的基于模糊分詞的非多字詞錯誤自動校對方法,其特征在于,所述閾值tw為0.95。

說明書

說明書一種基于模糊分詞的非多字詞錯誤自動校對方法
技術領域
本發明涉及人工智能計算機領域中的自然語言處理,特別涉及中文文本自動校對領域。
背景技術
隨著信息處理技術和互聯網的高速發展,傳統的文本工作幾乎全部被計算機所取代,電子書、電子報紙、電子郵件、辦公文件等電子文本、博客、微博等都成為人們日常生活的一部分,然而文本中的錯誤也越來越多,這給校對工作帶來了很大的挑戰。傳統的人工校對效率低、強度大、周期長顯然不能滿足文本校對的需求。
文本自動校對是自然語言處理的主要應用之一,也是自然語言理解的難題。隨著技術的發展,英文文本自動校對取得非常好的效果,已經商業化。相比與英文,漢語文本自動校對有以下幾個難題:
1)中文文本校對沒有類似于英文的“非詞錯誤”——不在字典中的詞,可以通過查字典來發現錯誤;中文文本中的漢字都會出現在字典中。
2)中文文本校對首先要進行中文分詞,如果一個詞中出現錯別字,在分詞的時候會分成單字散串——非多字詞錯誤,這對中文文本的查錯方法帶來了難度。
3)中文中出現單字散串不一定有錯別字,因為中文單字成詞的能力非常強;
4)除了非多字詞錯誤以外,中文中常把一個詞寫錯成另外一個詞典中的詞,這種錯誤稱為真詞錯誤,這也是中文文本自動校對的難點;
針對上述幾個問題,本發明提出并且實現了中文非多字詞錯誤的自動查錯和自動校對方法。
發明內容
發明目的:為了克服現有技術中存在的不足,本發明提供一種基于模糊分詞的非多字詞錯誤自動校對方法。
技術方案:為解決上述技術問題,本發明提供一種基于模糊分詞的非多字詞錯誤自動校對方法,該方法通過模糊分詞的方法進行自動校對,包括以下步驟:
1)利用基于正確詞詞典和錯字詞詞典建立的雙數組Tire樹結構,采用最大匹配方法對中文句子進行精確切分,建立精確分詞詞圖,并對基于錯字詞詞典進行精確切分的結果進行標記,同時將所述中文句子與錯字詞詞典匹配的錯字詞對應的正確詞加 入到詞圖中;
2)采用模糊匹配方法對精確切分的分詞結果中的散串進行模糊匹配,得到與散串對應的相似的詞及其相似度,將得到的與散串對應的相似的詞加入到精確分詞詞圖,形成模糊分詞詞圖;
3)基于結合相似度的詞的二元模型,計算模糊分詞詞圖的最短路徑,從而得到最終的切分結果,標記切分結果中的模糊匹配節點對應的原串為發現的錯誤,以實現漢語非多字詞錯誤自動校對。
優選的,所述步驟1)包括以下步驟:
步驟11)建立正確詞詞典的雙數組Trie樹結構DicTrie;
步驟12)建立錯字詞詞典的雙數組Trie樹結構TypoDicTrie:(TypoWord,CorrectWord),其中TypoWord為錯字詞,CorrectWord為該錯字詞對應的正確詞;
步驟13)基于正確詞詞典的雙數組Trie樹結構DicTrie,采用最大匹配方法對所述中文句子進行精確切分,將切分后的詞加入到詞圖中建立精確分詞詞圖;
步驟14)基于錯字詞詞典的雙數組Trie樹結構TypoDicTrie,采用最大匹配方法對所述中文句子進行精確切分,并對句子進行標記:將句子中搜索出的錯字詞詞典中的錯字詞TypoWord標記為錯誤的詞,并標記出與其對應的正確詞CorrectWord;同時將句子中的各錯詞詞TypoWord對應的正確詞CorrectWord加入到精確分詞詞圖中。
優選的,所述步驟2)包括:
遍歷通過步驟1)精確分詞后的中文句子中的字符,對各字符采用模糊匹配方法進行模糊匹配;計算模糊匹配上的字符串和與其對應的散串的相似度;判斷相似度是否不小于閾值tw,對相似度不小于閾值的模糊匹配上的字符串作為與其對應的散串的相似的詞,并將其作為模糊匹配節點加入到精確分詞詞圖中形成模糊分詞詞圖,直到句子中的字符被遍歷完;
其中所述計算模糊匹配上的字符串W2和與其對應的散串W1的相似度為:

其中:中文串W1=c1c2…cn,W2=d1d2…dm,editdis(W1,W2)為兩個字符串的距離函數:

其中:sim(ci,di)為漢字ci與di的相似度:

其中:PSim(ci,di)為漢字ci和漢字di的拼音相似度,SSim(ci,di)為漢字ci和漢字di的形相似度,α和β分別表示拼音相似度和形相似度的權重,α+β=1。
優選的,上述模糊匹配方法是通過單字替換、多字替換或缺字替換來進行的,所述單字替換為基于形相似的單字替換和/或基于音相似的單字替換。
優選的,對于用于用戶輸入法為拼音輸入法或語音輸入法的漢語非多字詞錯誤自動校對方法,所述拼音相似度的權重α=1,形相似度的權重β=0。
作為優選的,對于用于OCR識別糾錯的漢語非多字詞錯誤自動校對方法,所述拼音相似度的權重α=0,形相似度的權重β=1。
優選的,對于用于用戶輸入法為拼音輸入法和字形輸入法的漢語非多字詞錯誤自動校對方法,所述拼音相似度的權重α=0.5,形相似度的權重β=0.5。
優選的,所述步驟3)包括以下步驟:
步驟31)基于步驟1)對句子進行精確分詞和步驟2)對句子進行模糊匹配后得到的模糊分詞詞圖,得到多條路徑,結合步驟2)得到的與散串對應的相似的詞及其相似度,采用二元模型計算每種切分序列的概率:

其中W為詞圖中的某一條分詞路徑,Wi為路徑中的第i個詞,n是分詞路徑中詞的個數;α(Wi-1,W′)表示對句子分詞過程中原串為與模糊匹配節點對應的散串給予的懲罰值,當當前詞是精確切分時α(Wi-1,W′)=1,否則α(Wi-1,W′)=sim(Wi-1,W′),即句子中模糊匹配的原串W'與匹配上的詞Wi-1的相似度,也稱為模糊匹配上的字符串Wi-1和與其對應的散串W'的相似度;
步驟32)根據步驟31)得到的模糊分詞詞圖,利用圖的Dijkstra算法求解最短 路徑,從而得到最終的切分結果;
步驟33)對最短路徑中的模糊匹配節點,標記其對應的原串為含有錯別字的詞,并且模糊匹配得到的相似的詞為其對應正確的詞,從而實現了漢語非多字詞錯誤自動校對。
優選的,上述閾值tw為0.95。
有益效果:本發明提出了一種基于模糊分詞的非多字詞錯誤自動校對方法。該方法能在分詞的過程中有效的對漢語文本中的“非多字詞錯誤”進行識別和校對,并且采用的基于雙數組Trie樹的方法能快速的進行模糊分詞。實驗表明,本發明提供的模糊分詞的“非多字詞錯誤”自動校對的方法召回率達到75.9%,精度達到85%,糾正率達62%,糾錯準確率達81.7%。系統響應快、精度符合實際應用需求,有效性和準確性高,具有較高的實用性。
附圖說明
圖1本發明提供的的模糊切分詞圖示例。
具體實施方式
下面結合附圖和實施例對本發明作更進一步的說明。
本發明提供的一種基于模糊分詞的非多字詞錯誤自動校對方法,基于模糊分詞的方法進行自動校對,包括以下步驟:
1)利用基于正確詞詞典和錯字詞詞典建立的雙數組Tire樹結構,采用最大匹配方法對中文句子進行精確切分,建立精確分詞詞圖,并對基于錯字詞詞典進行精確切分的結果進行標記,同時將所述中文句子與錯字詞詞典匹配的錯字詞對應的正確詞加入到詞圖中。具體為:
首先利用正確詞詞典與錯字詞詞典進行精確分詞,建立精確分詞詞圖,其中:
S:待切分的句子;Dic1:正確詞詞典,Dic2:錯字詞詞典,po1:正確詞典查找位置;pos2:錯字詞詞典查找位置。
步驟11)建立正確詞詞典Dic1的雙數組Trie樹結構DicTrie;
步驟12)建立錯字詞詞典Dic2的雙數組Trie樹結構TypoDicTrie:(TypoWord,CorrectWord),其中TypoWord為錯字詞,CorrectWord為該錯字詞對應的正確詞;例如(無緣無古,無緣無故);
步驟13)基于正確詞詞典的雙數組Trie樹結構DicTrie,采用最大匹配方法對所述中文句子進行精確切分,將切分后的詞加入到詞圖中建立精確分詞詞圖,如圖1所示,本 實施例在詞圖中用實線框表示精確切分;
本實施例中為:利用正確詞典Dic1從pos1(初始設置為0)位置前向最大搜索,假設搜索出正確詞詞條word1,將其加入精確分詞詞圖,pos1更新為word1之后的位置;否則pos1指向當前位置的下一個字;重復搜索直到pos1執行到句子S的末尾;步驟14)基于錯字詞詞典的雙數組Trie樹結構TypoDicTrie,采用最大匹配方法對所述中文句子進行精確切分,并對句子進行標記:將句子中搜索出的錯字詞詞典中的錯字詞TypoWord標記為錯誤的詞,并標記出與其對應的正確詞CorrectWord;同時將句子中的各錯詞詞TypoWord對應的正確詞CorrectWord加入到精確分詞詞圖中,如圖1所示,本實施例在詞圖中用虛線框表示。
本實施例中為:利用錯誤詞典Dic2從pos2(初始設置為0)位置前向最大搜索,若搜索出錯字詞TypoWord,將其對應的正確詞條CorrectWord加入精確分詞詞圖,并對句子中的錯字詞及其對應的正確詞進行標記,pos2更新為TypoWord之后的位置;否則pos2指向當前位置的下一個字;重復搜索直到pos1執行到句子S的末尾。
舉例,句子S="你們為什么經常無原無故扣取我的活費"。
經過上述步驟13)精確分詞后,結果如圖1所示,“你們”、“為什么”、“經常”、“無”、“原”、“無故”、“扣”、“取”、“我”、“的”、“活”、“費”為精確切分的結果,在詞圖中用實線框表示;
經過上述步驟14)精確分詞后,結果如圖1所示,其中因為(無原無故,無緣無故)是錯字詞詞典中的詞,利用其進行分詞后、“無”、“原”、“無故”替換后為“無緣無故”,在詞圖中用虛線框表示。
2)采用模糊匹配方法對精確切分的分詞結果中的散串進行模糊匹配,得到與散串對應的相似的詞及其相似度,將得到的與散串對應的相似的詞加入到精確分詞詞圖,形成模糊分詞詞圖。具體包括:
遍歷通過步驟1)精確分詞后的中文句子中的字符,對各字符采用模糊匹配方法進行模糊匹配,所述模糊匹配方法是通過單字替換、多字替換或缺字替換來進行的,所述單字替換為基于形相似的單字替換和/或基于音相似的單字替換;通過中文串相似度公式計算模糊匹配上的字符串和與其對應的散串的相似度;判斷相似度是否不小于閾值tw,對相似度不小于閾值的模糊匹配上的字符串作為與其對應的散串的相似的詞,并將其作為模糊匹配節點加入到精確分詞詞圖中形成模糊分詞詞圖,直到句子中的字符被遍歷完; 上述通過中文串相似度公式計算模糊匹配上的字符串W2和與其對應的散串W2的相似度為:

其中:中文串W1=c1c2…cn,W2=d1d2…dm,editdis(W1,W2)為兩個字符串的距離函數:

其中:sim(ci,di)為漢字ci與di的相似度:

其中:PSim(ci,di)為漢字ci和漢字di的拼音相似度,SSim(ci,di)為漢字ci和漢字di的形相似度,α和β分別表示拼音相似度和形相似度的權重,α+β=1。
對于用于用戶輸入法為拼音輸入法或語音輸入法的漢語非多字詞錯誤自動校對方法,所述拼音相似度的權重α=1,形相似度的權重β=0。
對于用于OCR識別糾錯的漢語非多字詞錯誤自動校對方法,所述拼音相似度的權重α=0,形相似度的權重β=1。
對于用于用戶輸入法為拼音輸入法和字形輸入法的漢語非多字詞錯誤自動校對方法,所述拼音相似度的權重α=0.5,形相似度的權重β=0.5。
具體在本實施例中,通過以下步驟來實現的:
步驟20)給定中文句子的起始匹配的位置nCurr=0;
步驟21)從中文句子的當前位置nCurr,讀入當前字符,對當前字符進行模糊匹配;
在模糊的過程中,當前位置的字可以是單字替換(通過字的形相似或音相似替換)、也可以是多字或缺字來計算相似度;
步驟22)利用中文串相似度公式計算兩個字符串的相似度,即句子中模糊匹配的原串與匹配上的詞的相似度,也可稱為模糊匹配上的字符串和與其對應的散串的相似度,例如附圖1中:
“無原”通過對“原”的拼音相似度和形相似度計算得到相似漢字“緣”等,利用中文 串相似度計算公式(1),計算中文串“無原”與漢語詞典中的詞“無緣”的相似度。
本實施例中用戶輸入法為拼音輸入法和字形輸入法,因此設定α=β=0.5;
步驟23)如果相似度小于閾值tw,則nCurr=nCurr+1,進入步驟21),否則進入步驟24);因為漢字的混淆度是非常高的,本實施例中,所述閾值tw為0.95,當然也可以根據實際應用進行調整,如0.90、0.92、0.98等;
步驟24)則相似度不小于閾值tw,得到一組相似的詞和相似度(sFuzzyWord,next,sim),sFuzzyWord為匹配上的詞,next為下一個要讀入去進行模糊匹配的節點位置(next=nCur+1),sim是相似度,為從起始位置nCurr開始到匹配終止的位置的原串與sFuzzyWord進行計算相似度計算得到;如果next位置為句子的長度,則結束,否則更新nCurr為下一個要讀入的位置next,跳回步驟21);
步驟25)將模糊匹配的相似度不小于閾值tw的相似的詞,作為模糊匹配節點加入到精確分詞詞圖,形成模糊分詞詞圖;如圖1所示,本實施例在詞圖中用虛線框表示。
在本實施例圖1給出的示例中,散串“無”、“原”通過音相似模糊匹配找到詞典中的詞“無緣”,散串“活”、“費”通過形相似和缺字模糊匹配找到詞典中的“話費”、“生活費”,將這些模糊匹配的節點加入到詞圖中,在詞圖中用虛線框表示。
3)基于結合相似度的詞的二元模型,計算模糊分詞詞圖的最短路徑,從而得到最終的切分結果,標記切分結果中的模糊匹配節點對應的原串為發現的錯誤,以實現漢語非多字詞錯誤自動校對。具體包括:
步驟31)基于步驟1)對句子進行精確分詞和步驟2)對句子進行模糊匹配后得到的模糊分詞詞圖,得到多條路徑,結合步驟2)得到的與散串對應的相似的詞及其相似度,采用二元模型計算每種切分序列的概率:

本發明采用結合相似度的詞的二元模型來計算切分后的概率,對模糊切分的結果,加上一定的懲罰:其中W為詞圖中的某一條分詞路徑,Wi為路徑中的第i個詞,n是分詞路徑中詞的個數;α(Wi-1,W′)表示對句子分詞過程中原串為與模糊匹配節點對應的散串給予的懲罰值,如果當前詞是精確切分,α(Wi-1,W′)=1,否則α(Wi-1,W′)=sim(Wi-1,W′),即句子中模糊匹配的原串W'與匹配上的詞Wi-1的相似度,也可稱為模 糊匹配上的字符串Wi-1和與其對應的散串W'的相似度;
步驟32)根據步驟31)得到的模糊分詞詞圖,利用圖的Dijkstra算法求解最短路徑,從而得到最終的切分結果;
步驟33)對最短路徑中的模糊匹配節點,標記其對應的原串為含有錯別字的詞,并且模糊匹配得到的相似的詞為其對應正確的詞,從而實現了漢語非多字詞錯誤自動校對。
如圖1給出的本實施例的示例中,經過精確分詞與模糊分詞生成的詞圖,采用結合相似度的二元模型對該圖進行最短路徑求解,得到路徑:Path={“S”、“你們”、“經常”、“為什么”、“無緣無故”、“扣”、“取”、“我”、“的”、“話費”}概率最大,即是圖的最短路徑,其中路徑中虛線框節點“無緣無故”、“話費”為模糊匹配的節點,則原句子中的原串“無原無故”、“活費”中包含錯別字,與模糊匹配正確的詞“無緣無故”、“話費”比較,“原”、“活”為句子中的錯別字,“無原無故”、“活費”即為非多字詞錯誤。
四、實驗
經歷過多次開放的測試,實驗采用2萬行句子的測試語料,其中包含664處非多字詞錯誤,其中非多字詞錯誤包括別字替換型非多字詞錯誤、字插入型非多字詞錯誤以及字刪除型非多字詞錯誤。實驗結果表明,本發明提供的非多字詞錯誤識別召回率達到75.9%,精度為85%,糾正率達到62%,糾錯準確率為81.7%,這一精度超過了現有技術,達到了實際應用的需求,具有較高的有效性和準確性。
以上實施列僅是本發明的較佳實施例,對本發明不構成限定,相關工作人員在不偏離本發明技術思想的范圍內,所進行的任何修改、等同替換、改進等,均落在本發明的保護范圍內。

關 鍵 詞:
一種 基于 模糊 分詞 多字 錯誤 自動 校對 方法
  專利查詢網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
關于本文
本文標題:一種基于模糊分詞的非多字詞錯誤自動校對方法.pdf
鏈接地址:http://www.rgyfuv.icu/p-6381687.html
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服客服 - 聯系我們

[email protected] 2017-2018 zhuanlichaxun.net網站版權所有
經營許可證編號:粵ICP備17046363號-1 
 


收起
展開
山东11选5中奖结果走势图