• / 12
  • 下載費用:30 金幣  

用于自動通譯的設備和方法.pdf

摘要
申請專利號:

CN201510101076.8

申請日:

2015.03.06

公開號:

CN104899192A

公開日:

2015.09.09

當前法律狀態:

授權

有效性:

有權

法律詳情: 授權|||實質審查的生效IPC(主分類):G06F 17/28申請日:20150306|||公開
IPC分類號: G06F17/28; G10L15/26 主分類號: G06F17/28
申請人: 韓國電子通信研究院
發明人: 李秀鐘; 金相勛; 金政世; 樸相奎
地址: 韓國大田市
優先權: 10-2014-0027275 2014.03.07 KR
專利代理機構: 北京市柳沈律師事務所11105 代理人: 李芳華
PDF完整版下載: PDF下載
法律狀態
申請(專利)號:

CN201510101076.8

授權公告號:

||||||

法律狀態公告日:

2018.03.27|||2015.10.07|||2015.09.09

法律狀態類型:

授權|||實質審查的生效|||公開

摘要

提供了用于自動通譯的設備和方法。所述用于自動通譯的設備包括:輸入單元,用于接收源語言的說話聲音;語音識別單元,用于通過對源語言的說話聲音進行語音識別,來生成語音識別語句;通譯單元,用于將該語音識別語句轉換為目標語言的文本語句;說話聲音生成單元,按照目標語言和源語言來生成發音符號,用于對方國家中的用戶通過使用語音翻譯數據庫來再現或可視識別語音識別語句以及目標語言的文本語句;和輸出單元,用于按照目標語言和源語言的每一個來輸出所述語音識別語句、所述文本語句、和所述發音符號。

權利要求書

權利要求書
1.  一種用于自動通譯的設備,包括:
輸入單元,用于接收源語言的說話聲音;
語音識別單元,用于通過對源語言的說話聲音進行語音識別,來生成語音識別語句;
通譯單元,用于將該語音識別語句轉換為目標語言的文本語句;
說話聲音生成單元,按照目標語言和源語言的每一個生成發音符號,用于對方國家中的用戶通過使用語音翻譯數據庫來再現或可視識別所述語音識別語句以及所述目標語言的文本語句;和
輸出單元,用于按照目標語言和源語言來輸出所述語音識別語句、所述文本語句、和所述發音符號。

2.  根據權利要求1的用于自動通譯的設備,其中該輸入單元通過麥克風接收韓文和中文之一的說話聲音,或者通過文本輸入模塊來接收韓文和中文之一的文本語句。

3.  根據權利要求1的用于自動通譯的設備,其中該語音翻譯數據庫存儲韓文翻譯單詞數據以將中文語句的說話聲音抄寫為韓文發音符號,并存儲中文翻譯單詞數據以將韓文語句的說話聲音抄寫為中文發音符號。

4.  根據權利要求1的用于自動通譯的設備,其中該韓文翻譯單詞數據包括通過將拼音劃分為發音單元、而與中文發音單元對應的韓文發音符號的映射信息,
其中所述拼音是中文羅馬字母表中書寫的發音符號,包括中文字符的發音的4個聲調。

5.  根據權利要求3的用于自動通譯的設備,其中所述中文翻譯單詞數據將韓文音節劃分為首音、中間音和尾音,并包括利用拼音或羅馬字母表的發音符號映射的首音、中間音和尾音中的每一個的信息。

6.  根據權利要求1的用于自動通譯的設備,其中所述用于自動通譯的設備在移動終端的應用中實現。

7.  一種用于自動通譯的方法,包括:
接收源語言的說話聲音;
通過對源語言的說話聲音進行語音識別,來生成語音識別語句并輸出;
按照目標語言生成發音符號并輸出,用于對方國家中的用戶通過使用語音翻譯數據庫來再現或可視識別所述語音識別語句;
將所述語音識別語句轉換為目標語言的文本語句,并輸出結果;和
按照源語言生成發音符號并輸出,用于對方國家中的用戶通過使用語音翻譯數據庫來再現或可視識別所述目標語言的文本語句。

8.  根據權利要求7的用于自動通譯的方法,其中所述接收源語言的說話聲音的步驟包括:
通過麥克風接收韓文和中文之一的說話聲音;或
通過文本輸入模塊來接收韓文和中文之一的文本語句。

9.  根據權利要求7的用于自動通譯的方法,其中該語音翻譯數據庫存儲韓文翻譯單詞數據以將中文語句的說話聲音抄寫為韓文發音符號,并存儲中文翻譯單詞數據以將韓文語句的說話聲音抄寫為中文發音符號。

10.  根據權利要求9的用于自動通譯的方法,其中該韓文翻譯單詞數據包括通過將拼音劃分為發音單元、而與中文發音單元對應的韓文發音符號的映射信息,
其中所述拼音是中文羅馬字母表中書寫的發音符號,包括中文字符的發音的4個聲調。

11.  根據權利要求9的用于自動通譯的方法,其中所述中文翻譯單詞數據將韓文音節劃分為首音、中間音和尾音,并包括利用拼音或羅馬字母表的發音符號映射的首音、中間音和尾音中的每一個的信息。

說明書

說明書用于自動通譯的設備和方法
相關申請的交叉引用
該申請要求2014年3月7日提交的名為“Apparatus and method for automatic interpretation”的韓國專利申請第10-2014-0027275號的權益,由此通過援引將其全部合并在該申請中。
技術領域
本發明涉及用于韓文和中文之間的自動通譯(interpretation)的設備和方法。
背景技術
韓中自動通譯設備是允許講韓文或中文并且不知道其他人的語言的人彼此交流(communicate)的裝置,并且包括源語言的發聲(vocalization)、語音識別語句的生成、自動通譯為目標語言并按照目標語言輸出合成聲音(complex sound)。源語言的說話(uttered)聲音被轉換為源語言的文本,通過自動通譯與目標語言的語句相互關聯,并然后作為目標語言的聲音輸出。然而,由于這樣的說話聲音立即消失,所以幾乎(virtually)不可能記得或直接再現該說話聲音用于交流。此外,由于在具有低使用頻率的專有名詞(proper nouns)的情況或噪音環境下,語音識別性能迅速惡化,所以存在通過在用于自動通譯的設備中直接輸入文本而交流、或直接說出對方國家中使用的語言的需求。應該盡可能地提供積極利用該自動通譯功能的附加界面(interface)以便處置該情形。
發明內容
本發明提供了用于自動通譯的設備和方法,其對源語言的說話聲音進行語音識別,生成語音識別語句,將該語句的說話聲音抄寫(transcribes)為目標語言的文本,提供目標語言的自動通譯語句,并在源語言的文本中抄寫 該語句的說話聲音。
根據本發明的一個方面,提供了一種用于自動通譯的設備。
根據本發明實施例的用于自動通譯的設備包括:輸入單元,用于接收源語言的說話聲音;語音識別單元,用于通過對源語言的說話聲音進行語音識別,來生成語音識別語句;通譯單元,用于將該語音識別語句轉換為目標語言的文本語句;說話聲音生成單元,按照目標語言和源語言的每一個生成發音符號,用于對方國家中的用戶通過使用語音翻譯數據庫來再現或可視識別語音識別語句以及目標語言的文本語句;和輸出單元,用于按照目標語言和源語言的每一個來輸出所述語音識別語句、所述文本語句、和所述發音符號。
該輸入單元通過麥克風接收韓文和中文之一的說話聲音,或者通過文本輸入模塊來接收韓文和中文之一的文本語句。
該語音翻譯數據庫存儲韓文翻譯單詞數據以將中文語句的說話聲音抄寫為韓文發音符號,并存儲中文翻譯單詞數據以將韓文語句的說話聲音抄寫為中文發音符號。
該韓文翻譯單詞數據包括在將拼音劃分為發音單元之后、而與中文發音單元對應的韓文發音符號的映射信息,其中所述拼音是中文羅馬字母表中書寫的發音符號,包括中文字符的發音的4個聲調(tones)。
所述中文翻譯單詞數據將韓文音節(syllable)劃分為首音、中間音和尾音,并包括利用拼音或羅馬字母表的發音符號映射的首音、中間音和尾音中的每一個的信息。
所述用于自動通譯的設備在移動終端的應用中實現。
根據本發明的另一方面,提供了由用于自動通譯的設備執行的用于自動通譯的方法。
根據本發明的實施例的用于自動通譯的方法包括:接收源語言的說話聲音;通過對源語言的說話聲音進行語音識別,來生成語音識別語句并輸出;按照目標語言生成發音符號并輸出,用于對方國家中的用戶通過使用語音翻譯數據庫來再現或可視識別語音識別語句;將所述語音識別語句轉換為目標語言的文本語句,并輸出結果;和按照源語言生成發音符號并輸出,用于對方國家中的用戶通過使用語音翻譯數據庫來再現或可視識別目標語言的文本語句。
所述接收源語言的說話聲音的步驟包括:通過麥克風接收韓文和中文之一的說話聲音;或通過文本輸入模塊來接收韓文和中文之一的文本語句。
該語音翻譯數據庫存儲韓文翻譯單詞數據以將中文語句的說話聲音抄寫為韓文發音符號,并存儲中文翻譯單詞數據以將韓文語句的說話聲音抄寫為中文發音符號。
該韓文翻譯單詞數據包括通過將拼音劃分為發音單元、而與中文發音單元對應的韓文發音符號的映射信息,其中所述拼音是中文羅馬字母表中書寫的發音符號,包括中文字符的發音的4個聲調。
所述中文翻譯單詞數據將韓文音節劃分為首音、中間音和尾音,并包括利用拼音或羅馬字母表的發音符號映射的首音、中間音和尾音中的每一個的信息。
本發明允許對源語言的說話聲音進行語音識別,生成語音識別語句,將該語句的說話聲音抄寫為目標語言的文本,提供目標語言的自動通譯語句,并在源語言的文本中抄寫該語句的說話聲音,使得能夠通過直接講對方國家的語言而幫助交流。
附圖說明
圖1是用于韓文和中文之間的自動通譯的設備的示意圖。
圖2是圖示了圖1的用于自動通譯的設備中的用于韓文和中文之間的自動通譯的方法的流程圖。
圖3是在語音翻譯數據庫中構建的示范數據。
具體實施方式
盡管已參考特定實施例描述了本發明,但是要理解的是,本領域技術人員可進行各種改變和修改,而不脫離所附權利要求及其等效定義的本發明的精神和范圍。
貫穿本發明的描述,當描述某一技術被確定為規避(evade)本發明的點時,將省略相關詳細描述。同時標號可用來描述各個組件,并且僅用來區分一個組件與另一組件。
當一個元件被描述為“連接”或“接入(accessed)”到另一元件時,其 應被解釋為直接連接或接入到另一元件,但是也可能在其間具有另一元件。
下面將參考附圖來更詳細地描述本發明的示范實施例,其中那些組件和相同或對應的組件具有相同附圖標記,而不管圖號,并且省略重復說明。
圖1是用于韓文和中文之間的自動通譯的設備的示意圖。
參考圖1,用于自動通譯的設備包括輸入單元10、語音識別單元20、通譯單元30、說話聲音生成單元40、輸出單元50、翻譯數據庫60、和通譯引擎70。
輸入單元10接收源語言的說話聲音。例如,輸入單元10可通過麥克風接收韓文和中文之一的說話聲音,或者通過文本輸入模塊來接收韓文和中文之一的文本語句。這里,輸入單元10可將接收的語句直接傳送到通譯單元30。
語音識別單元20對于接收的源語言的說話聲音執行語音識別,并生成語音識別語句。例如,語音識別單元20通過對于接收的源語言的說話聲音執行信號處理來檢測語音活動性(activity),并然后提取用于語音活動性的語音特征。語音識別單元20基于語音數據庫和語言數據庫來建立聲學(acoustic)模型、發音字典、語言模型,并形成全部集成在其中的認知網絡。語音識別單元20可通過認知網絡將提取的語音特征轉換為語音識別文本語句,并將轉換的語音識別文本語句通過輸出單元50輸出到用戶屏幕。
例如,當發出語音(phonated)源語言的(其是韓文的你好)時,語音識別單元20生成要在用戶屏幕上輸出的語音識別語句。
通譯單元30通過使用通譯引擎70而將源語言的語音識別語句或輸入的語句轉換為目標語言的文本語句。
例如,當語音識別語句是(其是韓文的你好)時,通譯單元30將(其是韓文的你好)通譯為中文字符“你好”(其是中文的你好)。
說話聲音生成單元40按照目標語言和源語言的每一個生成發音符號,用于對方國家中的用戶通過使用語音翻譯數據庫60來再現或可視識別源語言的語音識別語句以及目標語言的文本語句。
例如,當語音識別語句是(其是韓文的你好)時,說話聲音生成單元40生成如同“an-nyeong-ha-se-yo”的中文發音符號。當按照 中文轉換的文本語句是“你好”時,說話聲音生成單元40生成“(其是韓文的Ni Hao)”的韓文發音符號。
語音翻譯數據庫60存儲韓文翻譯單詞數據以將中文語句的說話聲音抄寫為韓文發音符號,并存儲中文翻譯單詞數據以將韓文語句的說話聲音抄寫為中文發音符號。
例如,圖3是在語音翻譯數據庫中構建的示范數據。下面將參考圖3來說明語音翻譯數據庫60。
中文包括除了之外的非尾音音節,并特別具有四個聲調以區分含義。這樣的特征反映在語音翻譯數據庫60中構建的數據中。
將首先說明韓文翻譯單詞數據,來將中文語句的說話聲音抄寫為韓文發音符號。
拼音是用于將中文字符的發音抄寫為中文羅馬字母表的發音符號。例如,拼音是中文羅馬字母表中抄寫的發音符號,其包括[]中的作為中文重音(accents)的四個聲調連同(其是韓文的你好)的中文字符,諸如,“你好[nǐhǎo]”。在四個聲調中,第一聲(“-”或“1”)開始于高并保持高而沒有音高(pitch)的變化,第二聲(“ˊ”或“2”)從中音高開始并前往高音高,第三聲(或“3”)從中低音高開始、降到低音高并升至中高音高,而第四聲(“ˋ”或“4”)開始于高并迅速降低到最低音高。中文可以不具有聲調。
從中文發音字典和拼音表格中提取2,441個拼音集合,并且建立與每一集合對應的韓文翻譯單詞。中文發音字典提供中文詞匯及其發音符號,諸如“你好/ni3 hao3”。這里,通過發音單元來劃分中文詞匯,并然后建立用于每一中文發音單元的韓文發音符號作為韓文翻譯單詞數據,諸如ni3/hao3/(其中是韓文的ni而是韓文的hao)。韓文發音符號也可包括中文語調(intonation)符號,被參考用于發音。
當發音中文“你好”時,通過中文g2p(字素到音素(grapheme to phoneme))轉換數據庫和認知網絡基于中韓翻譯單詞數據在中文語音識別語句中生成“你好”,并且還同時通過中文發音字典生成“ni3 hao3”。此外,能通過使用中韓翻譯單詞數據(其中是韓文的ni而是韓文的hao)來生成說話聲音的韓文發音符號這里,通過在中文發音字典中延伸拼音的一 部分用于語音識別,來重構g2p轉換數據庫。
下面將說明將韓文語句的說話聲音抄寫為中文發音符號的中文翻譯單詞數據。
將韓文音節劃分為首音、中間音和尾音,并然后通過韓文g2p轉換數據庫對其每一個進行轉換以便建立韓中翻譯單詞數據。選擇性使用拼音和羅馬單詞表抄本(transcript)的發音符號用于其中文翻譯單詞。
韓文的每一音節是3192,其中韓文包括19個首音、21個中間音、7個代表性尾音、以及其組合(包括不具有尾音的韓文,諸如)。能根據韓文g2p轉換規則來建立韓文g2p轉換表格,諸如/h a xn”、“/r o”。這里,g2p是音素單元的發音符號,其是將語音轉換為文本的單元,并能夠是用于創建發音字典的基礎。實際上,在韓中翻譯單詞數據中使用韓文g2p單元。
在構造用于韓文音節的中文翻譯單詞數據時,組合羅馬字母表抄本和拼音抄本。即,在羅馬字母表抄本和拼音抄本的組合中抄寫韓文音節之中的能用拼音表達的293種情形,但是在羅馬字母表中抄寫剩余2,899種情形。與韓文g2p對應的拼音的示例可以是“/h a xn/han"、“/r o/lo”。當難以發現拼音中的發音符號諸如“/g u xg/guk”時,將其抄寫在羅馬字母表中。韓中翻譯單詞數據可以例如是“h axn/han”、“r o/lo”、“g u xg/guk”的形式。
輸出單元50包括顯示模塊和聲音輸出模塊,并在屏幕上或通過語音輸出源語言的語音識別語句、用于該語音識別語句的目標語言的發音符號、從該語音識別語句轉換為目標語言的文本語句、以及用于轉換的文本語句的源語言的發音符號。
例如,用于自動通譯的設備能被應用到傳統自動通譯裝置或被實現為諸如智能電話的移動終端的應用。
圖2是圖示了圖1的用于自動通譯的設備中的用于韓文和中文之間的自動通譯的方法的流程圖。
在S210中,用于自動通譯的設備接收源語言的說話聲音。例如,用于自動通譯的設備通過麥克風接收韓文和中文之一的說話聲音,或者通過輸入單元10來接收韓文和中文之一的文本語句。
在S220中,用于自動通譯的設備對于接收的源語言的說話聲音執行語音識別,并生成語音識別語句。例如,用于自動通譯的設備通過對于接收的源語言的說話聲音執行信號處理來分離語音活動性,并然后提取用于語音活動性的語音特征。用于自動通譯的設備基于語音數據庫和語言數據庫來建立聲學模型、發音字典、語言模型等,并通過集成它們來生成認知網絡。用于自動通譯的設備通過認知網絡將提取的語音特征轉換為語音識別文本語句,并將轉換的語音識別文本語句輸出到用戶的屏幕。當用于自動通譯的設備通過文本輸入模塊接收韓文和中文之一的文本語句時,可省略步驟S220。
在S230中,用于自動通譯的設備按照目標語言生成發音符號,用于對方國家中的用戶來再現或可視識別源語言的語音識別語句,并通過用戶的屏幕輸出結果。例如,當語音識別語句為(其是韓文的你好)時,用于自動通譯的設備能生成“(an-nyeong-ha-se-yo)”的中文發音符號。
在S240中,用于自動通譯的設備將源語言的語音識別語句或接收的語句轉換為目標語言的文本語句,并通過用戶的屏幕輸出結果。例如,當語音識別語句為(其是韓文的你好)時,用于自動通譯的設備將(其是韓文的你好)轉換為中文字符“你好”(其意味著中文的你好)。
在S250中,用于自動通譯的設備按照源語言生成發音符號,用于對方國家中的用戶來再現或可視識別按照目標語言轉換的文本語句,并在用戶的屏幕上輸出結果。例如,當轉換為中文的文本語句是“你好”時,用于自動通譯的設備能生成的韓文發音符號。
本發明的示范實施例能通過實現計算機的方法來實現,或在計算機可運行指令中存儲的非易失性計算機記錄介質中實現。當所述指令由處理器運行時,所述指令能執行根據本發明的至少一個實施例的方法。計算機可讀介質可包括程序指令、數據文件和數據結構或這些中一個或多個的組合。
計算機可讀介質中記錄的程序指令可被特別設計用于本發明,或在本領域一般已知可用于使用。計算機可讀記錄介質的示例包括被構造為存儲和運行程序指令的硬件裝置,例如磁介質(諸如硬盤、軟盤、和磁帶)、光介質(諸如CD-ROM和DVD)、以及磁光介質(諸如軟盤、只讀存儲器(ROM)、隨機存取存儲器(RAM)、和閃存)。另外,上述介質可以是傳輸介質,諸如 包括傳送指定程序指令的信號和數據結構的載波的光、金屬線和波導(wave guide)。程序指令可包括匯編器作出的機器代碼、以及計算機可通過解釋器運行的高級語言。
上述硬件裝置可被構造以作為執行本發明的操作的一個或多個軟件模塊來操作,并且反之亦然。
盡管已參考特定實施例描述了本發明,但是本領域技術人員應理解的是,可進行各種修改和變型,而不脫離所附權利要求及其等效所限定的這里的實施例的精神和范圍。因此,這里描述的示例僅用于說明,并且不存在限制本發明的意圖。本發明的范圍應通過以下權利要求來解釋,并且應解釋的是,與以下權利要求等效的所有精神落入本發明的范圍中。
附圖標記的描述
10:輸入單元
30:通譯單元
40:說話聲音生成單元
50:輸出單元
60:翻譯數據庫
70:通譯引擎

關 鍵 詞:
用于 自動 通譯 設備 方法
  專利查詢網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
關于本文
本文標題:用于自動通譯的設備和方法.pdf
鏈接地址:http://www.rgyfuv.icu/p-6373729.html
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服客服 - 聯系我們

[email protected] 2017-2018 zhuanlichaxun.net網站版權所有
經營許可證編號:粵ICP備17046363號-1 
 


收起
展開
山东11选5中奖结果走势图