一、獲取圖像
有兩種獲取圖像的方法:
1、直接輸入磁盤上已經(jīng)有的圖像文件。
選擇【文件】菜單下的【輸入圖像文件】命令,或者點擊工具條的【輸入圖像】工具,彈出打開文件對話框,選擇要識別的圖像文件。
方正銳思3.5支持.BMP、.TIF、.JPG(JPEG)三種圖像格式。
2、通過掃描獲取圖像。
選擇【文件】菜單下的【掃描圖像】命令,或者點擊工具條的【掃描圖像】工具,通過掃描儀把印刷品掃描到方正銳思3.5里。
建議:掃描時設(shè)置掃描原稿為“文字”,掃描類型為黑白二色,分辨率最好設(shè)置為300dpi。
二、版面糾斜
掃描時若圖像傾斜,對識別效果有較大影響,需要在識別前對圖像進(jìn)行版面糾斜。方正銳思3.5的自動糾斜功能減輕了用戶的這部分工作。在缺省情況下,【文件】菜單下【選項】中的【自動傾斜校正】選項是選中的,無需用戶干預(yù)。若未選中此項,用戶也可點擊工具條中的【版面糾斜】工具,主動對版面進(jìn)行糾斜。
三、版面分析
版面分析就是對圖像進(jìn)行識別前的處理,目的是為識別作準(zhǔn)備,包括區(qū)域劃分、確定每個區(qū)域的屬性(文本、圖像、表格)等。版面分析由方正銳思3.5在識別前自動完成,用戶也可手動操作完成。
版面分析可以識別整個圖像,也可以只識別圖像部分區(qū)域的內(nèi)容。
選擇【圖像】菜單下的【版面分析】命令,或者直接點擊工具條的【版面分析】工具,方正銳思3.5會給當(dāng)前圖像劃分出若干個區(qū)域(框)。
也可以用鼠標(biāo)直接在圖像上畫矩形框。假如不選擇區(qū)域則會對整篇圖像進(jìn)行識別。
可以畫多個框,每個框都有編號,編號從0開始計數(shù)。識別時是按照框的標(biāo)號順序進(jìn)行識別的。
畫框后,可以用鼠標(biāo)拖動框邊線調(diào)整框的尺寸。用鼠標(biāo)點擊框中的區(qū)域不松開可以拖動框的位置。
未選中的框顯示為藍(lán)色,選中的框顯示為紅色,進(jìn)入【手工調(diào)整框順序】狀態(tài)的框顯示為綠色。
4、識別
設(shè)置好區(qū)域后,選擇【識別】菜單下的【識別】命令,或者點擊工具條的【識別】工具進(jìn)行識別。彈出識別進(jìn)度條:
若有多個框,則方正銳思3.5將自動按框的標(biāo)號順序進(jìn)行識別。
等待一段時間后,識別的結(jié)果顯示在后編改視圖的右上部分窗口里。右下的窗口顯示原始圖像文件。
5、后編改
在后編改視圖里對識別結(jié)果進(jìn)行修改,可對照下面窗口顯示的原始圖像糾正識別錯誤的文字。有疑問的字符顯示為藍(lán)色。
識別完成后,方正銳思3.5自動進(jìn)入后編改窗口
后編改窗口的最上面顯示出當(dāng)前光標(biāo)所在位置的字符以及前相關(guān)字符和后相關(guān)字符供選擇。
后編改窗口支持輸入和刪除,可直接進(jìn)行編輯修改。其中,輸入的字符以紫色顯示。
或者通過選擇【編輯】菜單的【上一疑問處】和【下一疑問處】命令對有疑問的字(藍(lán)色字符)進(jìn)行修正。修正后的字符以紫色顯示。
6、通過后編改后的文字內(nèi)容就可以輸出了。選擇【文件】菜單下的【輸出識別結(jié)果】命令,彈出對話框,把當(dāng)前正在編輯的文本輸出為一個WORD文件或文本文件,或兩種文件格式同時輸出。
若選擇【輸出識別結(jié)果到同一文件】,則把當(dāng)前工程里所有圖像的識別結(jié)果都輸出到一個文件里。
或者直接選擇工具條的【輸出結(jié)果】工具,則把當(dāng)前選中圖像的結(jié)果輸出,彈出【輸出識別結(jié)果】對話框,選擇輸出的目標(biāo)路徑,以及輸出的格式,點擊【確定】按鈕。
方正銳思3.5支持輸出的文本文件類型有三種:MS WORD文件(.doc文件)、文本文件(即.txt文件)、文本文件(.txt)&&
MS WORD文件。