早期的OCR軟件,由于識(shí)別率及產(chǎn)品化等多方面的因素,未能達(dá)到實(shí)際要求。同時(shí),由于硬件設(shè)備成本高,運(yùn)行速度慢,也沒有達(dá)到實(shí)用的程度。只有個(gè)別部門,如信息部門、新聞出版單位等使用OCR軟件。進(jìn)入20世紀(jì)90年代以后,隨著平臺(tái)式掃描儀的廣泛應(yīng)用,以及我國(guó)信息自動(dòng)化和辦公自動(dòng)化的普及,大大推動(dòng)了OCR技術(shù)的進(jìn)一步發(fā)展,使OCR的識(shí)別正確率、識(shí)別速度滿足了廣大用戶的要求。軟件結(jié)構(gòu)編輯由于掃描儀的普及與廣泛應(yīng)用,OCR軟件只需提供與掃描儀的接口,利用掃描儀驅(qū)動(dòng)軟件即可。因此,OCR軟件主要是由下面幾個(gè)部分組成。
噪聲去除:對(duì)于不同的文檔,我們對(duì)噪聲的定義可以不同,根據(jù)噪聲的特征進(jìn)行去噪,就叫做噪聲去除傾斜較正:由于一般用戶,在拍照文檔時(shí),都比較隨意,因此拍照出來的圖片不可避免的產(chǎn)生傾斜,這就需要文字識(shí)別軟件進(jìn)行較正。版面分析:將文檔圖片分段落,分行的過程就叫做版面分析,由于實(shí)際文檔的多樣性,復(fù)雜性,因此,目前還沒有一個(gè)固定的,的切割模型。

從影像到結(jié)果輸出,須經(jīng)過影像輸入、影像前處理、文字特征抽取、比對(duì)識(shí)別、后經(jīng)人工校正將認(rèn)錯(cuò)的文字更正,將結(jié)果輸出。影像輸入欲經(jīng)過OCR處理的標(biāo)的物須透過光學(xué)儀器,如影像掃描儀、傳真機(jī)或任何攝影器材,將影像轉(zhuǎn)入計(jì)算機(jī)??萍嫉倪M(jìn)步,掃描儀等的輸入裝置已制作的愈來愈精致,輕薄短小、品質(zhì)也高,對(duì)OCR有相當(dāng)大的幫助,掃描儀的分辨率使影像更清晰、掃除速度更增進(jìn)OCR處理的效率。