20世紀(jì)70年代初,日本的學(xué)者開(kāi)始研究漢字識(shí)別,并做了大量的工作。中國(guó)在OCR技術(shù)方面的研究工作起步較晚,在70年代才開(kāi)始對(duì)數(shù)字、英文字母及符號(hào)的識(shí)別進(jìn)行研究,70年代末開(kāi)始進(jìn)行漢字識(shí)別的研究,到1986年,我國(guó)提出“863”高新科技研究計(jì)劃,漢字識(shí)別的研究進(jìn)入一個(gè)實(shí)質(zhì)性的階段,清華大學(xué)的丁曉青和中科院分別開(kāi)發(fā)研究,相繼推出了中文OCR產(chǎn)品,現(xiàn)為中國(guó)漢字OCR技術(shù)。

圖像降噪:由于待識(shí)別圖像的品質(zhì)受限于輸入設(shè)備、環(huán)境、以及文檔的印刷質(zhì)量,在對(duì)圖像中印刷體字符進(jìn)行識(shí)別處理前,需要根據(jù)噪聲的特征對(duì)待識(shí)別圖像進(jìn)行去噪處理,提升識(shí)別處理的度。傾斜校正:由于掃描和拍攝過(guò)程涉及人工操作,輸入計(jì)算機(jī)的待識(shí)別圖像或多或少都會(huì)存在一些傾斜,在對(duì)圖像中印刷體字符進(jìn)行識(shí)別處理前,就需要進(jìn)行圖像方向檢測(cè),并校正圖像方向。
對(duì)比數(shù)據(jù)庫(kù):當(dāng)輸入文字算完特征后,不管是用統(tǒng)計(jì)或結(jié)構(gòu)的特征,都須有一比對(duì)數(shù)據(jù)庫(kù)或特征數(shù)據(jù)庫(kù)來(lái)進(jìn)行比對(duì),數(shù)據(jù)庫(kù)的內(nèi)容應(yīng)包含所有欲識(shí)別的字集文字,根據(jù)與輸入文字一樣的特征抽取方法所得的特征群組。對(duì)比識(shí)別這是可充分發(fā)揮數(shù)算理論的一個(gè)模塊,根據(jù)不同的特征特性,選用不同的數(shù)學(xué)距離函數(shù),較有名的比對(duì)方法有,歐式空間的比對(duì)方法、松弛比對(duì)法(Relaxation)、動(dòng)態(tài)程序比對(duì)法(Dynamic Programming,DP),以及類(lèi)神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)庫(kù)建立及比對(duì)、HMM(Hidden Markov Model)…等的方法,為了使識(shí)別的結(jié)果更穩(wěn)定,也有所謂的專(zhuān)家系統(tǒng)(Experts System)被提出,利用各種特征比對(duì)方法的相異互補(bǔ)性,使識(shí)別出的結(jié)果,其信心度特別的高。