對(duì)比數(shù)據(jù)庫(kù):當(dāng)輸入文字算完特征后,不管是用統(tǒng)計(jì)或結(jié)構(gòu)的特征,都須有一比對(duì)數(shù)據(jù)庫(kù)或特征數(shù)據(jù)庫(kù)來(lái)進(jìn)行比對(duì),數(shù)據(jù)庫(kù)的內(nèi)容應(yīng)包含所有欲識(shí)別的字集文字,根據(jù)與輸入文字一樣的特征抽取方法所得的特征群組。對(duì)比識(shí)別這是可充分發(fā)揮數(shù)算理論的一個(gè)模塊,根據(jù)不同的特征特性,選用不同的數(shù)學(xué)距離函數(shù),較有名的比對(duì)方法有,歐式空間的比對(duì)方法、松弛比對(duì)法(Relaxation)、動(dòng)態(tài)程序比對(duì)法(Dynamic Programming,DP),以及類神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)庫(kù)建立及比對(duì)、HMM(Hidden Markov Model)…等的方法,為了使識(shí)別的結(jié)果更穩(wěn)定,也有所謂的專家系統(tǒng)(Experts System)被提出,利用各種特征比對(duì)方法的相異互補(bǔ)性,使識(shí)別出的結(jié)果,其信心度特別的高。

字詞后處理:由于OCR的識(shí)別率并無(wú)法達(dá)到,或想加強(qiáng)比對(duì)的正確性及信心值,一些除錯(cuò)或甚至幫忙更正的功能,也成為OCR系統(tǒng)中必要的一個(gè)模塊。字詞后處理就是一例,利用比對(duì)后的識(shí)別文字與其可能的相似候選字群中,根據(jù)前后的識(shí)別文字找出合乎邏輯的詞,做更正的功能。字詞數(shù)據(jù)庫(kù):為字詞后處理所建立的詞庫(kù)。OCR后的關(guān)卡,在此之前,使用者可能只是拿支鼠標(biāo),跟著軟件設(shè)計(jì)的節(jié)奏操作或僅是觀看,而在此有可能須特別花使用者的精神及時(shí)間,去更正甚至找尋可能是OCR出錯(cuò)的地方。

一個(gè)好的OCR軟件,除了有一個(gè)穩(wěn)定的影像處理及識(shí)別核心,以降低錯(cuò)誤率外,人工校正的操作流程及其功能,亦影響OCR的處理效率,因此,文字影像與識(shí)別文字的對(duì)照,及其屏幕信息擺放的位置、還有每一識(shí)別文字的候選字功能、拒認(rèn)字的功能、及字詞后處理后特意標(biāo)示出可能有問(wèn)題的字詞,都是為使用者設(shè)計(jì)盡量少使用鍵盤(pán)的一種功能,當(dāng)然,不是說(shuō)系統(tǒng)沒(méi)顯示出的文字就一定正確,就像完全由鍵盤(pán)輸入的工作人員也會(huì)有出錯(cuò)的時(shí)候,這時(shí)要重新校正一次或能允許些許的錯(cuò),就完全看使用單位的需求了。結(jié)果輸出

白條、黑條的寬度不同,相應(yīng)的電信號(hào)持續(xù)時(shí)間長(zhǎng)短也不同.但是,由光電轉(zhuǎn)換器輸出的與條形碼的條和空相應(yīng)的電信號(hào)一般僅10mV左右,不能直接使用,因而先要將光電轉(zhuǎn)換器輸出的電信號(hào)送放大器放大.放大后的電信號(hào)仍然是一個(gè)模擬電信號(hào),為了避免由條形碼中的疵點(diǎn)和污點(diǎn)導(dǎo)致錯(cuò)誤信號(hào),在放大電路后需加一電路,把模擬信號(hào)轉(zhuǎn)換成數(shù)字電信號(hào),以便計(jì)算機(jī)系統(tǒng)能準(zhǔn)確判讀。