您好,歡迎來到易龍商務(wù)網(wǎng)!
發(fā)布時(shí)間:2021-03-23 15:25  
【廣告】





文字特征抽取:單以識(shí)別率而言,特征抽取可說是 OCR的核心,用什么特征、怎么抽取,直接影響識(shí)別的好壞,也所以在OCR研究初期,特征抽取的研究報(bào)告特別的多。而特征可說是識(shí)別的籌碼,簡易的區(qū)分可分為兩類:一為統(tǒng)計(jì)的特征,如文字區(qū)域內(nèi)的黑/白點(diǎn)數(shù)比,當(dāng)文字區(qū)分成好幾個(gè)區(qū)域時(shí),這一個(gè)個(gè)區(qū)域黑/白點(diǎn)數(shù)比之聯(lián)合,就成了空間的一個(gè)數(shù)值向量,在比對(duì)時(shí),基本的數(shù)學(xué)理論就足以應(yīng)付了。而另一類特征為結(jié)構(gòu)的特征,如文字影像細(xì)線化后,取得字的筆劃端點(diǎn)、交叉點(diǎn)之?dāng)?shù)量及位置,或以筆劃段為特征,配合特殊的比對(duì)方法,進(jìn)行比對(duì),市面上的線上手寫輸入軟件的識(shí)別方法多以此種結(jié)構(gòu)的方法為主。
字詞后處理:由于OCR的識(shí)別率并無法達(dá)到,或想加強(qiáng)比對(duì)的正確性及信心值,一些除錯(cuò)或甚至幫忙更正的功能,也成為OCR系統(tǒng)中必要的一個(gè)模塊。字詞后處理就是一例,利用比對(duì)后的識(shí)別文字與其可能的相似候選字群中,根據(jù)前后的識(shí)別文字找出合乎邏輯的詞,做更正的功能。字詞數(shù)據(jù)庫:為字詞后處理所建立的詞庫。OCR后的關(guān)卡,在此之前,使用者可能只是拿支鼠標(biāo),跟著軟件設(shè)計(jì)的節(jié)奏操作或僅是觀看,而在此有可能須特別花使用者的精神及時(shí)間,去更正甚至找尋可能是OCR出錯(cuò)的地方。