20世紀70年代初,日本的學者開始研究漢字識別,并做了大量的工作。中國在OCR技術方面的研究工作起步較晚,在70年代才開始對數字、英文字母及符號的識別進行研究,70年代末開始進行漢字識別的研究,到1986年,我國提出“863”高新科技研究計劃,漢字識別的研究進入一個實質性的階段,清華大學的丁曉青和中科院分別開發研究,相繼推出了中文OCR產品,現為中國漢字OCR技術。

圖像降噪:由于待識別圖像的品質受限于輸入設備、環境、以及文檔的印刷質量,在對圖像中印刷體字符進行識別處理前,需要根據噪聲的特征對待識別圖像進行去噪處理,提升識別處理的度。傾斜校正:由于掃描和拍攝過程涉及人工操作,輸入計算機的待識別圖像或多或少都會存在一些傾斜,在對圖像中印刷體字符進行識別處理前,就需要進行圖像方向檢測,并校正圖像方向。
對比數據庫:當輸入文字算完特征后,不管是用統計或結構的特征,都須有一比對數據庫或特征數據庫來進行比對,數據庫的內容應包含所有欲識別的字集文字,根據與輸入文字一樣的特征抽取方法所得的特征群組。對比識別這是可充分發揮數算理論的一個模塊,根據不同的特征特性,選用不同的數學距離函數,較有名的比對方法有,歐式空間的比對方法、松弛比對法(Relaxation)、動態程序比對法(Dynamic Programming,DP),以及類神經網絡的數據庫建立及比對、HMM(Hidden Markov Model)…等的方法,為了使識別的結果更穩定,也有所謂的專家系統(Experts System)被提出,利用各種特征比對方法的相異互補性,使識別出的結果,其信心度特別的高。