您好,歡迎來到易龍商務網!
【廣告】
發布時間:2020-12-09 08:23  





噪聲去除:對于不同的文檔,我們對噪聲的定義可以不同,根據噪聲的特征進行去噪,就叫做噪聲去除傾斜較正:由于一般用戶,在拍照文檔時,都比較隨意,因此拍照出來的圖片不可避免的產生傾斜,這就需要文字識別軟件進行較正。版面分析:將文檔圖片分段落,分行的過程就叫做版面分析,由于實際文檔的多樣性,復雜性,因此,目前還沒有一個固定的,的切割模型。
對比數據庫:當輸入文字算完特征后,不管是用統計或結構的特征,都須有一比對數據庫或特征數據庫來進行比對,數據庫的內容應包含所有欲識別的字集文字,根據與輸入文字一樣的特征抽取方法所得的特征群組。對比識別這是可充分發揮數算理論的一個模塊,根據不同的特征特性,選用不同的數學距離函數,較有名的比對方法有,歐式空間的比對方法、松弛比對法(Relaxation)、動態程序比對法(Dynamic Programming,DP),以及類神經網絡的數據庫建立及比對、HMM(Hidden Markov Model)…等的方法,為了使識別的結果更穩定,也有所謂的專家系統(Experts System)被提出,利用各種特征比對方法的相異互補性,使識別出的結果,其信心度特別的高。