您好,歡迎來到易龍商務網!
發布時間:2020-11-28 12:50  
【廣告】





噪聲去除:對于不同的文檔,我們對噪聲的定義可以不同,根據噪聲的特征進行去噪,就叫做噪聲去除傾斜較正:由于一般用戶,在拍照文檔時,都比較隨意,因此拍照出來的圖片不可避免的產生傾斜,這就需要文字識別軟件進行較正。版面分析:將文檔圖片分段落,分行的過程就叫做版面分析,由于實際文檔的多樣性,復雜性,因此,目前還沒有一個固定的,的切割模型。
文字特征抽取:單以識別率而言,特征抽取可說是 OCR的核心,用什么特征、怎么抽取,直接影響識別的好壞,也所以在OCR研究初期,特征抽取的研究報告特別的多。而特征可說是識別的籌碼,簡易的區分可分為兩類:一為統計的特征,如文字區域內的黑/白點數比,當文字區分成好幾個區域時,這一個個區域黑/白點數比之聯合,就成了空間的一個數值向量,在比對時,基本的數學理論就足以應付了。而另一類特征為結構的特征,如文字影像細線化后,取得字的筆劃端點、交叉點之數量及位置,或以筆劃段為特征,配合特殊的比對方法,進行比對,市面上的線上手寫輸入軟件的識別方法多以此種結構的方法為主。
隨著條碼技術應用領域的擴大,人們對條碼技術的需求層次也在不斷提高,人們不但要求條碼技術能夠解決計算機的數據輸入速度、數據輸入正確性等問題,而且希望條碼技術還能解決將更多信息印刷在更小面積等其他一些問題。到了80年代后期,一種能夠在更小面積上表示更多信息的新條碼產生了,這就是二維條碼。由于二維條碼在平面的橫向和縱向上都能表示信息,所以與一維條碼比較,二維條碼所攜帶的信息量和信息密度都提高了幾倍,二維條碼可表示圖象、文字、甚至聲音。