您好,歡迎來(lái)到易龍商務(wù)網(wǎng)!
發(fā)布時(shí)間:2021-06-13 07:41  
【廣告】





早在60、70年代,世界各國(guó)就開(kāi)始有OCR的研究,而研究的初期,多以文字的識(shí)別方法研究為主,且識(shí)別的文字僅為0至9的數(shù)字。以同樣擁有方塊文字的日本為例,1960年左右開(kāi)始研究OCR的基本識(shí)別理論,初期以數(shù)字為對(duì)象,直至1965至1970年之間開(kāi)始有一些簡(jiǎn)單的產(chǎn)品,如印刷文字的郵政編碼識(shí)別系統(tǒng),識(shí)別郵件上的郵政編碼,幫助郵局作區(qū)域分信的作業(yè);也因此至今郵政編碼一直是各國(guó)所倡導(dǎo)的地址書(shū)寫方式。
影像預(yù)處理:影像預(yù)處理是OCR系統(tǒng)中,須解決問(wèn)題的一個(gè)模塊。影像須先將圖片、表格及文字區(qū)域分離出來(lái),甚至可將文章的編排方向、文章的提綱及內(nèi)容主體區(qū)分開(kāi),而文字的大小及文字的字體亦可如原始文件一樣的判斷出來(lái)。對(duì)待識(shí)別圖像進(jìn)行如下預(yù)處理,可以降低特征提取算法的難度,并能提高識(shí)別的精度。二值化:由于彩像所含信息量過(guò)于巨大,在對(duì)圖像中印刷體字符進(jìn)行識(shí)別處理前,需要對(duì)圖像進(jìn)行二值化處理,使圖像只包含黑色的前景信息和白色的背景信息,提升識(shí)別處理的效率和度。