Reconeixement intel·ligent de caràcters

De Viquipèdia
Dreceres ràpides: navegació, cerca

El reconeixement intel·ligent de caràcters (en anglès, Intelligent character recognition, ICR) és un sistema avançat del reconeixement òptic de caràcters, utilitzat per desxifrar text manuscrit.

ICR permet aprendre les fonts i els diferents estils de cal·ligrafia durant el procés, millorant els nivells de precisió i reconeixement.

Estat de l’art[modifica | modifica el codi]

ICR encara no ha assolit la mateixa precisió que OCR, tot hi així és capaç d’aconseguir una precisió del 97% o superior.

Aquest sistema actualment és capaç de reconèixer text escrit a mà, text escrit a màquina estàndard i fonts poc habituals, ja que utilitza els contorns de les lletres per identificar les paraules que s'escriuen.

En el text escrit a mà, de moment, només és capaç de reconèixer lletres majúscules. En tipografies estàndards pot reconèixer lletra cursiva.

Esquema bàsic d'un algorisme ICR[modifica | modifica el codi]

El procés de ICR, majoritàriament es divideix en aquests set passos.

Aïllament del caràcter[modifica | modifica el codi]

Aïllament del caràcter, a l'esquerra la casella original i a la dreta la casella desplaçada

Es desplaça cada caràcter individual (lletra o número) a dins de la casella corresponent. El programa ha de saber on es troben les coordenades d’aquesta.

Reducció de Soroll[modifica | modifica el codi]

4 passos d'algorisme ICR: reducció de soroll, límit d'eliminació, normalització i aprimament

Extreu aquells continguts de la casella que segurament no formen part del caràcter, com petits punts insignificants.

Límit d’eliminació[modifica | modifica el codi]

S’eliminen els segments que es troben molt a prop del marc de la casella.

Normalització[modifica | modifica el codi]

Un cop s’ha aconseguit que als voltants del caràcter siguin blancs, s’ajusta la mida del caràcter a la casella.

Aprimament[modifica | modifica el codi]

És el procés de reducció de la imatge fins a aconseguir que tingui forma d’esquelet, és a dir que els contorns tinguin l’amplada d’un píxel. Aquest procés es fa amb la finalitat d’esborrar la densitat de l’eina d’escriure.

Extracció de característiques[modifica | modifica el codi]

Aquest és el procés clau d’identificació del caràcter. Normalment es divideix la imatge en seccions que parteixen del centre, i s’extreuen els vectors que formen els píxels plens amb el centre.

Reconeixement[modifica | modifica el codi]

Una vegada s’han extret les característiques es comparen amb una forma ja existent per fer la identificació. El caràcter que tingui major semblança és el que s’assigna.

Comparació de les tecnologies ICR, OCR i OMR[modifica | modifica el codi]

El reconeixement intel·ligent de caràcters, el reconeixement òptic de caràcters i el reconeixement de marques òptiques són mètodes orientats a disminuir la quantitat d’entrades de dades manuals. Per omplir formularis, OMR és una tecnologia molt especialitzada ja que conté marques d’identificació (quadres negres al principi i al final del formulari). En OCR i ICR són més flexibles, no utilitzen marques de temps, però sí marques de registre (caselles). Per la recuperació de continguts, només és possible amb ICR i OCR, ja que OMR no fa un escaneig de la imatge. En precisió, OMR aconsegueix una eficàcia del 99%, mentre que OCR del 98% i ICR del 97% si l'entrada ha estat neta i s’utilitza una edició sobre context.

Aplicacions ICR[modifica | modifica el codi]

Les millors eines de processament de formularis combinen OCR i ICR per donar-li la màxima flexibilitat, el que li permet combinar diversos tipus de respostes en una base de dades. Això pot ser útil per a molts tipus de documents, que van des de les enquestes i qüestionaris als xecs bancaris.

Aquests són alguns exemples de programes que utilitzen la tecnologia ICR per reconèixer text escrit a mà.

Empresa Productes Llengües que suporta ICR
Parascript Parascript CheckPlus

Parascript AddressScript Parascript FormXtra Parascript FieldScript

Anglès, Francès, Alemany, Italià, Kazak, Portuguès, Rus i Espanyol
A2IA A2iA DocumentReader

A2iA CheckReader A2iA AddressReader A2iA FieldReader

Anglès, Francès, Alemany, Italià, Portuguès i Espanyol
ABBYY ABBYY FlexiCapture

ABBYY FlexiCapture Engine

ABBYY FineReader Engine

Afrikaans, Albanès, Aimara, Azerbaidjan (Amèrica), Basc, Bemba, Blackfoot, Bretó, Bogotà, Búlgar, Cebuano, Chamorro, Tàrtar, Croat, Cors, Txec, Dakota (Sioux), Holandès (Bèlgica), Holandès (Països Baixos), Anglès, Estonià, Evenki, Fiji, Finlandès, Francès, Friso, Friulano, Gallec, Ganda, Alemany, Alemany (Luxemburg), Alemany (nova ortografia), Grec, Guaraní, Hani, Hausa, Hawaià, Hongarès, Islandès, Indonesi, Irlandès, Italià, Jingpo, Karachay-Balkària, Kasub, Kawa, Kazakhstan, Kirguizistan, Congolès, Kpelle, Kumyk, Kurd, Llatí, Letó, Lituà, Luba, Madagascar, Malinké, el Maori, el Maia, Miao, Minangkabau, Mohawk, Moldau, Mongol, Mordvin, el Náhuatl, Nivkh, Nogayos, Nyanja, Ojibway, Francès antic, Alemany antic, Italià antic, Espanyol antic, el Papiamento, Polonès, Quítxua, Rhaeto Romànic, Romanès, Romaní, Rundi, Rus, Rwanda, Sami (lapons), Samoa, el Gaèlic Escocès, Selkup, Serbi, Eslovac, Eslovè, Somàlia, Sotho, Espanyol, Suahili, Swaziland, Tagalog, Tahitià, Tok Pisin, Tonga, Tswana, Tun, Turc, Uigur (Amèrica), Ucraïnès, el Wòlof, Xhosa, Anat zapoteca i Interlingua
Accusoft Pegasus SmartZone ICR/OCR Anglès, Danès, Alemany, Finlandès, Francès, Alemany, Italià, Noruec, Portuguès, Espanyol i Suec (.NET supports all listed, ActiveX is English only)
Cognitive Technologies Cognitive Forms Rus
ExperVision TypeReader

OpenRTK

Anglès, Francès, Alemany, Italià, Espanyol, Portuguès, Danès, Alemany, Suec, Noruec, Hongarès, Polac, Xinès, Xinès tradicional, Rus, Finlandès i Polinès
I.R.I.S. Group IRISCapture Pro for Forms Latin based languages
LEADTOOLS LEADTOOLS ICR SDK Module Català, Txec, Danès, Alemany, Anglès, Finès, Francès, Alemany, Hongarès, Italià, Noruec, Polac, Portuguès, Espanyol i Suec

Vegeu també[modifica | modifica el codi]

Bibliografia[modifica | modifica el codi]