OCR, abbreviazione di riconoscimento ottico dei caratteri, si riferisce alla tecnologia utilizzata per convertire i caratteri stampati, scritti o digitati in un formato digitale. Il processo consente al testo di essere letto da un computer che rende i caratteri in grado di essere modificati e ricercati. Questa tecnologia non solo ha rivoluzionato l'immissione dei dati, ma è anche uno strumento utile per i non vedenti e gli ipovedenti.
Come funziona l'OCR?
Dopo aver utilizzato uno scanner ottico per scansionare un documento e scomporlo in caratteri, la tecnologia OCR ha due diversi approcci per convertire i caratteri in un riconoscimento di pattern in formato digitale e in un rilevamento di caratteristiche.
Il riconoscimento del modello, noto anche come corrispondenza della matrice e corrispondenza del modello, funziona confrontando un carattere di cui esegue la scansione con un arretrato di immagini di caratteri che il programma ha in archivio. Funziona solo quando i caratteri corrispondono esattamente ai caratteri utilizzati dall'OCR come riferimento. Negli anni '1960, il carattere OCR-A è stato creato per essere stampato su assegni al fine di standardizzare il carattere per i programmi OCR della banca. Alla fine, il riconoscimento dei pattern si è espanso al riconoscimento di più caratteri comuni come Arial e Times New Roman, ma il programma era ancora limitato alla sola conversione dei caratteri che erano in pochi caratteri selezionati.
Il rilevamento delle caratteristiche, noto anche come estrazione delle caratteristiche, consente all'OCR di leggere i caratteri in quasi tutti i tipi di carattere. Invece di cercare la replica esatta di un personaggio, il rilevamento delle caratteristiche funziona distinguendo le caratteristiche specifiche che un personaggio avrà indipendentemente dal carattere. Ad esempio, se il programma esegue la scansione di un carattere che ha due linee oblique che si incontrano in alto per indicare un punto, può dire che la lettera è una A maiuscola. Il rilevamento delle funzionalità espande gli usi e le capacità dei programmi OCR ed è il massimo tipo comune di OCR utilizzato oggi.
Sebbene l'OCR sia limitato alla conversione del testo stampato, il riconoscimento intelligente dei caratteri (ICR) può trasformare la scrittura a mano in testo che può essere letto, cercato o modificato da un computer. Sebbene appartenga alla stessa famiglia dell'OCR, l'ICR è un processo molto più difficile poiché la scrittura a mano è più variata rispetto ai caratteri.
Utilizza per OCR
- Inserimento dati
- Aiuta i non vedenti e gli ipovedenti
- Digitalizza libri
- Smistamento della posta
- Rendi ricercabili PDF, libri e documenti fisici
- Riconoscimento targa
- Riconoscimento del passaporto