21 gennaio 2008

I migliori sistemi OCR: modificare documenti scannerizzati in testo


Immagine: ocr-systeme

I sistemi di Optical Character Recognition (riconoscimento ottico dei caratteri detti anche OCR) sono programmi dedicati alla conversione di un'immagine contenente testo in testo modificabile con un normale programma di videoscrittura. Solitamente le immagini sono acquisite da uno scanner.

Il testo viene convertito in testo ASCII, Unicode o nel caso dei sistemi più avanzati in un formato in grado di contenere anche l'impaginazione del documento. I programmi di OCR si avvalgono dei progressi dell’intelligenza artificiale e dell'evoluzione degli algoritmi legati al riconoscimento delle immagini. (Wikipedia)


Nella pratica, utilizziamo gli ocr sopartutto per importare testi o fogli da libri o giornali in un formato testo, per poter essere riutilizzto o rielaborato.


In questo settore, purtroppo, gli ocr freeware e quello di Microsoft Word (qui un tutorial sull'argomento) non hanno garantito risultati agli stessi livelli degli omonimi software a pagamento.


Migliori OCR a pagamento:

ABBYY FineReader Professional Edition uno dei più noti offre la possibilità di compiere l'acquisizione a partire da un file PDF, supporto per l'acquisizione e la lettura dei codici a barre;

OmniPage Professional 16 è indicato per grandi volumi di carta, PDF e moduli in file che possono essere modificati e cercati. OmniPage Professional 16 comprende inoltre PaperPort 11, un ottimo software per la gestione dei documenti sul desktop.


Migliori OCR gratuiti

WeOCR server, non un software, ma un’applicazione online, per avere un discreto OCR sempre a portata di mano, senza alcuna installzione. Basta caricare il file da scansionare, in uno dei formati supportati, e verrà restituto il lavoro dopo alcuni istanti.

TopOCR considerato da alcuni il miglior OCR gratuito: semplice da usare, buoni i risultati ottenibili.

Tags: ,

Nessun commento: