Què és el reconeixement òptic de caràcters (OCR)?

Taula de continguts:

Què és el reconeixement òptic de caràcters (OCR)?
Què és el reconeixement òptic de caràcters (OCR)?
Anonim

El reconeixement òptic de caràcters (OCR) fa referència al programari que crea una versió digital d'un document imprès, escrit o escrit a mà que els ordinadors poden llegir sense necessitat d'escriure o introduir el text manualment. L'OCR s'utilitza generalment en documents escanejats en format PDF, però també pot crear una versió de text llegible per ordinador dins d'un fitxer d'imatge.

Què és l'OCR

OCR, també conegut com a reconeixement de text, és una tecnologia de programari que transforma caràcters com números, lletres i signes de puntuació (també anomenats glifs) de documents impresos o escrits en una forma electrònica més fàcil de reconèixer i llegir per ordinadors i altres programes de programari. Alguns programes OCR ho fan quan un document s'escaneja o es fotografia amb una càmera digital i d' altres poden aplicar aquest procés a documents que s'han escanejat o fotografiat prèviament sense OCR. L'OCR permet als usuaris cercar en documents PDF, editar text i tornar a formatar documents.

Image
Image
Escaneig de diaris històrics amb programari OCR.

Getty Images

Per a què serveix l'OCR?

Per a les necessitats d'escaneig ràpid i quotidià, l'OCR pot no ser un gran problema. Si feu una gran quantitat d'escaneig, poder cercar als PDF per trobar el que necessiteu pot estalviar una mica de temps i fa que la funcionalitat OCR del vostre programa d'escàner sigui més important. A continuació, es mostren algunes altres coses amb les quals ajuda OCR:

  • Processament automatitzat de dades i entrada de dades (Exemple: sistemes de seguiment de sol·licitants per a currículums).
  • Fer que els llibres escanejats es puguin cercar.
  • Conversió d'escanejos escrits a mà en text llegible per ordinador.
  • Fent que els documents siguin més utilitzats pels programes lectors que ajuden els usuaris amb discapacitat visual.
  • Preservar els documents històrics i els diaris, alhora que els permet cercar.
  • Extracció de dades i transferència a programes de comptabilitat (Exemple: rebuts i factures).
  • Indexació de documents per als motors de cerca.
  • Reconeixement de les matrícules de conduir per una càmera de velocitat i un programari de càmeres amb llum vermella.
  • Sintetitzadors de veu per a persones que no poden parlar: el físic teòric Stephen Hawking és potser l'usuari més conegut d'un programa de sintetitzadors de veu.

Conclusió

Per què no només feu una foto, oi? Perquè no podríeu editar res ni cercar el text perquè només seria una imatge. Escanejar el document i executar el programari OCR pot convertir aquest fitxer en una cosa que podeu editar i cercar.

Història de l'OCR

Si bé el primer ús del reconeixement de text data de 1914, el desenvolupament i l'ús generalitzats de tecnologies relacionades amb l'OCR van començar de debò a la dècada de 1950, concretament amb la creació de tipus de lletra molt simplificats que eren més fàcils de convertir a digital- text llegible. El primer d'aquests tipus de lletra simplificats va ser creat per David Shepard i conegut comunament com OCR-7B. L'OCR-7B encara s'utilitza avui en dia a la indústria financera per al tipus de lletra estàndard que s'utilitza a les targetes de crèdit i de dèbit. A la dècada de 1960, els serveis postals de diversos països van començar a utilitzar la tecnologia OCR per accelerar enormement la classificació del correu, inclosos els Estats Units, Gran Bretanya, Canadà i Alemanya. L'OCR continua sent la tecnologia bàsica que s'utilitza per classificar el correu als serveis postals d'arreu del món. L'any 2000, es va utilitzar el coneixement clau dels límits i les capacitats de la tecnologia OCR per desenvolupar els programes CAPTCHA utilitzats per aturar els robots i els spammers.

Al llarg de les dècades, l'OCR s'ha anat fent més precís i més sofisticat a causa dels avenços en àrees tecnològiques relacionades, com ara la intel·ligència artificial, l'aprenentatge automàtic i la visió per ordinador. Avui en dia, el programari OCR utilitza el reconeixement de patrons, la detecció de funcions i l'extracció de text per transformar documents amb més rapidesa i precisió que mai.

FAQ

    Com escanejo documents amb el meu telèfon o tauleta?

    A iOS, obre l'aplicació Notes i crea una nota nova. Obriu la càmera i, a continuació, toqueu Escaneja documents. A Android, obriu Google Drive i seleccioneu Plus (+), després toqueu Escaneja per escanejar el documenteu-vos amb el vostre telèfon.

    Com puc utilitzar l'OCR a Adobe Acrobat?

    Obre un fitxer PDF que conté una imatge escanejada i, a continuació, selecciona Eines > Edita PDF. Acrobat aplicarà automàticament l'OCR perquè pugueu editar el text. Només cal que seleccioneu on voleu fer modificacions i comenceu a escriure.

    Quina diferència hi ha entre OCR i OMR?

    El reconeixement òptic de marques (OMR) és un programari que detecta marques al paper, normalment un full de bombolles. L'OMR s'utilitza per processar els resultats d'exàmens, enquestes, qüestionaris i fins i tot eleccions. A diferència de l'OCR, l'OMR no pot desxifrar les marques de la pàgina, sinó que només verifica que hi siguin.

Recomanat: