Was ist optische Zeichenerkennung (OCR)?

Inhaltsverzeichnis:

Was ist optische Zeichenerkennung (OCR)?
Was ist optische Zeichenerkennung (OCR)?
Anonim

Optical Character Recognition (OCR) bezieht sich auf Software, die eine digitale Version eines gedruckten, getippten oder handgeschriebenen Dokuments erstellt, die Computer lesen können, ohne dass der Text manuell eingegeben oder eingegeben werden muss. OCR wird im Allgemeinen für gescannte Dokumente im PDF-Format verwendet, kann aber auch eine computerlesbare Version von Text in einer Bilddatei erstellen.

Was OCR ist

OCR, auch als Texterkennung bezeichnet, ist eine Softwaretechnologie, die Zeichen wie Zahlen, Buchstaben und Satzzeichen (auch Glyphen genannt) aus gedruckten oder geschriebenen Dokumenten in eine elektronische Form umwandelt, die von Computern leichter erkannt und gelesen werden kann andere Softwareprogramme. Einige OCR-Programme tun dies, während ein Dokument mit einer Digitalkamera gescannt oder fotografiert wird, und andere können diesen Prozess auf Dokumente anwenden, die zuvor ohne OCR gescannt oder fotografiert wurden. Mit OCR können Benutzer in PDF-Dokumenten suchen, Text bearbeiten und Dokumente neu formatieren.

Image
Image
Scannen historischer Zeitungen mit OCR-Software.

Getty Images

Wofür wird OCR verwendet?

Für schnelle, alltägliche Scananforderungen ist OCR möglicherweise keine große Sache. Wenn Sie viel scannen, kann die Möglichkeit, innerhalb von PDFs zu suchen, um genau das zu finden, was Sie brauchen, viel Zeit sparen und die OCR-Funktionalität in Ihrem Scannerprogramm wichtiger machen. Hier sind einige andere Dinge, bei denen OCR hilft:

  • Automatisierte Datenverarbeitung und Dateneingabe (Beispiel: Bewerber-Tracking-Systeme für Lebensläufe).
  • Gescannte Bücher durchsuchbar machen.
  • Handschriftliche Scans in computerlesbaren Text umwandeln.
  • Dokumente besser nutzbar machen durch Leseprogramme, die sehbehinderten Benutzern helfen.
  • Bewahrung historischer Dokumente und Zeitungen bei gleichzeitiger Durchsuchbarkeit.
  • Datenextraktion und Übergabe an Buchh altungsprogramme (Beispiel: Quittungen und Rechnungen).
  • Indexierung von Dokumenten zur Verwendung durch Suchmaschinen.
  • Kennzeichenerkennung durch Blitzer- und Rotlichtkamera-Software.
  • Sprachsynthesizer für Menschen, die nicht sprechen können – der theoretische Physiker Stephen Hawking ist vielleicht der bekannteste Benutzer eines Sprachsynthesizer-Programms.

Bottom Line

Warum nicht einfach ein Foto machen, oder? Weil Sie nichts bearbeiten oder den Text durchsuchen könnten, weil es nur ein Bild wäre. Durch Scannen des Dokuments und Ausführen von OCR-Software kann diese Datei in etwas umgewandelt werden, das Sie bearbeiten und durchsuchen können.

Geschichte der OCR

Während die allererste Verwendung der Texterkennung auf das Jahr 1914 datiert, begann die weitverbreitete Entwicklung und Verwendung von OCR-bezogenen Technologien ernsthaft in den 1950er Jahren, insbesondere mit der Erstellung sehr vereinfachter Schriftarten, die leichter in digitale Formate umgewandelt werden konnten. lesbarer Text. Die erste dieser vereinfachten Schriftarten wurde von David Shepard erstellt und ist allgemein als OCR-7B bekannt. OCR-7B wird heute noch in der Finanzbranche für die Standardschrift verwendet, die auf Kredit- und Debitkarten verwendet wird. In den 1960er Jahren begannen Postdienste in mehreren Ländern mit der OCR-Technologie, um die Postsortierung erheblich zu beschleunigen, darunter in den Vereinigten Staaten, Großbritannien, Kanada und Deutschland. OCR ist immer noch die Kerntechnologie, die zum Sortieren von Post für Postdienste auf der ganzen Welt verwendet wird. Im Jahr 2000 wurde das Schlüsselwissen über die Grenzen und Möglichkeiten der OCR-Technologie genutzt, um die CAPTCHA-Programme zu entwickeln, die zum Stoppen von Bots und Spammern verwendet werden.

Im Laufe der Jahrzehnte ist OCR aufgrund von Fortschritten in verwandten Technologiebereichen wie künstliche Intelligenz, maschinelles Lernen und Computer Vision genauer und ausgefeilter geworden. Heutzutage verwendet OCR-Software Mustererkennung, Merkmalserkennung und Text-Mining, um Dokumente schneller und genauer als je zuvor umzuwandeln.

FAQ

    Wie scanne ich Dokumente mit meinem Telefon oder Tablet?

    Öffnen Sie unter iOS die Notizen-App und erstellen Sie eine neue Notiz. Öffnen Sie die Kamera und tippen Sie dann auf Dokumente scannen. Öffnen Sie auf Android Google Drive und wählen Sie Plus (+) und tippen Sie dann auf Scan, um die zu scannen Dokument mit Ihrem Telefon.

    Wie verwende ich OCR in Adobe Acrobat?

    Öffnen Sie eine PDF-Datei, die ein gescanntes Bild enthält, und wählen Sie dann Extras > PDF bearbeiten. Acrobat wendet automatisch OCR an, sodass Sie den Text bearbeiten können. Wählen Sie einfach aus, wo Sie Änderungen vornehmen möchten, und beginnen Sie mit der Eingabe.

    Was ist der Unterschied zwischen OCR und OMR?

    Optical Mark Recognition (OMR) ist eine Software, die Markierungen auf Papier erkennt, typischerweise eine Blasenfolie. OMR wird verwendet, um die Ergebnisse von Prüfungen, Umfragen, Fragebögen und sogar Wahlen zu verarbeiten. Im Gegensatz zu OCR kann OMR die Markierungen auf der Seite nicht entziffern, sondern nur überprüfen, ob die Markierungen vorhanden sind.

Empfohlen: