OCR

Home | OCR

OCR

Was ist OCR?

Laut der bei Wikipedia verfügbaren Definition, ist OCR (aus dem Englischen optical character recognition) ein „Satz von Techniken, bzw. Software, die zur Erkennung von Zeichen und ganzen Texten in Grafikdateien mit Rasterform dienen. Die Aufgabe von OCR ist für gewöhnlich die Texterkennung in einem eingescannten Dokument (z. B. einem Papierformular oder einer Buchseite)”.

Das war die Definition. Was die Dienstleistung betrifft, so versteckt sich hinter dem Begriff OCR u. a.:

  •   die Umwandlung von PDF- zu Word-Dateien (mit Beibehaltung des Layouts und der Grafik)
  •   die Umwandlung von Grafikdateien (Scans/Fotos) mit Textinhalten zum Word-Format
  •   fortgeschrittene Grafikbearbeitung von PDF-Dateien (Austausch des Textes/Übersetzung)
  •   Vorbereitung von Materialien zur Übersetzung für Übersetzungsbüros

Vorbereitung von Unterlagen zur Übersetzung

Unsere OCR-Dienste sind vor allem an Übersetzungsbüros gerichtet, für die wir die Quellenmaterialien bearbeiten und diese zur Übersetzung im .doc/.docx oder von CAT-Programmen (die Übersetzung unterstützende Programme) bediente Formate vorbereiten.

Nicht editierbare Dateien, wie z. B. Werbebroschüren oder Bedienungsanleitungen, in deren Fall ihre visuelle Präsentation eine essenzielle Rolle spielt – bedürfen häufig einer zusätzlichen Vorbereitung vor der Übersetzung.

OCR-Dienstleistungen erfordern häufig sowohl den Einsatz von OCR-Software, als auch die Arbeit von DTP-Experten, wie z. B. im Fall von Broschüren, Bedienungsanleitungen oder Werbematerial, das in Form von Scans, Fotos oder .pdf-Dateien von geringer Qualität übersendet wird. Bei nicht allzu komplizierten pdf-Dateien bietet häufig der alleinige Einsatz von OCR-Software bereits zufriedenstellende Ergebnisse. Die Qualität der erlangten editierbaren Dokumente hängt jedoch in hohem Maße vom Originaltext ab.