Autor Thema: Service-Tipp: OCR  (Gelesen 368 mal)

Martin Lemke

  • Administrator
  • *****
  • Beiträge: 14581
  • TK 2130 Lübeck, Schleswig-Holstein, Germany
    • Spinnenerfassung in SH
Service-Tipp: OCR
« am: 2018-10-03 07:39:30 »
Kyrillische PDF-Dateien (z.B. vom WSC) sind manchmal ein Ärgernis, wenn sie nur aus Bilddateien bestehen. Dann kann auch translate.google.de nicht helfen. Eine OCR-Lösung muss her. Mal eben 100 € auszugeben, um Daten fürs Wiki zu gewinnen, finde ich nicht attraktiv.

Gerade fand ich folgenden Service: https://onlineocr.net/

Nach der Konvertierung fehlt zwar jede Textformatierung, aber für unsere Zwecke ist das egal. Der so gewonnene Text kann per Copy & Paste bei translate.google.de eingegeben und z.B. ins Deutsche übersetzt werden. Fürs Wiki ist das eine sehr große Hilfe.

Ob das auch für Chinesisch u.s.w. funktioniert, habe ich noch nicht ausprobiert. Falls es (oder eine andere Sprache) von Euch jemand ausprobiert hat, wäre hier ein Hinweis hilfreich.

Martin
DAS waren noch Zeiten: Nowegen 2011.

Martin Lemke

  • Administrator
  • *****
  • Beiträge: 14581
  • TK 2130 Lübeck, Schleswig-Holstein, Germany
    • Spinnenerfassung in SH
Re: Service-Tipp: OCR
« Antwort #1 am: 2018-10-03 08:17:35 »
Ich sehe gerade: Wenn man das Pech hat, dass die gewünschte Info hinter der 15. Seite des Dokumentes liegt, muss man auch hier bezahlen. Registriert muss man hier nach 120 Tagen bezahlen oder die PDF-Datei mit irgend einem Tool vorher splitten.

:-(

Wenistens hat uns dieser Service für die Seite von Berlandina nabozhenkoi gute Dienste geleistet. Die kyrillische Beschreibung stand gleich am Anfang.

Martin
DAS waren noch Zeiten: Nowegen 2011.