OCRopus

Ocropus ist eine Open Source Text Erkennung (OCR) der besonderen Art. Zum einen, weil es Open Source ist und zum Anderen weil es modular aufgebaut ist. Jede der Komponenten — von der Vorverarbeitung der Eingabe, der Layout Analyse oder der Mustererkennung bis hin zur Darstellung der Ergebnisse — ist dank intelligenter Schnittstellen konfigurierbar und austauschbar! Es wäre dadurch durchaus zur automatischen Extraktion von Textelementen aus Bildern (Textscans — zB. Rechnungen) in einen wiederum automatischen Workflow integrierbar.

Die Software befindet sich noch im Alpha Stadium, kann jedoch bereits getestet werden (Linux). Eine erste Vollversion (1.0) ist für Ende 2008 geplant. Diese soll dann u.A. auch als Desktopanwendung für Linux, Mac und Windows bereitstehen.

http://www.ocropus.org

Schreibe einen Kommentar

Pflichtfelder sind mit * markiert.