Ocrad

Ocrad
Ocrad
Entwickler Antonio Diaz Diaz
Aktuelle Version 0.21
(11. Januar 2011)
Betriebssystem Unix-ähnlich (Linux, ...)
Programmier­sprache C++
Lizenz GPL (Freie Software)
www.gnu.org/software/ocrad

Ocrad ist eine freie Texterkennungs-Software (OCR) für die Linux-Kommandozeile, die seit 2003 von Antonio Diaz Diaz im Rahmen des GNU-Projekts entwickelt wird.

Es akzeptiert Rastergraphiken in Netpbm-Formaten (PBM, PGM, PPM) kann neben 8-Bit-kodiertem Text auch in UTF-8 ausgeben und bietet automatische Erkennung der Seitengestaltung. Es ist in C++ geschrieben. Es basiert auf Merkmalserkennung, also der Extraktion von Merkmalen eines Zeichens.

Das Programm wird als freie Software auch im Quelltext unter den Bedingungen von Version 3 oder höher der GNU General Public License (GPL) verbreitet. Es ist bei den meisten populären Linux-Distributionen direkt aus den Standard-Paketquellen installierbar.[1][2][3]

Es existieren verschiedene Programme, die sich als graphisches Frontend anbieten: Die ehemalige KDE-Scan-Software Kooka oder die Desktop-OCR-Suite OCRFeeder.

Leistung

Gegenüber dem ähnlichen GOCR hat es die Seitengestaltungserkennung voraus und steht in dem Ruf, allgemein etwas bessere Ergebnisse zu liefern. Somit war es bis zur Freigabe von Tesseract im Jahr 2005 (2006?) neben GOCR eine der besten und gebräuchlichsten Texterkennungs-Softwares aus den Bereichen der Freien Software und Linux-Software. Neben gebräuchlicher guter kommerzieller Software sind die Erkennungsleistungen deutlich abgeschlagen.[4]

Weblinks

Quellen

  1. http://packages.ubuntu.com/search?gocr
  2. https://admin.fedoraproject.org/pkgdb/acls/name/ocrad
  3. http://software.opensuse.org/search?q=ocrad
  4. http://www.linux-magazin.de/Heft-Abo/Ausgaben/2006/12/Abc-Schuetzen/%28offset%29/2

Wikimedia Foundation.

Игры ⚽ Поможем сделать НИР

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Ocrad — Developer(s) Antonio Diaz Diaz Stable release 0.21 / January 11, 2011; 9 months ago (2 …   Wikipedia

  • Ocrad — Este artículo o sección necesita referencias que aparezcan en una publicación acreditada, como revistas especializadas, monografías, prensa diaria o páginas de Internet fidedignas. Puedes añadirlas así o avisar a …   Wikipedia Español

  • OCRFeeder — OCRFeeder …   Википедия

  • Оптическое распознавание символов — (англ. optical character recognition, OCR)  механический или электронный перевод изображений рукописного, машинописного или печатного текста в текстовые данные  последовательность кодов, использующихся для представления символов в… …   Википедия

  • List of optical character recognition software — An OCR SDK is a software development kit for adding optical character recognition capabilities to forms processing applications, document imaging management systems, e discovery systems and records management solutions. In order to avoid the… …   Wikipedia

  • OCRFeeder — Developer(s) Joaquim Rocha (Igalia) …   Wikipedia

  • Optical character recognition — Optical character recognition, usually abbreviated to OCR, is the mechanical or electronic translation of scanned images of handwritten, typewritten or printed text into machine encoded text. It is widely used to convert books and documents into… …   Wikipedia

  • Document Layout Analysis — is a part of Computer Vision indicating the process of identifying and categorizing the regions of interest in a document image, e.g. a scanned page. A reading system requires the segmentation of text zones from non textual ones and the… …   Wikipedia

  • OmniPage — Nuance OmniPage Developer(s) Nuance Communications Stable release 18 (Windows platform) X (Macintosh platform) Operating system Mac OS 9 Mac OS X Windows 2000 Windows Vista Windows XP …   Wikipedia

  • SmartScore — Developer(s) Musitek Corporation Stable release 10.3.3 (as of 7.12.2010) Operating system Windows, Mac OS Type …   Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”