Agrep

grep [gɹɛp] ist ein wichtiges Programm, das unter den Betriebssystemen Unix und Unix-Derivaten der Suche und Filterung definierter Zeichenketten in Dateien dient. Es wurde ursprünglich von Ken Thompson entwickelt.[1]

Der Begriff steht für global/regular expression/print[2][3] oder auch global search for a regular expression and print out matched lines[4], also etwa „globale Ausgabe regulärer Ausdrücke. Historisch entwickelte sich der Name aus dem Kommando g/re/p des Unix-Standardeditors ed.

Es existieren zahlreiche Varianten wie egrep, fgrep und agrep, das eine unscharfe Suche nach Textstrings ermöglicht.

Inhaltsverzeichnis

Anwendung

In der Kommandozeile wird grep meist zur Suche in Dateien eingesetzt. Der Befehl kann auch in Shell-Skripten, beispielsweise in Pipes, eingesetzt werden.

Durch Kommandozeilenschalter kann die Arbeitsweise von grep geändert werden, so ist es beispielsweise möglich,

  • alle Zeilen herauszusuchen, die den angegebenen Text nicht enthalten,
  • nur Zeilen herauszusuchen, in denen das Suchmuster als ganzes Wort enthalten ist,
  • die Zeilennummern, in denen der Text enthalten ist, auszugeben sowie
  • den Dateinamen aller Dateien auszugeben, die den angegebenen Text enthalten.

Die GNU-Variante bietet darüber hinaus die Möglichkeit, nicht die komplette Zeile auszugeben, in der ein Ausdruck vorkommt, sondern lediglich alle Vorkommen des Ausdrucks selbst.

agrep

agrep (Approximate GREP) ist eine besondere Version aus der Familie der grep-Programme, die im Gegensatz zu allen Varianten eine unscharfe (fuzzy) Textstringsuche ermöglicht.

agrep wurde in den Jahren 1988-1991 von Udi Manber und Sun Wu an der Universität von Arizona entwickelt und bildet den Kern der Suchmaschine GLIMPSE bzw. HARVEST. Das Programm benutzt aus einer Vielzahl von eingebauten Suchalgorithmen denjenigen, der dem regulären Ausdruck der Benutzereingabe (Suchstring) am besten angepasst ist und die schnellste Suche ermöglicht.

Um 1996 wurde es erstmalig nach OS/2 und DOS, später nach Windows portiert.

agrep steht nicht unter der GNU General Public License, ist aber frei für den privaten und nicht kommerziellen Gebrauch. In einer erneuten Initiative wird derzeit nochmals versucht, die Universität von Arizona zu einer Freigabe zu bewegen.

agrep gehört nicht zur eigentlichen Gruppe der GNU-Utilities.

egrep

egrep (Extended grep) ist zur einfacheren Suche mit erweiterten regulären Ausdrücken geeignet. So haben die Zeichen ?, +, {, |, (, und ) bei egrep eine besondere Bedeutung für den Ausdruck, und müssen mit einem umgekehrten Schrägstrich (engl.: backslash) geschützt werden, wenn sie als Text gefunden werden sollen.

fgrep

fgrep kann immer anstelle von grep verwendet werden, falls das zu suchende Muster keine regulären Ausdrücke enthält. Alle Sonderzeichen in der Musterzeichenkette verlieren ihre Sonderbedeutung und werden als Bestandteil des Musters verstanden. Fgrep arbeitet dadurch etwas schneller als grep und ist vor allem beim Durchsuchen großer Datenmengen nützlich. Man benutzt hierfür den Aho-Corasick-Algorithmus, der auch der Originalversion diente.

Einsatzgebiete

Grep wird in erster Linie dann eingesetzt, wenn Dateien durchsucht werden müssen, zum Beispiel die Quelldateien eines Computerprogramms oder Logdateien. In Zusammenarbeit mit find kann ein ganzer Dateibaum gelesen werden.

$ find /home/benutzername -exec grep -H "Passwort" {} \;

Durchsucht alle Dateien des Quellverzeichnisses des Benutzers benutzername nach der Zeichenkette Passwort und zeigt die gefundenen Zeilen zusammen mit dem Dateinamen an.

Ein zweites Einsatzgebiet ist der automatisierte Aufruf in allen Arten von Shell-Skripten, oft im Rahmen einer Kette von Befehlen.

Microsoft Windows

Wie von vielen Programmen, so gibt es auch Portierungen von grep auf die Windows-Plattform. Als eingebauten Befehl kennt Windows die Befehle find und findstr, die eine ähnliche Funktion wie grep erbringen. In den Resource Kit Tools ist QGREP.EXE enthalten. [5][6]

Anmerkungen

  1. Brian Kernighan: A Regular Expression Matcher, http://beautifulcode.oreillynet.com/
  2. grep Manual, Punkt 14, http://www.gnu.org/software/grep/doc/grep_13.html
  3. Prof. J. Plate, FH München, http://www.netzmafia.de/skripten/unix/unix5.html
  4. Linuxfibel, http://de.linwiki.org/wiki/Linuxfibel_-_Unix-Werkzeuge_-_Grep
  5. Resource Kit Tools zu Windows 98, ftp://ftp.microsoft.com/Services/TechNet/samples/ps/win98/reskit/file/
  6. Windows Server 2003 Resource Kit Tools (auch für Windows XP), http://www.microsoft.com/downloads/details.aspx?familyid=9d467a69-57ff-4ae7-96ee-b18c4790cffd

Siehe auch

Weitere Weblinks


Wikimedia Foundation.

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Agrep — (approximate grep) is a fuzzy string searching program, developed by Udi Manber and Sun Wu between 1988 and 1991, for use with the Unix operating system. It was later ported to OS/2, DOS, and Windows.It selects the best suited algorithm for the… …   Wikipedia

  • AGREP —   Agricultural Research Projects, a database in Integrated Information Systems (SII) …   Glossary of the European Union and European Communities

  • Egrep — grep [gɹɛp] ist ein wichtiges Programm, das unter den Betriebssystemen Unix und Unix Derivaten der Suche und Filterung definierter Zeichenketten in Dateien dient. Es wurde ursprünglich von Ken Thompson entwickelt.[1] Der Begriff steht für… …   Deutsch Wikipedia

  • Fgrep — grep [gɹɛp] ist ein wichtiges Programm, das unter den Betriebssystemen Unix und Unix Derivaten der Suche und Filterung definierter Zeichenketten in Dateien dient. Es wurde ursprünglich von Ken Thompson entwickelt.[1] Der Begriff steht für… …   Deutsch Wikipedia

  • GREP — [gɹɛp] ist ein wichtiges Programm, das unter den Betriebssystemen Unix und Unix Derivaten der Suche und Filterung definierter Zeichenketten in Dateien dient. Es wurde ursprünglich von Ken Thompson entwickelt.[1] Der Begriff steht für… …   Deutsch Wikipedia

  • Grep — [gɹɛp] ist ein wichtiges Programm, das unter den Betriebssystemen Unix und Unix Derivaten der Suche und Filterung definierter Zeichenketten in Dateien dient. Es wurde ursprünglich von Ken Thompson entwickelt.[1] Der Begriff steht für… …   Deutsch Wikipedia

  • grep — [gɹɛp] ist ein Programm, das unter den Betriebssystemen Unix und Unix Derivaten der Suche und Filterung definierter Zeichenketten aus Dateien dient. Es wurde ursprünglich von Ken Thompson entwickelt.[1] Der Begriff grep steht für global/regular… …   Deutsch Wikipedia

  • GLIMPSE — is a text indexing and retrieval software program originally developed at the University of Arizona by Udi Manber, Sun Wu, and Burra Gopal. A web server version called WebGlimpse is now being maintained under a pay per line licence. Neither… …   Wikipedia

  • Fuzzy string searching — Approximate string search is the name that is used for a category of techniques for finding strings that approximately match some given pattern string. It may also be known as approximate or inexact matching. Approximate string searching has two… …   Wikipedia

  • Regular expression — In computing, a regular expression provides a concise and flexible means for matching (specifying and recognizing) strings of text, such as particular characters, words, or patterns of characters. Abbreviations for regular expression include… …   Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”