Internet Archive
Internet Archive
Internet Archive.jpg
http://www.archive.org
Motto Universal access to human knowledge
Kommerziell gemeinnützig
Beschreibung Web-Archivierung
Registrierung optional
Sprachen Oberfläche engl.
Eigentümer Internet Archive, San Francisco CA[1]
Urheber Brewster Kahle
Erschienen 1996

Das Internet Archive in San Francisco ist ein gemeinnütziges Projekt, das 1996 von Brewster Kahle gegründet wurde. Es hat sich die Langzeitarchivierung digitaler Daten in frei zugänglicher Form zur Aufgabe gemacht.

Es speichert Momentaufnahmen von Webseiten, Usenet-Beiträgen, Filmen, Tonaufnahmen (einschließlich von Live-Konzerten), Büchern und Software. Ein Spiegelserver der Daten von San Francisco befindet sich in der Bibliotheca Alexandrina.

Inhaltsverzeichnis

Dienste

Internet Archive in San Francisco (1996-2009)
Neue Zentrale des Internet Archive seit November 2009 in einer ehemaligen Christian Science-Kirche
Internet Archive in der Bibliotheca Alexandrina. Hinter den Glasscheiben stehen die Racks mit den Archivcomputern.

Zum Web-Archiv gehört die Wayback Machine („Take Me Back“), mit der man die gespeicherten Webseiten in verschiedenen Versionen abrufen kann. Die Auswahl der zu speichernden Seiten erfolgt über den Dienst Alexa Internet. Alle dort hinterlegten URLs werden regelmäßig aufgerufen und archiviert. Der Gesamtumfang betrug im November 2009 etwa 150 Milliarden Seiten. Die Seiten werden erst ca. sechs Monate nach dem Indexieren öffentlich verfügbar gemacht.

In dem Million Book Project werden durch das Internet Archive Bücher, die durch das Ablaufen des Copyrights (US-amerikanisches Urheberrecht) oder aus anderen Gründen gemeinfrei geworden sind, digitalisiert und in den Dateiformaten DjVu, TIFF und PDF zum Herunterladen zur Verfügung gestellt. Die Digitalisate sind Teil der Open Library.

Es werden mehrere Scan-Center (2009 insgesamt zwölf) unterhalten, zum Beispiel in Richmond. Gescannt wird per Auftrag, berechnet werden pro Seite zehn US-Cent (Stand 2009). Die Auftraggeber, meist Bibliotheken, erhalten das Digitalisat, eine per OCR erstellte Textdatei, eine persistente Internetadresse sowie die Möglichkeit, die Digitalisate auf den Servern des Vereins zu hosten.[2] Weiterhin bestehen Kooperationsvereinbarungen mit selbst digitalisierenden Bibliotheken für einzelne Dienste, wie OCR und redundantes Hosting.

Die Library of Congress hat im Dezember 2006 sechs Ausnahmen des US-Copyright-Gesetzes Digital Millennium Copyright Act gewährt.[3] Das Internet Archive darf somit Computer-Software oder -Spiele mit der Absicht der Erhaltung speichern, wenn die Originalhardware, -formate oder -technologie veraltet sind.

Das Archiv hat eine geschätzte Größe von drei Petabyte und wächst um ca. 100 Terabyte pro Monat.[4] Das Archiv ist vom US-Bundesstaat Kalifornien seit Anfang Mai 2007 offiziell als Bibliothek anerkannt.[5]

Kritik

Problematisch an der Wayback Machine ist zum einen, dass auch Inhalte erhalten bleiben, die die Autoren nicht mehr vertreten. Auch rechtswidrige Inhalte, etwa üble Nachreden, werden über Jahre der Öffentlichkeit zugänglich gemacht. Dies lässt sich jedoch durch eine entsprechende robots.txt-Datei[6] im Stammverzeichnis der Domain beheben.

Zum anderen wird nicht alles gesichert, beispielsweise werden Bilder von Internetseiten häufig nicht mitgesichert und stehen nach dem Verschwinden der Originalseite nicht mehr zur Verfügung.

Siehe auch

Weblinks

(enthält nach 2008 archivierte Inhalte, die über die Standard-Version nicht erreichbar sind)

Einzelnachweise

  1. Internet Archive: Contact
  2. Das digitale Alexandria. Die Zeit 4/2008
  3. Internet Archive wins copyright reprieve, The Register, 1. Dezember 2006
  4. Internet Archive to unveil massive Wayback Machine data center, Computerworld, abgerufen am 26. März 2009
  5. Internet Archive forum: Internet Archive officially a library
  6. http://www.archive.org/about/exclude.php

Wikimedia Foundation.

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Internet archive — Photo prise à la Bibliotheca Alexandrina : elle est contient une copie des documents de l Internet Archive. L Internet Archive (IA) est une organisation à but non lucratif consacrée à l archivage du Web, située dans le Presidio de …   Wikipédia en Français

  • Internet Archive — Not to be confused with the arXiv. For help citing the Internet Archive in English Wikipedia, see Wikipedia:Using the Wayback Machine. Coordinates: 37°46′56.3″N 122°28′17.65″W /  …   Wikipedia

  • Internet Archive — 37°46′56.3″N 122°28′17.65″O / 37.782306, 122.4715694 …   Wikipédia en Français

  • Internet Archive — Coordenadas: 37°48′0″N 122°27′37″O / 37.8, 122.46028 …   Wikipedia Español

  • Internet Archive — Es una pagina de Internet sin fines de lucro destinada a la preservación de la historia americana y de distintos países, creada en 1996, se encuentra en el Presidio de San Francisco. La colaboración que llevo a cabo la amplitud de esta pagina fue …   Enciclopedia Universal

  • Internet Archive — …   Википедия

  • Marxists Internet Archive — Screenshot of Marxists.org as on March 27, 2009 URL marxists.org Commercial? No Type of site Intern …   Wikipedia

  • Marxists' Internet Archive — Das Marxists Internet Archive (MIA; auch bekannt als marx.org oder marxists.org) ist das größte Internet Archiv von Originaltexten marxistischer Autoren und weiterer politisch linker Strömungen (Sozialisten, Anarchisten etc.). Die mehrsprachigen… …   Deutsch Wikipedia

  • Marxists Internet Archive — Das Marxists Internet Archive (MIA; auch bekannt als marx.org oder marxists.org) ist das größte Internet Archiv von Originaltexten marxistischer Autoren und weiterer politisch linker Strömungen (Sozialisten, Anarchisten etc.). Die mehrsprachigen… …   Deutsch Wikipedia

  • Marxists Internet Archive — Archives marxistes sur Internet Les Archives marxistes sur Internet (Marxists Internet Archive ou MIA en anglais), également connues sous le nom de marxists.org sont la création d une organisation à but non lucratif qui visent à proposer sur… …   Wikipédia en Français

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”