reCAPTCHA


reCAPTCHA
Beispiel einer reCAPTCHA-Eingabebox

reCAPTCHA ist ein CAPTCHA-Dienst, also ein Verfahren, um sicherzustellen, dass eine bestimmte Handlung im Internet von einem Menschen und nicht von einem Bot vorgenommen wird. Das Besondere ist die Tatsache, dass reCAPTCHA gleichzeitig für eine sinnvolle Leistung verwendet wird, nämlich zum Digitalisieren von Büchern und Zeitschriften.

Inhaltsverzeichnis

Geschichte

Laut einer Hochrechnung der Carnegie Mellon University verbringen Internetnutzer weltweit pro Tag 150.000 Stunden[1] damit, CAPTCHAs zu lösen. Die Regelmäßigkeit und Unentgeltlichkeit dieser Arbeitsleistung führte zu der Idee, sie für sinnvolle Zwecke einzusetzen. Der Informatiker Luis von Ahn hat dazu ein System namens reCAPTCHA programmiert, das bei der Buch-Digitalisierung eingescannte Wörter, die die Texterkennungssoftware nicht erkennt, durch die Eingabe von CAPTCHAs optimiert. Am 16. September 2009 wurde bekannt, dass Google das Unternehmen reCAPTCHA gekauft hat.[2] Google profitiert dadurch, weil es Teil seines Betätigungsfeldes ist, Bücher und andere Druckerzeugnisse zu digitalisieren.[3][4]

Funktion und Verwendung

Auf jedem CAPTCHA sind zwei Wörter abgebildet: Eines ist dem System bereits bekannt und bestätigt, das andere ist ein unerkanntes Wort aus einem Digitalisierungsprojekt.

Zwar kostet das Erkennen und Eingeben gleich zweier Wörter mehr Zeit als ein herkömmliches CAPTCHA aus zufälligen Buchstaben- und Zahlenkombinationen, jedoch sind die Benutzer, wenn sie einmal begonnen haben, auch bereit, zwei Wörter auf einmal zu lösen.

Der Nutzer beteiligt sich daran, durch dieses CAPTCHA kostenlos für das Gemeinwohl am Schrifterkennungsprojekt reCAPTCHA mitzuwirken (siehe Crowdsourcing). Zurzeit werden mit reCAPTCHA Bücher aus dem Internet Archive digitalisiert. Es gibt Plugins zur Integration in populäre Webapplikationen wie Lifetype, WordPress, TYPO3, Drupal, vBulletin, phpBB, Joomla oder MediaWiki. Viele Millionen Menschen beteiligen sich so an dem Projekt, ohne die genaue Absicht des Projekts zu kennen, und stellen ihre Leistung, die sie ohnehin zur Eingabe erbringen müssen, zur Verfügung.

Das Problem, herauszufinden, ob die Eingabe eines Nutzers korrekt ist, lässt sich statistisch lösen: Die Wortkombination wird innerhalb eines sehr kurzen Zeitraums mehreren Benutzern zugleich präsentiert und die häufigste Eingabe wird als richtig angenommen.

Google digitalisiert unter Verwendung von reCAPTCHA alle verfügbaren 130 Jahrgänge der New York Times. Innerhalb weniger Monate nach Beginn dieses Projekts im Jahr 2009 waren bereits 20 Jahrgänge digitalisiert.

Kritisiert wird an Google, dass ein reCAPTCHA-Benutzerkonto nur noch in Verbindung mit einem Google-Benutzerkonto nutzbar ist und neue Benutzerkonten nur mit einem Google-Benutzerkonto erstellt werden können.

Weblinks

Einzelnachweise

  1. Carnegie Mellon University: What is reCAPTCHA., 27. Januar 2004. [31. März 2006]
  2. Teaching computers to read: Google acquires reCAPTCHA. In: Official Google Blog. Google Inc., 16. September 2009, abgerufen am 5. November 2011 (englisch).
  3. http://googleblog.blogspot.com/2009/09/teaching-computers-to-read-google.html
  4. http://www.zdnet.de/news/wirtschaft_unternehmen_business_google_kauft_recaptcha_story-39001020-41502845-1.htm

Wikimedia Foundation.

Schlagen Sie auch in anderen Wörterbüchern nach:

  • ReCAPTCHA — is a system developed at Carnegie Mellon University which utilizes CAPTCHA to assist in the process of digitizing the text of books, while protecting websites from bots attempting to access restricted areas. reCAPTCHA supplies subscribing… …   Wikipedia

  • Recaptcha — Saltar a navegación, búsqueda El logo de reCAPTCHA reCAPTCHA es una extensión de la prueba CAPTCHA que se utiliza para reconocer texto presente en imágenes. reCAPTCHA se basa en el hecho de que para un ser humano puede ser simple determinar el… …   Wikipedia Español

  • ReCAPTCHA — Logo du reCAPTCHA …   Wikipédia en Français

  • ReCaptcha — Logo du reCAPTCHA …   Wikipédia en Français

  • ReCAPTCHA — Логотип reCAPTCHA reCAPTCHA  это система для защиты веб сайтов от интернет ботов (спам ботов), основанная на тесте Тьюринга и призванная оградить веб ресурсы от автоматических алгоритмов и программ путём генерации случайного текста и вывода… …   Википедия

  • reCAPTCHA — The reCAPTCHA logo reCAPTCHA is a system originally developed at Carnegie Mellon University s main Pittsburgh campus. It uses CAPTCHA to help digitize the text of books while protecting websites from bots attempting to access restricted areas.[ …   Wikipedia

  • reCAPTCHA — Логотип reCAPTCHA. reCAPTCHA  система, разработанная в университете Карнеги  Меллон для защиты веб сайтов от интернет ботов, и одновременной помощи в оцифровке текстов книг. Является продолжением проекта …   Википедия

  • reCAPTCHA — Logo du reCAPTCHA. Un exemple de reCAPTCHA : les mots à reconnaître sont «  …   Wikipédia en Français

  • ReCAPTCHA — CAPTCHA [ kæptʃə] ist ein Akronym für Completely Automated Public Turing test to tell Computers and Humans Apart. Wörtlich übersetzt bedeutet das „Vollautomatischer öffentlicher Turing Test, um Computer und Menschen zu unterscheiden“. CAPTCHAs… …   Deutsch Wikipedia

  • Captcha — [ kæptʃə] ist ein Akronym für Completely Automated Public Turing test to tell Computers and Humans Apart. Wörtlich übersetzt bedeutet das „Vollautomatischer öffentlicher Turing Test, um Computer und Menschen zu unterscheiden“. CAPTCHAs werden… …   Deutsch Wikipedia


Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”

We are using cookies for the best presentation of our site. Continuing to use this site, you agree with this.