Information Retrieval Facility

Information Retrieval Facility
IRF logo

Das Information Retrieval Facility (kurz IRF) ist eine Forschungsplattform und dient der Zusammenarbeit von Experten im Bereich der Information Retrieval (IR). Sie wurde 2006 gegründet und hat ihren Sitz in Wien. Das IRF ist das weltweit erste E-Science-System, das ausschließlich der semantischen Verarbeitung von Text gewidmet ist. Vorsitzender des wissenschaftlichen Vorstandes ist Cornelis Joost van Rijsbergen. Zu den Mitarbeitern zählen unter Anderem Experten, Forscher und Studenten in den Bereichen Information Retrieval und Informationsmanagement.

Inhaltsverzeichnis

Ziele

Dieser Artikel oder Abschnitt besteht hauptsächlich aus Listen, an deren Stelle besser Fließtext stehen sollte.

Die wissenschaftlichen Ziele von Information Retrieval Facility sind:

  • Modellierung innovativer und fachbezogener Information-Retrieval-Systeme für globale Patentdokumentsammlungen.
  • Die Erforschung und Entwicklung einer adäquaten technischen Infrastruktur, die interaktive Experimente mit formalen und mathematischen Retrieval-Konzepten für sehr große Dokumentsammlungen ermöglicht.
  • Die Untersuchung der Usability von Multi Modal User-Interfaces sehr groß angelegter Information-Retrieval-Systeme
  • Integration von Usern und deren Bedürfnissen in den Prozess der Modellierung von Information-Retrieval-Systemen um eine genaue Leistungsbewertung zu ermöglichen.
  • die Möglichkeit unterschiedliche Ansichten von Patentdaten in Abhängigkeit von deren Fokus zu gewährleisten.
  • Definition standardisierter Methoden für die Bewertung der Information-Retrieval-Prozesse in den Patentschriftkollektionen
  • die Fähigkeit Text-und Nicht-Text-Teile eines Patents in einer kohärenten Weise in den Griff zu bekommen.
  • das Entwerfen, die Erprobung und Bewertung von Suchmaschinen die es ermöglichen strukturierte und semi-strukturierte Dokumente in sehr großen Patent-Sammlungen zu finden.
  • Die Integration der zeitlichen Dimension von Patentdokumenten in Retrieval-Strategien.
  • Die Verbesserung der Effizienz und Präzision von Patent-Retrieval basierend auf Ontologien und verschiedenen Sprach-Techniken.
  • Verbesserte IR-Methoden mit denen die Nutzung unstrukturierter Abfragen innerhalb eines Patentdokuments möglich wird.
  • Formale (mathematische) Identifikation und Spezifikation von Business-relevanten Informationen im Bereich der Intellectual Property
  • Erforschung von effizienten Skalierungsmechanismen im Information-Retrieval Bereich unter Berücksichtigung der Merkmale von Patentdaten.
  • Die Ermittlung und das Experimentieren mit Computing-Architekturen für sehr hohes Kapazität-Informations-Management.
  • Die Schaffung einer offene E-Science-Plattform die auf eine einheitliche und einfache Weise die Erstellung und Durchführung von IR-Experimenten auf einer gemeinsamen Forschungsinfrastruktur ermöglicht.
  • Die Entdeckung und Erforschung neuartiger Anwendungszwecke und Business-Anwendungen, die sich aus Informationen der Intellectual Property ergeben.
  • Aktivieren der formalen Information Retrieval, Sprachen und semantische Verarbeitungen in den Bereich der angewandten Wissenschaften, in der globalen, industriellen Kontext zu bringen.
  • Entwicklung und Integration von verschiedenen Informations-Zugriffsmethoden Forschung über effektive Methoden für die interaktive Information-Retrieval.

Semantic Supercomputing

Aktuelle Technologien zur Extraktion von Konzepten aus unstrukturierten Dokumenten sind mit intensiver Rechenleistung verbunden. Um das interaktive Experimentieren mit großen Text-Korpusen zu ermöglichen, besitzt das IRF eine High-Performance-Computing-Umgebung. Diese ist mit den neuesten Technologien ausgestattet:

  • Multi-Node Cluster (gegenwärtig 80 Core, bis zu 1024)
  • Höchstgeschwindigkeits-Interconnect Technologie
  • Single System Image mit großem Compound Memory (gegenwärtig 320 GB, bis zu 4 TB)
  • voll integriertes konfigurierbares Computing (gegenwärtig 4 FPGA Core, bis zu 256)

Die Kombination all dieser HPC Funktionen zur Beschleunigung des Text Mining Vorgangs repräsentiert IRF Weg zur Umsetzung des semantischen Supercomputing.

Welt Patent Corpus

Die Zielsetzung des IRF ist mit State-of-the-art Information-Retrieval-Technologien eine Plattform für Patent-Experten zu schaffen. Es wird erwartet dass die Information Retrieval (IR)-Technologien in den Mittelpunkt der Informationstechnologie treten werden. Alle Branchen profitieren von der Anwendung der Text Mining-Verfahren auf die jeweils speziellen Anforderungen der Patent-Forschung. Obwohl alle Ideen und Konzepte universell für alle Arten des geistigen Eigentums anwendbar sind sieht man sich doch immer wieder mit anspruchsvollen technischen und organisatorischen Probleme konfrontiert.

Der gesamte Korpus der Patent-Dokumente stellt möglicherweise den größten Korpus von zusammengesetzten Dokumenten dar, der es Text Mining Wissenschaftlern und Endnutzern gleichermaßen erlaubt, ihn zu für ihre Zwecke zu nutzen. Mehr noch Patente haben sich zu einem entscheidenden Thema insbesondere für große globale Unternehmen und Universitäten entwickelt. Die industriellen Anwender von Patentdaten gehören zu den anspruchsvollsten und wichtigsten Informationsprofis überhaupt. Als Folge daraus könnten genau diese Zielgruppen am meisten von einer Technologie profitieren die ihnen bei der Erforschung großer Datenmengen hilft.

Weblinks

Referenzen


Wikimedia Foundation.

Игры ⚽ Нужна курсовая?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Information Retrieval Facility — The Information Retrieval Facility (IRF), founded 2006 and located in Vienna, Austria, is a research platform for networking and collaboration for professionals in the field of information retrieval.The IRF has members in the following categories …   Wikipedia

  • Information-Retrieval — [ˌɪnfɚˈmeɪʃən ɹɪˈtɹiːvəl] (IR) bzw. Informationswiedergewinnung, gelegentlich Informationsbeschaffung, ist ein Fachgebiet, das sich mit computergestütztem inhaltsorientiertem Suchen beschäftigt. Es ist ein Teilgebiet der Informationswissenschaft …   Deutsch Wikipedia

  • Information retrieval — [ˌɪnfɚˈmeɪʃən ɹɪˈtɹiːvəl] (IR) bzw. Informationswiedergewinnung, gelegentlich Informationsbeschaffung, ist ein Fachgebiet, das sich mit computergestütztem inhaltsorientiertem Suchen beschäftigt. Es ist ein Teilgebiet der Informationswissenschaft …   Deutsch Wikipedia

  • Information Retrieval — [ˌɪnfɚˈmeɪʃən ɹɪˈtɹiːvəl] (IR) bzw. Informationsrückgewinnung, gelegentlich ungenau Informationsbeschaffung, ist ein Fachgebiet, das sich mit computergestütztem Suchen nach komplexen Inhalten (also z. B. keine Einzelwörter) beschäftigt und… …   Deutsch Wikipedia

  • Information retrieval — This article is about information retrieval in general. For the fictional government department, see Brazil (film). Information retrieval (IR) is the area of study concerned with searching for documents, for information within documents, and for… …   Wikipedia

  • Information Lifecycle Management — NOTOC Information Lifecycle Management refers to a wide ranging set of strategies for administering storage systems on computing devices. Specifically, four categories of storage strategies may be considered under the auspices of ILM.PolicyILM… …   Wikipedia

  • Building information modeling — (BIM) is the process of generating and managing building data during its life cycle[1]. BIM involves representing a design as objects – vague and undefined, generic or product specific, solid shapes or void space oriented (like the shape of a… …   Wikipedia

  • Building Information Modeling — (BIM) is the process of generating and managing building data during its life cycle [Lee, G., Sacks, R., and Eastman, C. M. (2006). Specifying parametric building object behavior (BOB) for a building information modeling system. Automation in… …   Wikipedia

  • Zero Gravity Research Facility (B-2) — Infobox nrhp | name =Zero Gravity Research Facility (B 2) nrhp type = nhl caption = location= Cleveland, Ohio lat degrees = 41 lat minutes = 24 lat seconds = 44 lat direction = N long degrees = 81 long minutes = 51 long seconds = 51 long… …   Wikipedia

  • UCLA Graduate School of Education and Information Studies — Infobox University name = UCLA Graduate School of Education and Information Studies established =1881 as the Los Angeles State Normal School. Became part of UC system in 1919. School of Education and the School of Library and Information Science… …   Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”