Informationsqualität

Informationsqualität

Informationsqualität oder Datenqualität bezeichnet die Qualität, also Relevanz und Korrektheit von Informationen. Sie beschreibt, wie gut eine Information (bzw. ein Datensatz) geeignet ist, die Realität zu beschreiben, das heißt, inwieweit sie ein Modell tatsächlicher Situationen bildet. Insbesondere besagt sie, wie verlässlich eine Information ist und inwieweit man sie als Grundlage für eine Planung des eigenen Handelns verwenden kann.

Inhaltsverzeichnis

Begriffsdefinition

Die Informationsqualität muss von der reinen Bedeutsamkeit (der Semantik) und vom formalen Informationsgehalt (der statistischen Signifikanz) unterschieden werden.

Es gibt eine große Zahl von Qualitätskriterien, deren Bedeutung vom Kontext und der Verwendung der Daten bzw. Informationen abhängt. Typische, häufig verwendete Qualitätskriterien sind Korrektheit, Vollständigkeit, Relevanz und Konsistenz.

Die IQ-Community (Information Quality) betrachtet die Qualität von Informationen (nach R. Wang) nach folgenden Kategorien und Dimensionen:

  1. Informationszugang:
    Systemzugang, Zugangssicherheit
  2. Darstellung:
    Interpretierbarkeit, Verständlichkeit, Manipulationsfähigkeit, Integrität und Widerspruchsfreiheit
  3. Informationszusammenhang:
    Relevanz, Zusatznutzen, Aktualität, Vollständigkeit, Informationsumfang
  4. Eigenwert:
    Richtigkeit, Objektivität, Glaubwürdigkeit, Reputation

Die Deutsche Gesellschaft für Informations- und Datenqualität (DGIQ) hat auf Basis des Bewertungssystems von R. Wang eine deutsche Übersetzung vorgeschlagen. Sie empfiehlt, diese im deutschen Sprachraum einheitlich zu verwenden. Eine grafische Übersicht der 15 IQ-Dimensionen kann auf der Seite der DGIQ abgerufen werden.[1]

Der Begriff der Informationsqualität wird in verschiedenen Bereichen in Hinblick auf unterschiedliche Aspekte verwendet.

Zur Optimierung der Informationsqualität in Informationssystemen wird die Qualität einzelner Datenquellen und Datensätze mittels einer Kostenfunktion anhand verschiedener Kriterien bewertet. Anhand von Präferenzen über die Qualitätskriterien kann eine Anfrage an das Informationssystem so optimiert werden, dass die Antwort eine möglichst hohe Informationsqualität besitzt!

Das Verbessern der Datenqualität wird Datenbereinigung genannt.

Statistik

Eurostat definiert Datenqualität nach folgenden Gesichtspunkten:[2]

  • Relevanz der statistischen Konzepte (relevance): Benutzer, user needs, Gliederungstiefe und Gegenstand
  • Genauigkeit der Schätzergebnisse (accuracy & reliability):
    • Stichprobenfehler: Standardfehler, Konfidenzintervalle
    • Nichtstichprobenfehler: Nonresponse, Coverage Fehler, Messfehler
  • Aktualität und Pünktlichkeit der Datenbereitstellung (timeliness & punctuality): Zeitpunkt und Dauer der Datengewinnung bis zur Publikation
  • Kohärenz & Vergleichbarkeit von Statistiken (coherence & comparabilty): Vorläufige und endgültige Statistik, jährliche und unterjährige

Statistik bzw. Regionen, Teilgruppen, Zeit

  • Zugänglichkeit und Klarheit der Informationen (accessibility & clarity): Publikation der Daten, Methodenbericht, Vollständigkeit (nicht Teil des Code of Practice)

Natur- und Gesellschaftswissenschaften

In den Natur- und Gesellschaftswissenschaften spricht man besonders in Bezug auf Messungen und Erhebungen von Datenqualität. Dabei spielen vor allem Störeinflüsse, die Präzision der Messung und die Größe der Datenbasis, also die Anzahl der Messungen bzw. Befragungen, eine Rolle: Je weniger mögliche Störeinflüsse es gibt, je präziser die Messung und je größer die Anzahl der Messungen ist, desto genauer bilden die resultierenden Daten die Realität ab und desto besser ist damit die Datenqualität. Wichtig ist es dabei, zu bedenken, dass eine gute Datenqualität allein nicht ausreicht, um ein gutes Modell zu konstruieren: hierfür muss auch die Interpretation der Daten insbesondere in Bezug auf die Kausalität korrekt sein.

Nachrichtenagenturen und Nachrichtendienste

Der Zweck von Nachrichtenagenturen und Geheimdiensten ist es, Informationen von möglichst guter Qualität zu sammeln und zur Verfügung zu stellen. Dabei ist es vor allem entscheidend, dass aus der Menge der zur Verfügung stehenden Daten diejenigen ausgewählt werden, die für die Klientel relevant sind, und dass diese in eine konsistente Form gebracht werden, ohne die Aussage zu verzerren. Insbesondere sollen Irrtümer und Fehlinformationen ausgeschlossen werden, häufig indem Nachrichten anhand mehrerer Quellen überprüft werden.

Wirtschaft

In der Wirtschaft ist Informationsqualität von zentraler Bedeutung, da auf Basis von Informationen z.B. Entscheidungen gefällt, Markt-Chancen bewertet und Verhandlungen geführt werden. All das kann nur so gut sein wie die zugrunde liegenden Daten bzw. Informationen. Oft wird der Begriff Datenqualität oder unternehmensweite Datenqualität als Synonym verwendet, obwohl streng genommen Informationsqualität korrekt ist.

Informationsqualität kann sich, ebenso wie ein allgemeiner Qualitätsbegriff, auf verschiedene Vorstellungen beziehen (nach der klassischen Einteilung von Garvin)[3]

  • produktbezogen; hier wird die Qualität als inhärente Eigenschaft betrachtet;
  • anwenderbezogen; die Nutzung des Produkts definiert die Qualität;
  • prozessbezogen; die Einhaltung der Spezifikation wird gewährleistet;
  • wertbezogen; erstellt einen Bezug beispielsweise zwischen Preis und Qualität.

Eine schlechte Informationsqualität kann weitreichende Folgen haben, wenn sie nicht frühzeitig erkannt wird.

Beispiele:

  • Hotelreservierungen werden nicht gefunden wegen falsch geschriebener Namen.
  • Auf Grund unvollständiger Adressangaben werden Rechnungen an falsche Personen geschickt.
  • Wegen Übersetzungsfehlern werden aus Milliardenbeträgen ('billion') Billionenbeträge.
  • Schlechte Kreditwürdigkeit durch Scoring-Verfahren wegen falscher Ausgangsdaten.

Siehe auch

Literatur

  • Jürgen Bode: Der Informationsbegriff in der Betriebswirtschaftslehre. In: Schmalenbachs Zeitschrift für betriebswirtschaftliche Forschung, 49. Jg., Nr. 5, S. 449-468, 1997.
  • Larry P. English: Improving Data Warehouse and Business Information Quality: Methods for Reducing Costs and Increasing Profits. New York: John Wiley & Sons, 1999.
  • Martin Eppler: Managing Information Quality: Increasing the Value of Information in knowledge-intensive Products and Processes. 2nd revised and extended Edition, New York/Berlin: Springer, 2006.
  • Gernot Gräfe: Informationsqualität bei Transaktionen im Internet. Wiesbaden: Dt. Univ.-Verl., 2005.
  • Knut Hildebrand, Marcus Gebauer, Holger Hinrichs, Michael Mielke (Hrsg.): Daten- und Informationsqualität: Auf dem Weg zur Information Excellence, Vieweg+Teubner Verlag, Wiesbaden 2008, ISBN 978-3-8348-0321-4
  • Thomas C. Redman: Data Quality for the Information Age. Boston: Artech House, 1996.
  • Richard Wang, Diane Strong: Beyond Accuracy: What Data Quality Means to Data Consumers. In: Journal of Management Information Systems, Bd. 12, Nr. 4, S. 5-33, 1996.
  • Holger Nohr, Management der Informationsqualität, Arbeitspapiere Wissensmanagement, Fachhochschule Stuttgart, Nr. 3/2001, ISSN 1616-5349 (Internet, PDF), ISSN 1616-530 (Print)
  • Carsten Kraus, Adress- und Kundendatenbanken für das Direktmarketing, Verlag Business Village, Göttingen 2004, ISBN 3-934424-59-7
  • Volker Würthele, Datenqualitätsmetrik für Informationsprozesse, Department of Computer Sciences, Abteilung Informationssysteme, Eidgenössische Technische Hochschule (ETH) Zürich, Verlag Books on Demand GmbH, Norderstedt 2003, ISBN 3833403454, (online PDF)
  • Jan Rutenberg: Der Einfluss der Informationsqualität und -menge auf die Mental Convenience in Kaufentscheidungen. Verlag Dr. Kovač, Hamburg 2008, ISBN 978-3-8300-3696-8.

Weblinks

Einzelnachweise

  1. Graphische Übersicht der 15 IQ-Dimensionen. In: www.dgiq.de. Deutsche Gesellschaft für Informations- und Datenqualität, abgerufen am 2. Juli 2009. (PDF, 96 kB)
  2. Methodological Documents: Definition of Quality in Statistics. In: www.epp.eurostat.ec.europa.eu. Working Group "Assessment of quality in Statistics", abgerufen am 13. Juli 2007. (PDF, 133 kB)
  3. David A. Garvin, What Does "Product Quality" Really Mean?, In: Sloan Management Review, 1984, Jahrgang 26, Heft 1, S. 25-43

Wikimedia Foundation.

См. также в других словарях:

  • Datenqualität — Informationsqualität oder Datenqualität bezeichnet die Qualität, also Relevanz und Korrektheit von Informationen. Sie beschreibt, wie gut eine Information (bzw. ein Datensatz) geeignet ist, die Realität zu beschreiben, das heißt, inwieweit sie… …   Deutsch Wikipedia

  • Informationswert — Informationsqualität oder Datenqualität bezeichnet die Qualität, also Relevanz und Korrektheit von Informationen. Sie beschreibt, wie gut eine Information (bzw. ein Datensatz) geeignet ist, die Realität zu beschreiben, das heißt, inwieweit sie… …   Deutsch Wikipedia

  • InfoWeb Weiterbildung — Das InfoWeb Weiterbildung (IWWB) war ursprünglich ein vom Bundesministerium für Bildung und Forschung (BMBF) finanziertes Projekt (Laufzeit 2002 bis 2004), das das Ziel hatte, die Transparenz in der Weiterbildung zu erhöhen. Dazu wurden… …   Deutsch Wikipedia

  • Infoweb Weiterbildung — Das InfoWeb Weiterbildung (IWWB) war ursprünglich ein vom Bundesministerium für Bildung und Forschung (BMBF) finanziertes Projekt (Laufzeit 2002 bis 2004), das das Ziel hatte, die Transparenz in der Weiterbildung zu erhöhen. Dazu wurden… …   Deutsch Wikipedia

  • Data Cleaning — Zur Datenbereinigung (engl. data cleansing oder data scrubbing) gehören verschiedene Verfahren zum Entfernen und Korrigieren von Datenfehlern in Datenbanken oder anderen Informationssystemen. Die Fehler können beispielsweise aus inkorrekten… …   Deutsch Wikipedia

  • Data Cleansing — Zur Datenbereinigung (engl. data cleansing oder data scrubbing) gehören verschiedene Verfahren zum Entfernen und Korrigieren von Datenfehlern in Datenbanken oder anderen Informationssystemen. Die Fehler können beispielsweise aus inkorrekten… …   Deutsch Wikipedia

  • Data scrubbing — Zur Datenbereinigung (engl. data cleansing oder data scrubbing) gehören verschiedene Verfahren zum Entfernen und Korrigieren von Datenfehlern in Datenbanken oder anderen Informationssystemen. Die Fehler können beispielsweise aus inkorrekten… …   Deutsch Wikipedia

  • Datenfehler — Zur Datenbereinigung (engl. data cleansing oder data scrubbing) gehören verschiedene Verfahren zum Entfernen und Korrigieren von Datenfehlern in Datenbanken oder anderen Informationssystemen. Die Fehler können beispielsweise aus inkorrekten… …   Deutsch Wikipedia

  • Bedeutsamkeit — (Relevanz, Wichtigkeit) ist eine Bezeichnung des Grades der Wichtigkeit, der Sinnhaftigkeit, der Genauigkeit oder für die Stärke des Einflusses auf andere Dinge und Zusammenhänge. Sie ist ein Kriterium für Informationsqualität. Bedeutsamkeit… …   Deutsch Wikipedia

  • Datenbereinigung — Zur Datenbereinigung (engl. data cleaning oder data editing) gehören verschiedene Verfahren zum Entfernen und Korrigieren von Datenfehlern in Datenbanken oder anderen Informationssystemen. Die Fehler können beispielsweise aus inkorrekten… …   Deutsch Wikipedia


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»