Datenqualität

Datenqualität

Informationsqualität oder Datenqualität bezeichnet die Qualität, also Relevanz und Korrektheit von Informationen. Sie beschreibt, wie gut eine Information (bzw. ein Datensatz) geeignet ist, die Realität zu beschreiben, das heißt, inwieweit sie ein Modell tatsächlicher Situationen bildet. Insbesondere besagt sie, wie verlässlich eine Information ist und inwieweit man sie als Grundlage für eine Planung des eigenen Handelns verwenden kann.

Die Informationsqualität muss von der reinen Bedeutsamkeit (der Semantik) und vom formalen Informationsgehalt (der statistischen Signifikanz) unterschieden werden.

Es gibt eine große Zahl von Qualitätskriterien, deren Bedeutung vom Kontext und der Verwendung der Daten bzw. Informationen abhängt. Typische, häufig verwendete Qualitätskriterien sind Korrektheit, Vollständigkeit, Relevanz und Konsistenz.

Die IQ-Community (Information Quality) betrachtet die Qualität von Informationen (nach R. Wang) nach folgenden Kategorien und Dimensionen:

  1. Informationszugang:
    Systemzugang, Zugangssicherheit
  2. Darstellung:
    Interpretierbarkeit, Verständlichkeit, Manipulationsfähigkeit, Integrität und Widerspruchsfreiheit
  3. Informationszusammenhang:
    Relevanz, Zusatznutzen, Aktualität, Vollständigkeit, Informationsumfang
  4. Eigenwert:
    Richtigkeit, Objektivität, Glaubwürdigkeit, Reputation

Eine Systematik zur Ermittlung der Bedürfnisse der Informationsnutzer finden Sie hier: Download deutsche Übersetzung

Der Begriff der Informationsqualität wird in verschiedenen Bereichen in Hinblick auf unterschiedliche Aspekte verwendet.

Zur Optimierung der Informationsqualität in Informationssystemen wird die Qualität einzelner Datenquellen und Datensätze mittels einer Kostenfunktion anhand verschiedener Kriterien bewertet. Anhand von Präferenzen über die Qualitätskriterien kann eine Anfrage an das Informationssystem so optimiert werden, dass die Antwort eine möglichst hohe Informationsqualität besitzt!

Das Verbessern der Datenqualität wird Datenbereinigung genannt.

Inhaltsverzeichnis

Statistik

Eurostat definiert Datenqualität nach folgenden Gesichtspunkten:[1]

  • Relevanz der statistischen Konzepte (relevance): Benutzer, user needs, Gliederungstiefe und Gegenstand
  • Genauigkeit der Schätzergebnisse (accuracy & reliability):
    • Stichprobenfehler: Standardfehler, Konfidenzintervalle
    • Nichtstichprobenfehler: Nonresponse, Coverage Fehler, Messfehler
  • Aktualität und Pünktlichkeit der Datenbereitstellung (timeliness & punctuality): Zeitpunkt und Dauer der Datengewinnung bis zur Publikation
  • Kohärenz & Vergleichbarkeit von Statistiken (coherence & comparabilty): Vorläufige und endgültige Statistik, jährliche und unterjährige

Statistik bzw. Regionen, Teilgruppen, Zeit

  • Zugänglichkeit und Klarheit der Informationen (accessibility & clarity): Publikation der Daten, Methodenbericht, Vollständigkeit (nicht Teil des Code of Practice)

Natur- und Gesellschaftswissenschaften

In den Natur- und Gesellschaftswissenschaften spricht man besonders in Bezug auf Messungen und Erhebungen von Datenqualität. Dabei spielen vor allem Störeinflüsse, die Präzision der Messung und die Größe der Datenbasis, also die Anzahl der Messungen bzw. Befragungen, eine Rolle: Je weniger mögliche Störeinflüsse es gibt, je präziser die Messung und je größer die Anzahl der der Messungen ist, desto genauer bilden die resultierenden Daten die Realität ab und desto besser ist damit die Datenqualität. Wichtig ist es dabei, zu bedenken, dass eine gute Datenqualität allein nicht ausreicht, um ein gutes Modell zu konstruieren: hierfür muss auch die Interpretation der Daten insbesondere in Bezug auf die Kausalität korrekt sein.

Nachrichtenagenturen und Nachrichtendienste

Der Zweck von Nachrichtenagenturen und Geheimdiensten ist es, Informationen von möglichst guter Qualität zu sammeln und zur Verfügung zu stellen. Dabei ist es vor allem entscheidend, dass aus der Menge der zur Verfügung stehenden Daten diejenigen ausgewählt werden, die für das Klientel relevant sind, und dass diese in eine konsistente Form gebracht werden, ohne die Aussage zu verzerren. Insbesondere sollen Irrtümer und Fehlinformationen ausgeschlossen werden, häufig indem Nachrichten anhand mehrerer Quellen überprüft werden.

Wirtschaft

In der Wirtschaft ist Informationsqualität von zentraler Bedeutung, da auf Basis von Informationen z.B. Entscheidungen gefällt, Markt-Chancen bewertet und Verhandlungen geführt werden. All das kann nur so gut sein wie die zugrunde liegenden Daten bzw. Informationen. Oft wird der Begriff Datenqualität oder unternehmensweite Datenqualität als Synonym verwendet, obwohl streng genommen Informationsqualität korrekt ist.

Informationsqualität kann sich auf verschiedene Vorstellungen beziehen:

  • Produktbezogen; hier wird die Qualität als inhärente Eigenschaft betrachtet;
  • Anwenderbezogen; die Nutzung des Produkts definiert die Qualität;
  • Prozessbezogen; die Einhaltung der Spezifikation wird gewährleistet;
  • Wertbezogen; erstellt einen Bezug beispielsweise zwischen Preis und Qualität.

Eine schlechte Informationsqualität kann weitreichende Folgen haben, wenn sie nicht frühzeitig erkannt wird:

Beispiele:

  • Hotelreservierungen werden nicht gefunden wegen falsch geschriebener Namen.
  • Auf Grund unvollständiger Adressangaben werden Rechnungen an falsche Personen geschickt.
  • Wegen Übersetzungsfehlern werden aus Milliardenbeträgen ('billion') Billionenbeträge.

Siehe auch

Literatur

  • Jürgen Bode: Der Informationsbegriff in der Betriebswirtschaftslehre. In: Schmalenbachs Zeitschrift für betriebswirtschaftliche Forschung, 49. Jg., Nr. 5, S. 449-468, 1997.
  • Larry P. English: Improving Data Warehouse and Business Information Quality: Methods for Reducing Costs and Increasing Profits. New York: John Wiley & Sons, 1999.
  • Martin Eppler: Managing Information Quality: Increasing the Value of Information in knowledge-intensive Products and Processes. 2nd revised and extended Edition, New York/Berlin: Springer, 2006.
  • Gernot Gräfe: Informationsqualität bei Transaktionen im Internet. Wiesbaden: Dt. Univ.-Verl., 2005.
  • Knut Hildebrand, Marcus Gebauer, Holger Hinrichs, Michael Mielke (Hrsg.): Daten- und Informationsqualität: Auf dem Weg zur Information Excellence, Vieweg+Teubner Verlag, Wiesbaden 2008, ISBN 978-3-8348-0321-4
  • Thomas C. Redman: Data Quality for the Information Age. Boston: Artech House, 1996.
  • Richard Wang, Diane Strong: Beyond Accuracy: What Data Quality Means to Data Consumers. In: Journal of Management Information Systems, Bd. 12, Nr. 4, S. 5-33, 1996.
  • Holger Nohr, Management der Informationsqualität, Arbeitspapiere Wissensmanagement, Fachhochschule Stuttgart, Nr. 3/2001, ISSN 1616-5349 (Internet, PDF), ISSN 1616-530 (Print)
  • Carsten Kraus, Adress- und Kundendatenbanken für das Direktmarketing, Verlag Business Village, Göttingen 2004, ISBN 3-934424-59-7
  • Volker Würthele, Datenqualitätsmetrik für Informationsprozesse, Department of Computer Sciences, Abteilung Informationssysteme, Eidgenössische Technische Hochschule (ETH) Zürich, Verlag Books on Demand GmbH, Norderstedt 2003, ISBN 3833403454
  • Jan Rutenberg: Der Einfluss der Informationsqualität und -menge auf die Mental Convenience in Kaufentscheidungen. Verlag Dr. Kovač, Hamburg 2008, ISBN 978-3-8300-3696-8.

Weblinks

Einzelnachweise

  1. Methodological Documents: Definition of Quality in Statistics. In: www.epp.eurostat.ec.europa.eu. Working Group "Assessment of quality in Statistics". Abgerufen am 13. Juli 2007. (PDF, 133 kB)

Wikimedia Foundation.

Игры ⚽ Нужно решить контрольную?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Datenqualität (GIS) — Unter Datenqualität versteht man in Geografischen Informationssystemen die Beschreibung der Güte von Daten. Dabei kann man unterscheiden zwischen: Vollständigkeit Positionsgenauigkeit Attributsgenauigkeit zeitliche Genauigkeit Auflösung/Maßstab… …   Deutsch Wikipedia

  • Unternehmensweite Datenqualität — betrachtet Datenqualität in einem unternehmensweiten Kontext. Daten werden dabei als Produktionsfaktor und Unternehmenswert (engl. asset) betrachtet, der bewirtschaftet werden muss. Für diese Bewirtschaftung sind bestimmte Strukturen zu… …   Deutsch Wikipedia

  • Informationsqualität — oder Datenqualität bezeichnet die Qualität, also Relevanz und Korrektheit von Informationen. Sie beschreibt, wie gut eine Information (bzw. ein Datensatz) geeignet ist, die Realität zu beschreiben, das heißt, inwieweit sie ein Modell… …   Deutsch Wikipedia

  • Informationswert — Informationsqualität oder Datenqualität bezeichnet die Qualität, also Relevanz und Korrektheit von Informationen. Sie beschreibt, wie gut eine Information (bzw. ein Datensatz) geeignet ist, die Realität zu beschreiben, das heißt, inwieweit sie… …   Deutsch Wikipedia

  • Atmosphärenphysik — Dieser Artikel oder Abschnitt bedarf einer Überarbeitung. Näheres ist auf der Diskussionsseite angegeben. Hilf mit, ihn zu verbessern, und entferne anschließend diese Markierung. St …   Deutsch Wikipedia

  • Data Mining — Unter Data Mining (englisch für „Datenschürfen“) versteht man die systematische Anwendung von Methoden, die meist statistisch mathematisch begründet sind, auf einen Datenbestand mit dem Ziel der Mustererkennung. Hierbei geht es vor allem um das… …   Deutsch Wikipedia

  • Data mining — Unter Data Mining (englisch für „Datenschürfen“) versteht man die systematische Anwendung von Methoden, die meist statistisch mathematisch begründet sind, auf einen Datenbestand mit dem Ziel der Mustererkennung. Hierbei geht es vor allem um das… …   Deutsch Wikipedia

  • Dataminer — Unter Data Mining (englisch für „Datenschürfen“) versteht man die systematische Anwendung von Methoden, die meist statistisch mathematisch begründet sind, auf einen Datenbestand mit dem Ziel der Mustererkennung. Hierbei geht es vor allem um das… …   Deutsch Wikipedia

  • Datamining — Unter Data Mining (englisch für „Datenschürfen“) versteht man die systematische Anwendung von Methoden, die meist statistisch mathematisch begründet sind, auf einen Datenbestand mit dem Ziel der Mustererkennung. Hierbei geht es vor allem um das… …   Deutsch Wikipedia

  • Datenschürfung — Unter Data Mining (englisch für „Datenschürfen“) versteht man die systematische Anwendung von Methoden, die meist statistisch mathematisch begründet sind, auf einen Datenbestand mit dem Ziel der Mustererkennung. Hierbei geht es vor allem um das… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”