nach oben
Meine Merkliste
Ihre Merklisteneinträge speichern
Wenn Sie weitere Inhalte zu Ihrer Merkliste hinzufügen möchten, melden Sie sich bitte an. Wenn Sie noch kein Benutzerkonto haben, registrieren Sie sich bitte im Hanser Kundencenter.

» Sie haben schon ein Benutzerkonto? Melden Sie sich bitte hier an.
» Noch kein Benutzerkonto? Registrieren Sie sich bitte hier.
Ihre Merklisten
Wenn Sie Ihre Merklisten bei Ihrem nächsten Besuch wieder verwenden möchten, melden Sie sich bitte an oder registrieren Sie sich im Hanser Kundencenter.
» Sie haben schon ein Benutzerkonto? Melden Sie sich bitte hier an.
» Noch kein Benutzerkonto? Registrieren Sie sich bitte hier.

« Zurück

Ihre Vorteile im Überblick

  • Ein Login für alle Hanser Fachportale
  • Individuelle Startseite und damit schneller Zugriff auf bevorzugte Inhalte
  • Exklusiver Zugriff auf ausgewählte Inhalte
  • Persönliche Merklisten über alle Hanser Fachportale
  • Zentrale Verwaltung Ihrer persönlichen Daten und Newsletter-Abonnements

Jetzt registrieren
Merken Gemerkt
Methoden - Qualitätswerkzeuge

Die explorative Datenanalyse nach Tukey

Die explorative Datenanalyse (EDA) nach Tukey [1] ist ein statistische Werkzeug, um Daten zu untersuchen und Hinweise für mögliche Hypothesen zu sammeln, die anschließend durch spezifische Tests verifiziert werden können. Aus der Vielzahl der Analysewerkzeuge für Qualitätsingenieure ist die EDA, die die untersuchten Daten mit Hilfe grafischer Methoden darstellt [2], ein einfach anwendbares und nützliches Instrument bei der Suche nach Fehlerursachen oder Möglichkeiten für Qualitätsverbesserungen.

Der beste Zeitpunkt für die EDA ist direkt nach der Erfassung der Daten. Auf Basis der gewonnenen Erkenntnisse können vorläufige Hypothesen formuliert werden, die anschließend mit Hilfe statistischer Methoden wie etwa Hypothesentest, Regressionsanalyse, Varianzanalyse (ANOVA) oder nicht-parametrischer Tests überprüft werden können.Typische Werkzeuge der EDA sind Stamm-Blatt-Diagramme und Boxplots [3].

Verteilung der Daten

Tukey demonstrierte den Nutzen von Boxplots anhand von Niederschlagsdaten aus New York City von 1886 bis Anfang 2013 [4, 5]. Die Niederschlagsdaten wurden dazu zunächst auf volle Zoll gerundet. Anschließend wurden sie mit Hilfe eines Statistikprogramms als Stamm-Blatt-Diagramm dargestellt. In Bild 1 ist eine Häufung bei 38 und 39 Zoll zu erkennen.

Bild 1: Stamm-Blatt-Diagramm: Niederschlag mit einer Häufung bei 38 und 30 Zoll

Die Daten wurden danach als eindimensionales Streudiagramm (Dotplot) übertragen. Bild 2 zeigt eine Häufung bei 38 Zoll mit einigen wenigen Ausreißern bis fast 56 Zoll. Das Dotplot nutzt Punkte statt wie beim Histogramm Balken, um so die einzelnen Datenpunkte darzustellen.

Bild 2: Dotplot: Darstellung der einzelnen Datenpunkte

Das Histogramm zeigt dieselben Daten (Bild 3). Ebenso wie das Stamm-Blatt-Diagramm und das Dotplot zeigt das Histogramm die Verteilung der Daten und ihre Häufung bei 38 Zoll mit Ausreißern im hohen Bereich.

Bild 3: Histogramm: Darstellung der Häufigkeiten und der Verteilung

Für die praktische Nutzung bedeutet das:

Ein Qualitätsingenieur kann mit Hilfe eines Stamm-Blatt-Diagramms, Dotplots oder Histogramms auf den ersten Blick die Verteilung der Daten erkennen.

Entwicklung über die Zeit

Um etwaige Tendenzen zu entdecken, sollten die Daten zusätzlich als Zeitreihe aufgetragen werden. In der Zeitreihe wird eine Zunahme der Niederschlagsmenge über die gesamte Zeit erkennbar (Bild 4). Die durchschnittliche Niederschlagsmenge variiert von Jahr zu Jahr. In den 90erJahren kommen einzelne Jahre mit geringerem Niederschlag als in den 80er Jahren vor, obwohl eine deutliche Wachstumstendenz vorhanden zu sein scheint.

Bild 4: Zeitreihen: Darstellung der Entwicklung in einer Zeitreihe

Diese Tendenz zeigt sich noch deutlicher, wenn die Daten in Gruppen zu je 19 Jahren aufgeteilt werden, mit Ausnahme der letzten Gruppe, was in Bild 5 durch ein Boxplot-Diagramm dargestellt wird. Boxplots, auch Box-Whiskers-Plot genannt, sind ein einfacher aber wirksamer Teil der EDA. Der Kasten („Box“) wird durch die Grenzen des ersten und vierten Quartils begrenzt und enthält somit die mittleren 50% der Daten. Die Linie durch den Kasten steht dabei für den Median, das Pluszeichen im Kreis für den arithmetischen Mittelwert. Die obere und untere Linien („Whiskers“) kennzeichnen die äußeren Quartile, Ausreißer werden als Sternchen dargestellt.

Die Boxplots zeigen für das Beispiel eine Erhöhung der Spannweite der Daten in den letzten vier Jahrzehnten im Vergleich zu den früheren Jahren. Es hat außerdem den Anschein, als sei es in New York in den letzten 40 Jahren nasser geworden.

Bild 5: Boxplot: Grafische Darstellung der Streuungs- und Lagemaße

Für die praktische Nutzung bedeutet das:

Jede der EDA-Methoden könnte Hinweise zur weiteren Auswertung liefern, und die Anwendung aller vier Methoden wäre im Rahmen einer echten Analyse nicht erforderlich gewesen. Ein Qualitätsingenieur könnte sich mit Hilfe eines Box- oder Dotplots in Verbindung mit einer Zeitreihe schnell einen Überblick über beispielsweise die Daten eines Herstellungsprozesses verschaffen.

Instrument für die Ursachensuche

Im Beispiel der New Yorker Niederschlagsdaten wird im Folgenden (Bild 6) das Ergebnis eines Zweistichproben-T-Tests dargestellt. Die Nullhypothese bestand in der Annahme, dass Niederschlagsmenge zwischen 1896 und 1915 gleich ist wie die zwischen 1996 und 2013. Die Alternativhypothese geht von einem Unterschied aus.

Bild 6: Zweistichproben-T-Test und 95%-Zufallsfehlerbereich

Wäre dieser Test für die Durchmesser der Zylinder durchgeführt worden, hätte ein Qualitätsingenieur feststellen können, wie sich die Durchmesser im Lauf der Zeit verändert haben. Auf Basis dieser Ergebnisse könnte der Qualitätsingenieur beginnen, die Ursache für eine Veränderung im Durchmesser zu suchen.

Matthew Barsalou

1. Tukey, John W., Exploratory Data Analysis. Reading, MA: Addison-Wesley Publishing Company. 1977. ISBN 0-201-07616-0

2. Sedlmeier, Peter. Jenseits der Signifikanztest-Rituals: Ergänzungen und Alternativen. Methodsof Psychological Research Online. V.1 . N. 4. 1996. http://www.dgps.de/fachgruppen/methoden/mpr-online/issue1/art3/sedlmeier.pdf

3. Schäfer, Thomas. Statistik I: Deskriptive und Explorative Datenanalyse. Wiesbaden: VS Verlag für Sozialwissenschaften. 2010. ISBN 9783531169392

4. Tukey, John W. Exploratory Data Analysis. Reading, MA: Addison-Wesley Publishing Company. 1977. ISBN 0-201-07616-0

5. National Oceanographic and Atmospheric Administration. National Climate Data Center. http://www.ncdc.noaa.gov/temp-and-precip/time-series/index.php?parameter=pcp&month=1&year=1913&filter=12&state=30&div=0

Matthew Barsalou, Engineering Quality Expert bei BorgWarner Turbo Systems Engineering GmbH

matthew.barsalou <AT> gmail.com

DIN EN ISO 9001:2015

Zum ISO 9001:2015 Special

Prozesswelt

Serie zum Thema Prozesse, veröffentlicht von QM-Experten deutscher Unternehmen gemeinsam mit der N5 GmbH und der Fachzeitschrift QZ

Zur Prozesswelt