Statistiken interpretieren

Aus Tipps, Tricks und Anleitungen
Version vom 11. November 2015, 16:01 Uhr von Edit (Diskussion | Beiträge)

(Unterschied) →Nächstältere Version | Aktuelle Version ansehen (Unterschied) | Nächstjüngere Version← (Unterschied)
Wechseln zu: Navigation, Suche
Amazon-Werbung
Hinweis: Der Autor des Artikels ist kein ausgebildeter Fachmann zum Thema. Alle hier getroffenen Aussagen sind nach bestem Wissen sowie gegebenenfalls nach persönlicher Einschätzung des Autors getroffen. Dabei ist es leider nicht auszuschließen, dass einige Angaben veraltet, irreführend oder sonstwie fehlerhaft sind. Letztendlich liegt es in der Verantwortung jedes einzelnen Lesers, die hier gemachten Angaben zu überprüfen und gegebenenfalls weitere Informationen einzuholen. Der Autor kann und will darum keine Garantie oder Haftung für Probleme oder Verluste, die trotz oder wegen der Befolgung der hier genannten Ratschläge eintreten, übernehmen. Jeder Leser hat natürlich die Möglichkeit, die folgenden Ratschläge nicht zu befolgen oder sie gar nicht erst zu lesen.


Welche Fehler kann man beim Statistiken interpretieren oder erstellen machen?

Statistiken erlauben es, komplexe Sachverhalte in wenigen einfachen Zahlen oder Grafiken darzustellen. Dadurch kann der Leser die Aussage in kürzester Zeit verstehen oder mit anderen Daten in Verhältnis setzen. Allerdings sind Statistiken in den meisten Fällen nicht ganz so einfach zu verstehen, wie es zunächst aussieht. Es werden dabei nämlich sehr viele Daten auf eine kurze Aussage reduziert, denn eine Statistik soll ja eine Vereinfachung sein. Je nachdem, welche Informationen man dabei wegläßt, können Statistiken aber zu völlig unterschiedlichen Aussagen führen und letztlich bestimmt der Ersteller einer Statistik, was die Statistik aussagt. Durch unabsichtliche Fehler kann die Aussage, die beim Leser ankommt, falsch oder mißverständlich sein. Häufig werden diese Fehler beim Erstellen auch absichtlich gemacht, um gezielt eine falsche Aussage zu treffen und die Statistik oder den Leser zu manipulieren. Denn in den meisten Fällen liegt es im Interesse des Statistikerstellers, dass die Statistik gut für ihn aussieht.

Im folgenden sollen typische statistische Fehler aufgezeigt werden. Diese sollte man beim Erstellen einer ehrlichen Statistik vermeiden. Als Leser hingegen sollte man diese Fehler bei der Interpretation im Hinterkopf behalten und wissen, dass es zahlreiche Möglichkeiten gibt, dass die Statistik, die man gerade liest, manipuliert worden ist. Insbesondere bei Statistiken, die jemand, zum Beispiel in der Werbung, über sich selbst macht, sollte man eher davon ausgehen, dass auf die eine oder andere Weise manipuliert worden ist. Viele Manipulationen bewegen sich dabei im Graubereich. Das heißt, sie sind nicht wirklich geschummelt aber auch nicht wirklich wahr.

Zahlenfehler

Auch bei Statistiken können natürlich Rechenfehler oder Tippfehler gemacht werden. Dadurch wird die Statistik natürlich falsch. Solche Fehler werden selten gemacht und geschehen meist tatsächlich aus Versehen und nicht aus Absicht, zumal sie oft leicht entdeckt werden können und dann ein negatives Licht auf den Statitikersteller werfen würde. In manchen Fällen kann es auch zu Rundungsfehlern kommen. Diese führen bei einer prozentualen Statistik manchmal dazu dass die Summe nicht 100% ist.

Beispiel: Von 300 Testperson mögen genau 100 Produkt A, 100 mögen Produkt B und 100 mögen Produkt C. In Prozent sind das bei jedem Produkt 100/300 = 33,333...%. Wenn man die Zahlen auf ganze Zahlen rundet werden daraus bei jedem Produkt 33%. Wenn man die 33% von jedem Produkt wieder zusammenaddiert kommen jedoch nicht 100%, sondern nur 99% raus. In der Summe sieht es dann so aus, als hätte 1% gar keine Stimme abgegeben.

Weglassen von Statisken

Ein einfacher Weg, Statistiken zu "fälschen", ist es, ungünstige Statistiken unter den Tisch fallen zu lassen und nur günstige zu veröffentlichen. Man veröffentlicht also nur den Teil der "Wahrheit", die einen gut dastehen läßt.

Beispiel: Ein Unternehmen hat zwei Institute mit einer Umfrage beauftragt, die jeweils die Meinung zu einem Firmenprodukt abgeben sollen. In Umfrage A geben 34% an, das Produkt zu mögen, in Umfrage B sind es 73%. Es ist nicht schwer zu erraten, welches Ergebnis die Firma wohl in einer Werbekampagne verwenden wird...

Grundgesamtheit

Mit die wichtigste Grundlage einer Statistik ist die sogenannte Grundgesamtheit also das was die "100%" ausmacht. Das sind also "alle gefagten Personen", "alle getesten Produkte" und so weiter. Üblicherweise ist die Grundgesamtheit eine Stichprobe für eine viel größere Menge. Das heißt, man fragt vor der Wahl zum Beispiel 1000 Wähler, was sie wählen würden. Die 1000 Wähler sind dann die Grundgesamtheit und entsprechen 100%. Später soll das Ergebnis der Befragung der 1000 Wähler der Grundgesamtheit exemplarisch für das Ergebnis aller Wähler stehen. Man macht also die Stichprobe, weil man nicht alle Wähler fragen kann. Durch eine falsche Auswahl der Grundgesamtheit kann man das Ergebnis jedoch leicht verfälschen:

Zu kleine Stichprobe

Statistik beruht auf großen Zahlen und nicht auf Einzelmeinungen. Wenn man eine zu kleine Grundgesamtheit nimmt, werden die Ergebnisse sehr extrem und zufällig.

Beispiel: Wenn man nur 1 Person statt 1000 befragt, dann würde eine Partei 100% der Stimmen bekommen und alle anderen nichts. Das ist natürlich Blödsinn. Erst durch eine große Grundmenge wird das Ergebnis detaillierter und kann zufällige Schwankungen ausgleichen. Allerdings wird dieser Trick oft gezielt eingesetzt, in dem man zum Beispiel mit Absicht nur eine einzige Salatgurke auf EHEC-Keime testet, um dann zu sagen: "100% der von uns getesteten Salatgurken enthielten keine EHEC-Keime"

Unausgewogene Stichprobe

Die Stichprobe soll ja auf eine größere Menge übertragen werden. Darum muss die Grundgesamtheit in ihrer Zusammensetzung auch der größeren Menge entsprechen. Bei einer allgemeinen Aussage über die Meinung der Deutschen, müssen also alle Geschlechter, Gesellschaftsschichten usw. genauso häufig in der Grundgesamtheit vorkommen, wie sie eben in Deutschland vorkommen. Stichproben sind allerdings in den vielen Fällen prinzipiell nicht ausgewogen.

Beispiel: Wenn man eine Umfrage im Internet macht, dann fragt man nicht alle Deutschen, sondern nur Personen, die das Internet nutzen (und dort bereit sind, an Umfragen teilzunehmen). Gerade bei Umfragen im Internet kommt außerdem oft dazu, dass Abstimmungen von den Teilnehmern manipuliert werden können und einzelne Personen mehrfach abstimmen.

Beispiel: Wenn die Bild-Zeitung eine Umfrage unter ihren Lesern macht, kommt in den meisten Fällen ein anderes Ergebnis bei heraus, als wenn das Handelsblatt die gleiche Umfrage unter seinen Lesern macht. Beide Zeitungen würden die Statistik manipulieren, wenn sie aufgrund einer solchen Umfrage eine Schlagzeile bringen würden nach dem Motto: "75% aller Deutschen finden, dass..", denn es sind nicht 75% der Deutschen, sondern 75% der Leser einer bestimmten Zeitung.

Fragestellung

Die konkrete Fragestellung und das Umfeld kann eine Umfrage verfälschen, selbst wenn die Grundgesamtheit korrekt ausgewählt wurde.

Manipulieren der Testpersonen

Die Testpersonen können durch das Umfeld manipuliert werden.

Beispiel: Eine Firma macht in der Fussgängerzone einen Stand mit vielen Werbelogos und hübschen Hostessen. Außerdem verteilt sie kostenlose Probeexemplare und bietet ein Freigetränk für alle Passanten. An diesem Stand führt sie dann eine Umfrage zu ihrem Produkt durch. Es ist sehr wahrscheinlich, dass die Teilnehmer nach so viel Beeinflussung, eher eine positive Meinung haben."

Suggestive Fragen

Die Fragestellung beeinflußt bereits die zu erwartende Antwort. Selbst das Stellen einer Frage kann eine Beeinflussung sein.

Beispiel:: Die griechische verschwendet Steuergelder für ihren Beamtenapperat, während es in Deutschland kein Geld für die dringend notwendige Renovierung von Schulen und Kindergärten gibt. Finden sie, dass Deutschland weitere Gelder zur Rettung von Griechenland bereitstellen sollte?". (Hier wird der Beantworter bereits auf die Antwort "Nein" eingestimmt).

Beispiel: "Finden Sie, dass Orangenhaut bei Männern zu einer Beeinträchtigung des Selbstbewußtseins führen kann." Durch die vage Formulierung "kann" wird man ermuntert zuzustimmen, denn sein "kann" ja vieles. Ob es überhaupt ein Problem mit Orangenhaut bei Männern gibt, wird dabei irrelevant. Wenn jetzt 60% der Befragten mit "ja" antworten und ein Pharmaunternehmen dies als Werbung für ein Anti-Orangenhautprodukt hernimmt, bleibt die Tatsache unberücksichtigt, dass vor der Frage kaum einer ein Problem mit Orangenhaut bei Männern gesehen hat und auch nach der Frage nicht weiß, ob es überhaupt eines gibt. Das Umfrageergebnis suggeriert jedoch, dass es sich um eine wichtige Frage handeln könnte, mit der sich die Menschen tagtäglich beschäftigen.

Zahlen verbiegen

Auch das Zahlenmaterial selber kann man auf verschiedene Weise interpretieren. Hier gibt es soviele Möglichkeiten, dass es gar nicht möglich ist, alle Fehlermöglichkeiten zu benennen. Bei Zahlen verbiegen wird in den Zahlen das herausgeholt was noch günstig erscheint und es werden Zahlen so kombiniert, dass sie eine Aussage treffen, die eigentlich nicht da ist.

Beispiel: In einem Land gibt es nur zwei verschiedene Autotypen. Typ A werden 1 Million Autos gefahren, von Typ B 100 Autos. Autos von Typ A hatten im Jahr insgesamt 100 Pannen, Typ B-Autos hatten 10 Pannen. Wenn der Hersteller von Typ B nun behauptet, sein Auto wäre weniger pannenanfällig und die Konkurrenz hätte zehnmal soviele Pannen gehabt, dann wird hier die Wahrheit verbogen, denn in Wirklichkeit ist Typ B so pannenanfällig, dass bei ihm 100000 Pannen zu erwarten wären, wenn davon ebenfalls 1 Million Autos und nicht nur 100 Autos unterwegs wären.

Zahlendarstellung

Oft werden Statistiken in Form von Grafiken dargestellt, die das Ergebnis in einem einfachen Bild zusammenfassen. Doch dieses Bild kann bereits eine falsche Information beinhalten.

Beispiel: Bei der monatlichen Präsentation der Arbeitslosenzahlen oder auch der täglichen Börsenkurse werden meistens Zahlenkurven verwendet, bei denen der höchste Wert und der niedrigste Wert in dem Zeitraum als Grenzen genommen werden. Selbst wenn die Arbeitslosenzahl in einem Monat nur um 1000 Arbeitslose zurückgegangen ist, ergibt sich so eine steil abfallende Kurve, die so aussieht, als wäre die Arbeitslosigkeit massiv gesunken. Würde man hingegen die wirkliche Zahl der Arbeitslosen von derzeit etwa 3 Millionen zeigen und daneben die um 1000 verringerte Anzahl, dann ergäbe das zwei hohe Türme, die fast gleich hoch sind. Dort sieht man: die Arbeitslosenzahl hat sich in Wirklichkeit kaum verändert.

Beispiel: In der folgenden Darstellung werden Zahlenwerte als Kreisflächen dargestellt, was den Anschein erweckt, dass eine dreimal so große Kreisfläsche auch eine dreimal so große Zahl bedeutet. Der Zahlenwert für England ist mit 377,7 Mrd. Euro etwa dreimal so groß wie der von Spanien mit 123,4 Mrd. Euro. Ganz offensichtlich passt der spanische Kreis jedoch weit mehr als dreimal in den großen englischen Kreis, weil die englische Kreisfläche im Verhältnis viel zu groß dargestellt ist, und darum viel bedeutender aussieht als sie eigentlich ist: Wo lauern die Risiken für deutsche Banken? (Link leider nicht mehr vorhanden).