Kajetan hat geschrieben: ↑28.02.2019 10:52
Liesel Weppen hat geschrieben: ↑28.02.2019 10:35
Mit Leuten, die das nicht verstehen, oder nicht verstehen wollen, das "Die Deutschen" nicht jeder Einzelne ist, ist jede weitere Diskussion überflüssig, weil sinnfrei.
Ich möchte hier noch ein realweltliches Beispiel bringen:
[...]
Ein wunderbares Beispiel dafür, dass die Bevölkerung im Schnitt exakt 0 Plan von Statistik hat. So wirklich nicht im geringsten.
Das ist vor allem vor dem Hintergrund, dass man von Morgens bis Abends auf sämtlichen Nachrichtenkanälen mit statistischen Daten konfrontiert wird, erschreckend.
Um ein kleines Beispiel anzuführen:
Wir ziehen eine Stichprobe aus der deutschen Bevölkerung. Unser Ziel ist, das "durchschnittliche" Alter der Deutschen zu ermitteln.
Sei unsere Stichprobe also definiert, wie folgt: S = {X1, X2, X3}, wobei X1-Xn die konkreten Auspägungen der Zufallsvariable "Alter" sind.
Sei eine konkrete Manifestation dieser Stichprobe nun: S={5, 25, 60};
Der Median (das, was im Artikel als Schätzwert für das "durchschnittliche" Einkommen eines Angestellten der jeweiligen Unternehmen herangezogen wird) halbiert unsere Stichprobe genau in der Mitte.
Der Median unserer Stichprobe S ist also, bei S = {5, 25, 60} = [X1=5, X2=25, X3=60] => Median(S) = X2 = 25.
Das arithmetische Mittel unserer Stichprobe S ist also, bei S = {5, 25, 60} = [X1=5, X2=25, X3=60] => 1/3*∑S = 1/3*(5+25+60) = 30.
Wir sehen: Der Median unserer Stichprobe ist 25, der arithmetische Mittel ist 30.
Die Fragen, die nun von Relevanz sind, sind folgende: welcher dieser beiden Schätzwerte ist "richtiger" und welche der beiden Methoden ist weniger anfällig für Fehler?
Prinzipiell: bei einer ausreichend großen Stichprobe, die im besten Fall die komplette Grundgesamtheit, also alle deutschen Bürger, erfasst, wird das arithmetische Mittel uns den EXAKTEN Altersdurchschnitt der Republik geben.
ABER: In der Statistik ist die Grundgesamtheit sehr oft unbekannt und das arithmetische Mittel tendiert dazu, durch (starke) Ausreißer nach oben und/oder unten, verzerrt zu werden.
Folglich ist der Median, sofern man NICHT die Grundgesamtheit kennt, oder aber annehmen muss, dass einige Werte in der Statistik das arithmetische Mittel überproportional verzerren, das Mittel der Wahl, um schnell einen guten Schätzwert zu erhalten.
Um dies an unserem Beispiel deutlich zu machen:
Sei eine zweite Stichprobe S2 = {20, 25, 85}.
Der Median ist weiterhin 25. Das arithmetische Mittel ist jedoch 43,33.
Welche Statistik ist nun besser? Welche Statistik sagt uns mehr? Im Zweifel sind sowohl S1, also auch S2 völlig unbrauchbar, da sie nicht representativ sind. Ganz offensichtlich ist jedoch der Median nicht so schwankungsanfällig, aufgrund extremer Ausschläge der Zufallsvariable Alter, wie das arithmetische Mittel.
Das waren jetzt ad hoc runtergeschriebene Basics, um einen Schätzwert aus einer Menge von manifestierten Werten zu ermitteln. Allein mit diesen beiden Varianten der Ermittlung eines Schätzwertes lässt sich schon eine Menge "Schindluder" treiben, um Leute, die sich mit Statistik nicht auskennen, in die Irre zu führen.
Wir können auf Grundlage meiner kleinen Stichproben bereits drei unterschiedliche Aussagen treffen: Die Deutschen sind im Schnitt 25 Jahre alt, die Deutschen sind im Schnitt 30 Jahre alt und die Deutschen sind im Schnitt 43,33 Jahre alt.
Sind alle Deutschen 25/30/43,33 Jahre alt? Nein, natürlich nicht.
Und um damit den Bogen zu schlagen: Sind ALLE Deutschen reich und schwelgen in Luxus? NEIN. ABER: im Schnitt sind die Deutschen reich und schwelgen im Luxux, relativ zum Rest der Welt.
Es besteht kein direkter Zusammenhang zwischen dem Mittelwert oder dem Median einer Stichprobe und den tatsächlichen Werten "Alter" der Grundgesamtheit, da man mit beidem lediglich einen mehr oder weniger genauen Näherungswert finden wird.
Aber um über Dinge zu reden, bedarf es nunmal einer gewissen Abstraktion und da sind statistische Verallgemeinerung eine gute Basis. Diese Basis ist allerdings nur so gut, wie die erhobenen Stichproben.
Wenn man nun über eine Statistik über die Deutschen redet und anmerkt, dass ja nicht jeder Deutsche Merkmal X der Statistik in dieser Form aufweist, dann ist das zwar eine korrekte Beobachtung und Feststellung, bringt der Diskussion allerdings überhaupt nichts.