Kolumne

03.04.2020 - Freitag

Glaube nicht mal mehr Statistiken, die du selbst gefälscht hast!

Es geht wieder mal um den Corona-WIRRUS, und um Statistiken über Covid-19.

Da ich mich schon ziemlich lange mit Statistiken, Risikoanalysen, Bedrohungsszenarien, Ausstiegsszenarien, Auswertung von Ergebnissen und ableiten von geeigneten Maßnahmen beschäftige, möchte ich durch diesen Beitrag zur allgemeinen Verwirrung mit beitragen. Verantwortung in dieser ernsten Situation zu übernehmen ist erste Bürgerpflicht, was ich hiermit tue.

Hinweisen möchte ich aus meiner Verantwortungspflicht gegenüber meinen Mitbürgern auch darauf, dass man auch gegenüber Statistiken mindestes 1,5 Meter Abstand halten sollte, besser ist mehr. Diese Dinger sind hoch infektiös. Am Besten ist, der Begegnung mit ihnen ganz auszuweichen. Ich berufe mich dabei auf die Verlautbarung des Robert-Kocht-Studios. Diese Institution ist zu 0% unabhängig.

Ich wohne ziemlich ländlich und gehe auch mal spazieren, um mir auch mal selbst zu begegnen, natürlich mit dem gebührenden Sicherheitsabstand.

Was mir aufgefallen ist, beim Betrachten der Natur, es gibt so gar nichts, was gleich ist. Selbst zwei Grashalme, die nebeneinander wachsen, sind nicht gleich. Mein Ego ist sofort präsent mit dem Argument: du hast gelernt 1+1=2, die Natur hat versagt, spazieren gehen ist nicht gut für den Geist.

Manchmal beginne ich dann mit mir zu diskutieren. Das ist nicht zielführend, weil ich nicht zugeben kann, dass ich Unrecht habe.

Wie ist das nun mit den Statistiken?

Ganz einfach gesagt … äh … hmmmm. Einfach geht nicht. Schade!

Also, die Statistik ist, Zahlen mit Hilfe einer Methode zu vermischen, um ein Ergebnis zu erhalten, von dem viele Menschen glauben sollen, dass es stimmt, weil es wissenschaftlich ist. Etwa so, dass geglaubt werde soll, dass ein Grashalm und noch ein Grashalm zwei Grashalme sind, obwohl die beiden Grashalme ziemlich unterschiedlich (bspw. unterschiedlich lang) sind.

Um dies zu erreichen, werden die Eigenschaften, die stören (bspw. die Länge der Grashalme) nicht mit betrachtet. Das wird dann auf der Vorletzten der 27 Seiten der Dokumentation zur Statistik erklärt. Sie finden diese Erklärungen ganz leicht. Suchen Sie einfach nach Darstellungen, die aussehen wie Ornamente oder Verzierungen auf dem Dokument.

Ist alles Störende wergornamentisiert, stellt man erleichtert fest, dass 1+1 tatsächlich zwei sind.

Wer so vorgeht, kann auch eine Exponentialfunktion/-kurve tatsächlich abflachen.

Zu Statistiken gehören auch sogenannte Korrelationen. Das sind Beschreibungen von Zusammenhängen, die darauf hinweisen sollen, dass die statistisch verglichenen Daten in einem plausiblen Zusammenhang stehen. Etwa so:

Die Anzahl der Störche korreliert (steht in einem kausalen Zusammenhang) mit r (Korrelationskoeffizient) =0,62 zu den Geburtenraten in den Ländern, in denen eine unterschiedliche Anzahl von Störchen gezählt werden, r ist mit 0,62 ziemlich hoch und damit statistisch hoch signifikant.

Das heißt: Wenige Störche, wenige Geburten, viele Störche viele Geburten.

http://www3.math.uni-paderborn.de/~agbiehler/sis/sisonline/struktur/jahrgang21-2001/heft2/Langfassungen/2001-2_Matth.pdf

So kann eine Statistik auf der Basis von Korrelationsberechnungen den Zusammenhang von zufälligen Alkoholvergiftungen und dem Preisanstieg von Uran begründen.

Wenn der Preis von Kartoffelchips steigt, fallen mehr Menschen aus ihren Rollstühlen.

Und jeder weiß doch, dass man bei Gewitter nicht betrunken draußen rumlaufen soll, man kann ganz schnell vom Blitz getroffen werden. Hier ist die Korrelation besonders hoch.

Wer in Texas verheiratet ist, sollte ganz genau hinsehen, wie sich die Anzahl der Rechtsanwälte in den Northern Mariana Islands ändert.

https://rp-online.de/panorama/wissen/lustige-scheinkorrelationen_bid-19620739#1

Dieses Phänomen ist so alt wie die Statistik und heißt „Scheinkorrelation“.

Es ist demnach fundamental, auf welcher Grundlage Daten in Form von Zahlen erhoben werden. Es besteht auch die Möglichkeit Daten zu erheben, die nicht durch Zahlen darstellbar sind (dies nur am Rande).

Das Schöne bei Daten, die auf der Grundlage von Zahlen erhoben werden ist, dass man diese Zahlen dann schön miteinander nach einer „wissenschaftlichen“ Methode vermischen kann.

Beispiel:

1= sehr hoch

2= hoch

3= mittel

4= niedrig

5=vernachlässigbar

Der Durchschnitt ist 3,2  was wird damit ausgesagt? Irgendwo zwischen mittel und niedrig.

Wenn wir dann noch die Wurzel daraus ziehen, wegen einer quadratischen Verteilung, um den Ausgangswert dieser Verteilung zu ermitteln (Wer kann hier noch folgen? … Super?), dann haben wir das Ergebnis 1,78. Jetzt sind wir am Ziel … na ja, fast, die Standardabweichung und die Varianz sind auch noch wichtig, um die Ausreißer einordnen zu können.

Ach ja, die Randbedingungen, die auch noch … die stehen in den Ornamenten.

Und dann weiß man was man hat.

Guten Abend!

RR