blog - about us and the world of data

mhcs_rssicon  subscribe to the mh cloud solutions newsfeed (mixed content in english and german)



Was hat der Teekrug mit Statistik zu tun?

Written by Markus Saturday, 23 January 2010 14:36

teapot

Statistik ist für viele ein bedrohliches Wort oder zumindest mit einem grossen Fragezeichen verbunden. Statistik ist auch ein Begriff, der für viele mit Datenmanipulation und Betrug verknüpft ist. Vielleicht haben Sie auch schon das berümte Zitat von Winston Churchill zitiert:

Traue keiner Statistik, die du nicht selbst gefälscht hast.

Immer ein gutes Argument, wenn irgendwelche Zahlen nicht in unser Weltbild passen.

Aber DIE Statistik als solches, ist nicht eine Studie oder Auswertung sondern eine Wissenschaft, ein Fach und für manche sogar eine Leidenschaft. Die Leidenschaft, aus den rohen, ungeschliffenen Datendiamanten, die uns unsere Umwelt liefert, hochkarätige Edelsteine zu schleifen. Wenn Sie die Altersrohdaten in Ihrer Familie sammeln und daraus den Altersdurchschnitt berechnen, haben Sie bereits einen kleinen solchen Diamanten hervorgebracht. Sie haben aus ein paar einzelnen Zahlen eine einzige Zahl generiert, welche Information über die Altersstruktur Ihrer Familie enthält.

Das ist Statistik! Der Durchschnitt (arithmetischer Mittelwert) ist nur der Anfang!

Die moderne Wissenschaft verfügt über eine unüberblickbare Fülle von statistischen Methoden, angefangen mit dem Mittelwert bis hin zu hochkomplexen Modellierungsalgorithmen für welche ganze Serverfarmen tagelang rechnen müssen, um zum Resultat zu gelangen.

R-galleryDies ist nicht verwunderlich, denn unsere Umwelt überhäuft uns ununterbrochen mit einer unendlichen Flut von Information (= Daten). Unsere Sinne verarbeiten vieles davon, ohne dass wir ins Schwitzen kommen, die Wissenschaft hingegen rackert sich ständig ab, um die Flut zu kanalisieren, zu filtern und zu verstehen. Nur schon die Form eines einfachen Teekrugs liefert uns tausende Datenpunkte, ohne dabei die Farbe, das Gewicht, den Schattenwurf oder etwa den Inhalt zu berücksichtigen. Wieviel mehr Datenpunkte uns im Vergleich zum Teekrug zum Beispiel unser Wetter liefert, ist kaum fassbar.

Auf diesem Hintergrund ist es veständlich, dass die Enwicklung von Software, welche für uns die gesammelte Datenmasse verarbeiten kann, ein wichtiger Bestandteil der Wissenschaft ist. Von den Banken über die Chemiker bis zu den Psychologen haben alle Disziplinen ihre bevorzugten Tools. Die Sozialwissenschaften benutzen sehr oft für die einfacheren Analysen SPSS. Programme wie SPSS können Daten nicht nur analysieren sondern haben immer auch ausgeklügelte Mechanismen, um Daten zu visualisieren und damit verständlicher zu machen. Die Daten unseres Teekrugs wurden aber nicht vom fast unerschwinglichen SPSS visualisiert sondern von R (The R Project for Statistical Computing), einer gratis Statistiksoftware. Der Teekrug ist nur ein Beispiel aus einer eindrücklichen Galerie an Visualisierungsmöglichkeiten von R.

 

 

finally online

Written by Markus Friday, 22 January 2010 13:21

Welcome to the brand new (paint still wet) mh cloud solutions website. We have been labouring silently so far and getting things done for our customers was more important than having our own website.

But now that we do have it, it feels good! It seems you're not aware of what you have been doing until you summarize it for yourself.