Die Berechnung statistischer Werte bei diskreten Häufigkeitsverteilungen ist mit Schwierigkeiten
verbunden. Auch Statistik-Funktionen in Calc (Tabellenkalkulationsprogramm in der freien und kostenlosen
Office-Suite LibreOffice) bzw. MS Excel wie etwa „MITTELWERT“, „MITTELABW“ oder „STABWN“ sind nicht direkt
anwendbar. Die nachfolgend dargestellten Formeln und die herunterladbaren Calc- bzw. Excel-Tabellen
„diskrete_Haeufigkeitsverteilung.ods“ und „diskrete_Haeufigkeitsverteilung.xlsx“ mögen in manchen Fällen
zur Problemlösung beitragen, da mit ihrer Hilfe eine unmittelbare Berechnung diverser statistischer Werte
ohne zusätzlich anzufertigender Tabellen möglich ist.
In Anlehnung an Michael Monka / Werner Voß, Statistik am PC, 4. Auflage, sei exemplarisch folgende
Tabelle einer diskreten Häufigkeitsverteilung aufgeführt, die sich auch in den herunterladbaren Calc- bzw.
Excel-Tabellen wiederfindet:
D
H
W
1
17
0,1416666667
2
33
0,275
3
34
0,2833333333
4
19
0,1583333333
5
10
0,0833333333
6
4
0,0333333333
7
2
0,0166666667
8
1
0,0083333333
Vorab werden zur Erläuterung der nachfolgenden Formeln einige Abkürzungen definiert:
„D“: Zahlenwerte „Daten“ als Merkmalsausprägung in einer
Spalte oder Zeile (in den herunterladbaren Tabellen in den Spalten A und F bzw. im so definierten Bereich
„D“);
„DD“: Zahlenwerte „Daten“ als Einzelaufstellung
(„Einzelwerte“) unter Verzicht auf absolute oder relative Häufigkeiten in einer Spalte oder Zeile (in den
herunterladbaren Tabellen in der Spalte H bzw. im so definierten Bereich „DD“) - üblicherweise würden dann
solche Einzelwerte mehrfach auftreten (ungruppierte Daten bzw. Multimenge);
„H“: Zahlenwerte „absolute Häufigkeit“ oder kurz
„Häufigkeit" in einer Spalte oder Zeile (in den herunterladbaren Tabellen in Spalte B bzw. im so
definierten Bereich „H“);
„W“: Zahlenwerte „relative Häufigkeit“ bzw.
„Wahrscheinlichkeit“ in einer Spalte oder Zeile mit der Summe 1 (in den herunterladbaren Tabellen in
Spalte G bzw. im so definierten Bereich „W“) als Alternative zu den Zahlenwerten „Häufigkeit“ („H“)
— wer sich hier am Begriff „Wahrscheinlichkeit“ stören sollte: im Falle einer endlosen zufälligen
Wahl von Einzeldaten aus dem Datenpool (Urnenmodell mit Zurücklegen) fällt die relative Häufigkeit der
Daten mit der jeweiligen Merkmalsausprägung präzise quantitativ mit der Wahrscheinlichkeit ihrer Wahl
zusammen;
„n“: Anzahl der Zahlenwerte „Einzelwerte“ („DD“) im Falle
des Fehlens der Zahlenwerte „Häufigkeit“ („H“) sowie „Wahrscheinlichkeit“ („W“).
Bei den nachfolgenden statistischen Werten werden jeweils 3 Fälle unterschieden:
absolute Häufigkeit:
Angaben über die absolute Häufigkeit der Werte („H“) sind vorhanden;
relative Häufigkeit:
Angaben über die relative Häufigkeit der Werte („W“) sind vorhanden, in den Formeln wird daher „H“
durch „W ⋅ ∑ H“ ersetzt und die Formeln anschließend neu berechnet;
Einzelwerte:
Angaben über absolute oder relative Häufigkeit der Werte („H“/„W“) sind nicht vorhanden, in den
Formeln wird daher „H“ (da - sofern es denn vorhanden wäre - immer = 1) eliminiert und
∑ H durch „n“ ersetzt.
normierter Gini-Koeffizient
bzw. Lorenz/Münzner-Maß:
(Monka/Voß Seite 106)
1) und 2) absolute und relative Häufigkeit:
entfallen
3) Einzelwerte:
Hinweis zu allen nachfolgenden Calc- und Excel-Formeln:
Die Kompliziertheit der Formeln ist nicht unwesentlich darauf zurückzuführen, dass die Daten nicht am
oberen bzw. linken Rand beginnen oder aufsteigend sortiert sein müssen. Die Funktion KKLEINSTE() innerhalb
der Funktion SUMMENPRODUKT() ermöglicht eine aufsteigende Quasisortierung.
Formel in Calc - die Daten sind in einer Spalte aufgeführt:
Hinweis:
LibreOffice lässt es aufgrund einer obskuren Fehlermeldung (in der Version 4.2.7) scheinbar nicht zu, eine
konsistente Formel anzubieten. In der obigen Formel wird folgender Formelteil in die (beliebig gewählte)
Zelle "XX" ausgelagert:
=ZEILE(DD)
Formel in Excel - die Daten sind in einer Spalte aufgeführt:
Der Faktor
macht aus dem einfachen den normierten Gini-Koeffizienten.
Die Funktion SUMMENPRODUKT()
lässt sich – wie oben demonstriert – in vielfältiger Weise einsetzen, wenn Formeln, die Summen ( ∑ )
enthalten, in Calc oder Excel umzusetzen sind. Die simpelsten Beispiele sind folgende (x und y stehen für
Spalten oder Zeilen):
∑ x+y → =SUMMENPRODUKT(x+y) – identisch mit SUMME(x;y)
∑ x-y → =SUMMENPRODUKT(x-y)
∑ x⋅y → =SUMMENPRODUKT(x*y)
∑ →
=SUMMENPRODUKT(x/y) – sofern keine Zelle in y = 0 oder leer ist!
∑ →
=SUMMENPRODUKT(x^y)
Der Begriff „SUMMENPRODUKT“ ist daher irreführend.