Baseball und der Gender-Gap

31.10.2024 – „Traue keiner Statistik, die nicht beschreibt, wie sie zustande gekommen ist“, sagt Versicherungsmathematiker Christoph Krischanitz in diesem dritten Teil unserer „Statistik“-Serie. Um keine falschen Schlüsse aus einer Statistik zu ziehen, muss man einen Blick auf die Methodik ihrer Entstehung werfen. Krischanitz beschreibt, wie der „Simpson“-Effekt ein verzerrtes Bild entstehen lässt.

Autor Christoph Krischanitz (Bild: Krischanitz)
Autor Christoph Krischanitz (Bild: Krischanitz)

Die beiden späteren Teamkollegen bei der Baseball-Mannschaft New York Yankees, Derek Jeter und David Justice, waren schon als junge Spieler herausragende Schläger. Immer wieder wurden Vergleiche angestellt, wer von beiden denn der bessere Hitter sei.

Insbesondere in den Jahren 1995 und 1996 zeigten die Jahresstatistiken jeweils eine bessere Schlagquote von David Justice gegenüber Derek Jeter. Die Schlagquote beschreibt die Quote der gelungenen Schläge an den gültigen Schlagversuchen.

Man könnte also vermuten, dass der jüngere Justice seinem Vorbild Jeter in diesen Jahren beim Schlagen der Bälle überlegen war. Wenn man in jedem einzelnen Jahr besser ist, muss man doch auch insgesamt besser sein, so die These, und eigentlich klingt es logisch.

Überraschung

Überraschenderweise zeigte sich dann aber bei einer gemeinsamen Betrachtung dieser beiden Jahre, dass in der Gesamtstatistik Derek Jeter seinem Konkurrenten in der Schlagquote deutlich voraus gelegen war. Wie ist das möglich? Zauberei, Fehlberechnung oder Betrug?

Nun, weder noch. Es handelt sich hierbei um ein statistisches Phänomen, das schon in den frühen Jahren des vorigen Jahrhunderts diskutiert wurde. Erstmals fundiert beschrieben wurde es von Edward H. Simpson im Jahre 1951, und seither trägt es den Namen Simpson-Paradoxon (oder Simpson-Effekt).

Das Simpson-Paradoxon erklärt

Der Effekt ist leicht zu erklären. Nachdem die Schlagquoten zwischen den Jahren 1995 und 1996 insgesamt stark variierten (1995 war generell ein schwächeres Jahr, während 1996 ein starkes Jahr für beide war), kommt es in der Berechnung der Gesamtquote darauf an, wie viele Schlagversuche man in den einzelnen Jahren hatte.

  • Derek Jeter hatte nur wenige Schlagversuche im schlechten Jahr, aber viele Schlagversuche im guten Jahr 1996, sodass seine Schlagquote aus 1996 in der Gesamtstatistik sehr hoch gewichtet ist.
  • Bei David Justice war es umgekehrt. Er hatte seine meisten Schläge im schlechten Jahr 1995 und nur wenige im guten Jahr 1996, daher ist das schlechte Jahr übergewichtet.

Durch diese unterschiedliche Gewichtung konnte Jeter insgesamt eine bessere Quote erzielen.

Wer war also besser? Obwohl nun insgesamt Jeter die bessere Schlagquote aufweisen kann, muss man doch festhalten, dass Justice sowohl unter schlechten, als auch unter guten Bedingungen besser war als Jeter, hier würde man Justice also den Vorzug geben. Im Jahr 2001, als beide Spieler gemeinsam bei den NYY spielten, war Jeter jedoch deutlich konstanter und besser als Justice.

Vorsicht vor falschen Schlüssen

Dieses Beispiel zeigt deutlich einen Effekt, der immer auftritt, wenn man sich Quoten auf aggregierten Daten ansieht.

Als Aktuare haben wir uns schon in den frühen 2000er Jahren gegen den damals beliebten „Lady-Rabatt“ aufgelehnt, der genau auf diesem Effekt gegründet war (die Damen fuhren damals wesentlich kleinere Autos als die Herren, daher hat sich aufgrund der hohen Gewichtung kleiner Autos ein deutlich niedriger Gesamtschadenbedarf für Frauen ergeben, der aber nichts mit Geschlechterunterschieden im Fahrverhalten zu tun hatte, weshalb ein zusätzlicher Prämiennachlass nicht gerechtfertigt war).

Hier sei auch auf den politisch motivierten Gender-Gap hingewiesen, der nicht notwendigerweise etwas darüber aussagt, ob Männer bei vergleichbaren Positionen besser verdienen als Frauen, sondern vor allem darüber Auskunft gibt, wie die Geschlechterverteilung in den einzelnen Positionen aussieht. Ein gänzlich anders zu behandelndes Problem also, das nicht durch Gehaltsanpassungen zu lösen ist.

Simpson ist in vielen Bereichen zu beobachten

Der Simpson-Effekt ist in vielen Branchen zu beobachten. Berühmte Beispiele stammen aus der Medizin, wo beispielsweise verschiedene Therapien (ein berühmtes Beispiel stammt aus der Behandlung von Nierensteinen) miteinander verglichen werden und auf aggregierten Daten zu falschen Schlussfolgerungen führen.

Auch bei der Covid-Pandemie gab es plötzlich Studien, die zeigten, dass die Todesrate bei geimpften Personen höher war als bei nicht-geimpften (was darauf zurückzuführen war, dass zu Beginn vorwiegend alte und bereits erkrankte Personen geimpft wurden, die sowieso eine sehr hohe Sterblichkeitsrate haben). Statistiken, die durchaus geeignet sind, auf Basis „harter Daten/Zahlen/Fakten“ Verwirrung zu stiften und Menschen zu manipulieren.

Statistiken hinterfragen

Immer beliebter in der öffentlichen Kommunikation werden auch sogenannte „Meta-Studien“, in denen viele ähnlich geartete Studien zusammengeführt werden, um Aussagen zu untermauern. Vorsicht in der ungeprüften Verwendung solcher Statistiken, hier könnte Simpson lauern!

Leider wird der Simpson-Effekt oft dazu verwendet, um (beabsichtigt oder unbeabsichtigt) Politik zu machen. Was wir daraus lernen können, ist, uns nicht auf Gesamtstatistiken zu verlassen, sondern uns Details anzusehen, zu hinterfragen, worauf diese Statistiken beruhen, und zu hinterfragen, ob es sogenannte „kofundierende“ Variablen im Hintergrund gibt, also Treiber, die gleichzeitig Einfluss auf die Verteilung der Gewichtungen und auf die untersuchte Größe selbst haben.

Traue keiner Statistik, die nicht beschreibt, wie sie zustande gekommen ist.

Christoph Krischanitz

Der Autor ist Versicherungsmathematiker (profi-aktuar.at) und verfügt über langjährige Erfahrung in der aktuariellen Beratung. Krischanitz war von 2004 bis 2019 Vorsitzender des Mathematisch-Statistischen Komitees im Versicherungsverband (VVO), von 2008 bis 2014 Präsident der Aktuarvereinigung Österreichs (AVÖ). Derzeit ist er unter anderem Chairman der Arbeitsgruppe Non-Life Insurance in der Actuarial Association of Europe (AAE).

Der nächste Teil der Serie erscheint in zwei Wochen.

Serie „Statistik verstehen“ – bisher erschienen

Teil 1 (3.10.2024): „Zahlen, Daten, Fakten? Statistische Konzepte und ihre Fallstricke

Teil 2 (17.10.2024): „Mittendrin oder dazwischen durch? Was Werte ‚wert‘ sind

Schlagwörter zu diesem Artikel
Aktuar
 
WERBUNG
Ihr Wissen und Ihre Meinung sind gefragt

Ihre Leserbriefe können für andere Leser eine wesentliche Ergänzung zu unserer Berichterstattung sein. Bitte schreiben Sie Ihre Kommentare unter den Artikel in das dafür vorgesehene Eingabefeld.

Die Redaktion freut sich auch über Hintergrund- und Insiderinformationen, wenn sie nicht zur Veröffentlichung unter dem Namen des Informanten bestimmt ist. Wir sichern unseren Lesern absolute Vertraulichkeit zu! Schreiben Sie bitte an redaktion@versicherungsjournal.at.

Allgemeine Pressemitteilungen erbitten wir an meldungen@versicherungsjournal.at.

Täglich bestens informiert!

Der VersicherungsJournal Newsletter informiert Sie von montags - freitags über alle wichtigen Themen der Branche.

Ihre Vorteile

  • Alle Artikel stammen aus unserer unabhängigen Redaktion
  • Die neuesten Stellenangebote
  • Interessante Leserbriefe

Jetzt kostenlos anmelden!

VersicherungsJournal in Social Media

Besuchen Sie das VersicherungsJournal auch in den sozialen Medien:

  • Facebook – Ausgewähltes für den Vertrieb
  • Twitter – alle Nachrichten von VersicherungsJournal.at
  • Xing News – Ausgewähltes zu Karriere und Unternehmen
Diese Artikel könnten Sie noch interessieren
24.10.2024 – Die Allianz Österreich steht vor einem Wechsel an der Spitze: Rémi Vrignaud legt sein Mandat zurück, der designierte Nachfolger wurde am Mittwoch bekanntgegeben. Damit wechselt die Allianz innerhalb kurzer Zeit drei Vorstandsmitglieder. (Bild: Allianz/Harson) mehr ...
 
17.10.2024 – Durchschnitts-, Erwartungs- und andere Werte: Über die Aussagekraft bestimmter Kennzahlen für Pricing, Underwriting, Veranlagung & Co. – Teil 2 der Serie „Statistik-Wissen“ von Versicherungsmathematiker Christoph Krischanitz. (Bild: Krischanitz) mehr ...
 
3.10.2024 – Zahlen und Daten sind allgegenwärtig, gerade auch in der Versicherungstechnik. Sie zu lesen, ist eine Sache, sie zu interpretieren, eine andere. Versicherungsmathematiker Christoph Krischanitz nimmt sich in dieser neuen Serie genau dieses Themas an. (Bild: Krischanitz) mehr ...