Wie bezeichnet man den Effekt, dass ein Durchschnitt mit wachsender Anzahl sinkt?

dominik · 06.08.2021

Hi,

vielleicht weiß das jemand (vielleicht @Lowl3v3l, @rustyoldguy, @lord_haffi und Co.?): Produkte mit 5-Sterne-Bewertungen sind immer die mit den wenigsten Bewertungen. Mit einer wachsenden Anzahl an Bewertungen sinkt auch der Schnitt. Ein Produkt mit 3.8 Sternen bei 1000 Bewertungen ist besser bewertet als ein Produkt mit 4.5 Sternen bei 200 Bewertungen.

Hat dieser Effekt einen Namen?

Soweit ich das verstanden habe, kann man diesen Faktor bei der Berechnung des Mittelwerts mit dem Bayesschen Durchschnitt berücksichtigen.

Viele Grüße
Dominik

Lowl3v3l · 06.08.2021

Es gibt da nicht EINEN Effekt, im Regelfall gibts da eine ganze Palette psychologischer(sind dafür ziemlich sicher relevanter) und statistischer Effekte. Interessant sind vielleicht der "Extremscheueffekt"(Menschen scheuen bei solchen Bewertungen i.A. eher die Extreme, und je mehr abstimmen, desto mehr fällt das ins Gewicht) und das "Gesetz der großen Zahlen"(das ist vermutlich was dich zu der Beobachtung verleitet). Da spielt aber noch viel mehr eine Rolle, Fragebögen designen ist nicht umsonst eine echt komplizierte Wissenschaft^^

Mfg

P.S. natürlich beeinflusst auch dass man existierendes Feedback sehen kann das eigene sehr stark, das wird garantiert eine Rolle spielen.

BAGZZlash · 06.08.2021

Vielleicht "Regression to the mean"?

dominik · 06.08.2021

Lowl3v3l schrieb:
Interessant sind vielleicht der "Extremscheueffekt"(Menschen scheuen bei solchen Bewertungen i.A. eher die Extreme, und je mehr abstimmen, desto mehr fällt das ins Gewicht) und das "Gesetz der großen Zahlen"(das ist vermutlich was dich zu der Beobachtung verleitet).

Das Gesetz der großen Zahlen ist ein guter Anhaltspunkt. An anderer Stelle wurde ich auf den Zentralen Grenzwertsatz hingewiesen - das scheint in die gleiche Richtung zu gehen.

BAGZZlash schrieb:
Vielleicht "Regression to the mean"?

Im Artikel steht:

In der Sportwelt der USA kennt man den „Fluch der Sports Illustrated“ und den „Madden-Fluch“: Ein Sportler zeigt verschlechterte Leistungen, nachdem er auf dem Titel dieses Magazins/des Spiels abgebildet wurde. Der Grund, warum sie das Titelblatt zieren, sind oft herausragende Leistungen, denen natürlicherweise eher mittelmäßige Leistungen folgen.

Auch das ist sehr interessant für mich, da meine Frage eigentlich einen sportlichen Hintergrund hat. Danke für den Tipp!

dominik · 06.08.2021

Über das Gesetz der großen Zahlen bin ich nun auf das nicht vorhandene Gesetz des Ausgleichs (Die Gesetze des Ausgleichs (Equilibre) und der Abweichungen (Ecarts) gestoßen:

Nach dem Gesetz der großen Zahlen treten im langfristigen Mittel alle 37 Nummern mit der gleichen relativen Häufigkeit von 1/37 = 2,7 % auf (sog. relativer Ausgleich); diese Tatsache verleitet viele Spieler zum Fehlschluss, dass in einer hinreichend großen Serie von Spielen jede Nummer genau gleich oft auftritt (absoluter Ausgleich, Equilibre).

Betrachtet man eine Zufallsfolge, die sich durch das Auftreten eines Paares einfacher Chancen wie Rouge – Noir (oder auch Pair – Impair und Manque – Passe) ergibt, wobei Coups, in denen die Kugel auf Zéro fällt, nicht gezählt werden, so entsteht eine Zufallsfolge, wie man sie auch durch das Werfen einer fairen Münze erhalten kann. Um den Zusatz „ohne Berücksichtigung des Zéro“ nicht immer verwenden zu müssen, seien im Folgenden stets Serien von Münzwürfen betrachtet.

Für eine unendliche Folge von Münzwürfen gilt wieder nach dem Gesetz der großen Zahlen, dass im langfristigen Mittel Kopf und Zahl jeweils mit der gleichen relativen Häufigkeit von 50 % auftreten.

Mit wachsender Anzahl der Würfe nähert sich die empirische Häufigkeit (d. h. der Quotient aus der Anzahl der Würfe mit Resultat Kopf durch die Anzahl der Würfe gesamt) zwar immer mehr dem durch die Wahrscheinlichkeit vorgegebenen Wert von 1/2, doch bedeutet dies nicht, dass der relative Ausgleich auch einen absoluten Ausgleich zu einem bestimmten vorgegebenen Zeitpunkt nach sich zieht – vielmehr gilt das Gegenteil: der Erwartungswert der absoluten Abweichung (Écart) zu einem bestimmten vorgegebenen Zeitpunkt wächst mit der Anzahl der Coups und strebt gegen unendlich.

Obwohl die Wahrscheinlichkeit für einen absoluten Ausgleich nach einer im Vorhinein bestimmten festen Anzahl von Spielen immer kleiner wird, je größer die betreffende Anzahl gewählt wird (und gegen Null strebt), so tritt dennoch mit Wahrscheinlichkeit eins irgendwann einmal ein absoluter Ausgleich ein (sog. Null-Rekurrenz der symmetrischen Irrfahrt) – es ist allerdings mathematisch sinnlos, auf den absoluten Ausgleich zu warten, da der Erwartungswert der Wartezeit auf die Rückkehr zur sogenannten Null-Linie unendlich groß ist. Dieses Resultat scheint geradezu paradox, wenn man bedenkt, dass ein absoluter Ausgleich mit Wahrscheinlichkeit 1/2 ja bereits nach zwei Spielen eintritt.

Im Verlauf einer unendlichen Folge von Münzwürfen treten mit Wahrscheinlichkeit eins unendlich viele Zeitpunkte des absoluten Ausgleichs (Null Rekurrenzen) auf, die Zwischenzeiten (Ecart-Längen) sind nicht beschränkt, ihr Erwartungswert ist unendlich groß; gleiches gilt für die Ecart-Gipfel, d. h. die Beträge der größten Abweichungen von der Null-Linie.

WTF? Kann das jemand etwas anschaulicher erklären? 😅

lord_haffi · 06.08.2021

dominik schrieb:
WTF? Kann das jemand etwas anschaulicher erklären? 😅

Im Prinzip guckt man sich bei dem beschriebenen Zufallsexperiment von \( x \rightarrow \infty \) Münzwürfen zünächst zwei Dinge an:

Die relative Abweichung vom Mittelwert bzw. Erwartungswert bei steigenden Münzwürfen
Die absolute Abweichung vom Mittelwert bzw. Erwartungswert bei steigenden Münzwürfen

Hierbei stellt man fest, dass die relative Abweichung für \( x \rightarrow \infty \) gegen 0 geht. Das entspricht dem Gesetz der großen Zahlen. Jedoch stellt man auch fest, dass die absolute Abweichung gegen \( \infty \) geht. Dies scheint auf den ersten Blick etwas merkwürdig, da die Abweichung gegen 0 und gegen \( \infty \) zu streben scheint. Doch wie das mit Unendlichkeiten in der Mathematik so ist, muss man hier ein wenig aufpassen, auch weil es sich hier um zwei unterschiedliche Abweichungen handelt.

Daher schauen sie sich im folgenden an, wie hoch denn die Wahrscheinlichkeit ist, dass bei steigenden \( x \) Irgendwann mal ein absoluter Ausgleich stattfindet, d.h. dass die Anzahl von Kopf und Zahl gleich groß ist. Man stellt fest, dass diese Wahrscheknlichkeit 1 beträgt. Allerdings muss man im Mittel unendlich lange darauf warten, bis das passiert.

Eigentlich ist das ganze nur ein "Rumspielen" mit Unendlichkeiten, wobei ich jetzt nicht gerade den Sinn dahinter erkennen kann. Vermutlich geht es darum, scheinbare Paradoxen vorzustellen, um deutlich zu machen, dass man bei Wahrscheinlichkeiten und Unendlichkeiten aufpassen muss, was man tut. Auf jeden Fall ist das reine Zahlentheorie und hat nichts mit Psychologie oder ähnlichem zu tun und ist somit für deine Frage zumindest nicht so relevant, würde ich vermuten.

dominik · 06.08.2021

lord_haffi schrieb:
Im Prinzip guckt man sich bei dem beschriebenen Zufallsexperiment von \( x \rightarrow \infty \) Münzwürfen zünächst zwei Dinge an:

Die relative Abweichung vom Mittelwert bzw. Erwartungswert bei steigenden Münzwürfen

Die absolute Abweichung vom Mittelwert bzw. Erwartungswert bei steigenden Münzwürfen

Hierbei stellt man fest, dass die relative Abweichung für \( x \rightarrow \infty \) gegen 0 geht. Das entspricht dem Gesetz der großen Zahlen. Jedoch stellt man auch fest, dass die absolute Abweichung gegen \( \infty \) geht. Dies scheint auf den ersten Blick etwas merkwürdig, da die Abweichung gegen 0 und gegen \( \infty \) zu streben scheint. Doch wie das mit Unendlichkeiten in der Mathematik so ist, muss man hier ein wenig aufpassen, auch weil es sich hier um zwei unterschiedliche Abweichungen handelt.

Daher schauen sie sich im folgenden an, wie hoch denn die Wahrscheinlichkeit ist, dass bei steigenden \( x \) Irgendwann mal ein absoluter Ausgleich stattfindet, d.h. dass die Anzahl von Kopf und Zahl gleich groß ist. Man stellt fest, dass diese Wahrscheknlichkeit 1 beträgt. Allerdings muss man im Mittel unendlich lange darauf warten, bis das passiert.

Eigentlich ist das ganze nur ein "Rumspielen" mit Unendlichkeiten, wobei ich jetzt nicht gerade den Sinn dahinter erkennen kann. Vermutlich geht es darum, scheinbare Paradoxen vorzustellen, um deutlich zu machen, dass man bei Wahrscheinlichkeiten und Unendlichkeiten aufpassen muss, was man tut. Auf jeden Fall ist das reine Zahlentheorie und hat nichts mit Psychologie oder ähnlichem zu tun und ist somit für deine Frage zumindest nicht so relevant, würde ich vermuten.

Danke, jetzt verstehe ich, was damit gemeint ist. Ich war mir anfangs auch nicht sicher, was genau mit der absoluten Abweichung beschrieben wird - das ist aber recht simpel und wird im Wikipedia-Artikel beschrieben:

Angenommen, eine Serie von Münzwürfen beginne mit „Kopf“, „Zahl“, „Kopf“, „Kopf“. Dann wurde „Kopf“ bis dahin dreimal geworfen, „Zahl“ einmal. „Kopf“ hat gewissermaßen einen Vorsprung von zwei Würfen. Nach diesen vier Würfen ist die relative Häufigkeit von „Kopf“ ¾, die von „Zahl“ ¼. Nach 96 weiteren Würfen stelle sich ein Verhältnis von 47 Mal „Zahl“ zu 53 Mal „Kopf“ ein. Der Vorsprung von „Kopf“ ist also nach 100 Würfen sogar noch größer als nach vier Würfen, jedoch hat sich der relative Abstand von „Kopf“ und „Zahl“ stark verringert, beziehungsweise – und das ist die Aussage des Gesetzes der großen Zahlen – der Unterschied der relativen Häufigkeit von „Kopf“ zum Erwartungswert von „Kopf“. Der Wert 53/100 = 0,53 liegt sehr viel näher beim Erwartungswert 0,5 als ¾ = 0,75.

rustyoldguy · 06.08.2021

Hallo Dominik!

Ich denke, das hängt von der Verteilungsform ab. Ob jetzt Gaußsche Glocke, Binomialverteilung oder Poisson.
Erst kürzlich habe ich ein altes Programm von mir, das bei Compilern, welche mit srand() nur Zufallszahlen bis
32767 arbeitet experimentiert. Dabei modifzierte ich es so, das Zahlen mit unsigned int(4Byte) erzeugt werden
können, erweiterbar auf unsigned long. Auch mit Beschränkung.

Dabei ergab sich der Effekt, das je mehr Zahlen ich erzeugte, desto weiter wanderten der Maximalwert und der
Minimalwert der erzeugten Zahlen weiter vom Mittelwert weg. Das war aber zu erwarten. Bei
Produktbewertungen sollte man vorsichtig sein. Je größer die Zahl der Bewertungen ist, desto geringer wird
die Möglichkeit der Manipulation. Bei einer beschreibenden Statistik werden 100 Prozent herangezogen, bei einer
schließenden, etwa bei Hochrechnung in Wahlen werden "Typische Wahlkreise" heran gezogen, die so gewählt
haben wie der Rest gesamt. So wurde mein Heimatdorf(etwa 3kmnördlich von Amberg(Opf.), hat einen ellenlangen Namen nach einer Heiligen) ein Kanidat dafür. Die ARD war damals im Wahllokal und hatte auch mich zu meinem Wahlverhalten befragt.

Das ist übrigens auch bei anderen Bewertungen so, etwa bei der Bewertung
von Arbeitgebern auf www.kununu.com.

Dort fällt auf, das positive Bewertungen überwiegend von Angestellten kommen. Also aus dem leitenden Bereich.
Eigentlich klar, wenn 15 Leiharbeiter ihre Meinung dort posten, ist das was anderes als bei dem Projektleiter(der
mit positiven Bewertungen auf Opferjagd gehen will?). Erst recht wenn man eine Statistik über Leiharbeiter ansieht:

Wenn nur ein Mitarbeiter etwas negatives schreibt ist das eine Sache, wenn gleich mehrere negatives berichten etwas anderes.

Meine eigene persönliche Erfahrung ist:
"No smoke without Fire"

Übrigens hat einer meiner Nachbarn, der in einem größeren Betrieb als Angestellter arbeitet mir berichtet, das diese letztes
Jahr nicht einen Leiharbeiter bekommen hätten, weil alle wissen, das die Beschäftigungsdauer sehr begrenzt ist(!!!).

Wenn zum Beispiel eine LKW-Ladung mit Produkten geliefert wird, so wird im Allgemeinen eine AQL, ein Acceptable Quality Level
vereinbart. Das heißt, das Prozesskontrolle bei Produktionsprozessen nicht nur am Anfang vorgenommen werden, sondern ständig in die
Bewertung einfließen. Das nennt sich dann Kaizen, oder PDCA(Plan Do Check Act), was eine Art Regelkreis
darstellt bei der Produktkontrolle:
Planen->Ausführen->Überprüfen->Agieren(besser Reagieren).
Zudem sollte man bei Bewertungen nachsehen wie diese zu Stande gekommen sind. Wenn einer zum Beispiel beim
Kirchweihfest irgendwo zum Beispiel in Bayern eine Alkoholkontrolle durchführt, so stellt das garantiert nicht den
durchschnittlichen Alkoholkonsum aller Deutschen dar.

Wenn man zum Beispiel eine Gruppe von Millionären fragen würde über die Fleischqualität bei einem Discounter, so
kommen da andere Bewertungen raus als wie wenn ich Harz IV Empfänger oder Leiharbeiter befrage.

In der Industrie versucht man zum Beispiel beim Maschinenbau durch sogenannte Shewart-Karten und Stichproben
verschiedene Maschinen und Messmittel separat zu halten. Da kommt es darauf auch an, das nicht mit verschiedenen
Bügelmessschrauben gemessen wird. Bei Messschieber kommt es auch auf das Gefühl der Leute an. Nicht jeder drückt
die Messschnäbel wie ein Elefant zusammen. Das ist von Person zu Person unterschiedlich.

Hierzu verweise ich auf meine Arbeiten mit LibreOffice bei

www.libreoffice-forum.de->LIBREOFFICE COMMUNITY ->INFOS-> Verfahren 1,2,3(Prüfmittelmanagement)

Auf diesem Forum habe ich auch da was über Prüfniveaus veröffentlicht.
Wenn ich nun einen Kontrolleur stetig eine volle LKW-Ladung mit 10000 Teilen komplett kontrollieren würde, hättest
du möglicherweise garantiert irgendwo ein Ausschuß drinnen. Da kommen die berühmten six-sigma (Gaußsche Glocke)
ins Spiel.
Übrigens:
Im deutschsprachigen Raum werden 95/99 Prozent, im englischsprachigen Raum 95,44/ 99,97 für Eingriffsgrenze und Warngrenze (Rinne Seite 337) verwendet.

Bei Qualitätsmerkmalen unterscheidet man zwischen
Quantitative Merkmale:
-Diskrete Merkmale(Zählwerte, etwa Stückzahl, Bohrungsanzahl)
-kontinuierliche Merkmale(Messwerte wie Bohrungsdurchmesser oder Länge)

und

Qualitative Merkmale
-Ordinalmerkmale(etwa Hellgrau, Mittelgrau, Dunkelgrau)
-Nominalmerkmale(keine Ordnungsbeziehung, wie herber Geschmack, milder Geschmack, süß, sauer)

Salopp kann man Qualität mit Erfüllung von Anforderungen bezeichnen.

Beispiel:
Für jemand ist ein Handy oder Taschenrechner mit möglichst vielen Funktionen gut.
Ein anderer, zum Beispiel Schüler sagt:
"Wenn mein Handy oder Taschenrechner nicht gleich kaputt geht, wenn er mir mal aus der Tasche fällt, ist er gut."
Das soll aber nicht heißen das man zur Prüfung auf eine 4 Meter lange Leiter steigt, um das Gerät fallen zu
lassen, sondern etwa wie wenn der Taschenrechner mal versehentlich vom Tisch fällt.

rustyoldguy · 22.08.2021

rustyoldguy schrieb:
Hallo Dominik!

Ich denke, das hängt von der Verteilungsform ab. Ob jetzt Gaußsche Glocke, Binomialverteilung oder Poisson.
Erst kürzlich habe ich ein altes Programm von mir, das bei Compilern, welche mit srand() nur Zufallszahlen bis
32767 arbeitet experimentiert. Dabei modifzierte ich es so, das Zahlen mit unsigned int(4Byte) erzeugt werden
können, erweiterbar auf unsigned long. Auch mit Beschränkung.

Dabei ergab sich der Effekt, das je mehr Zahlen ich erzeugte, desto weiter wanderten der Maximalwert und der
Minimalwert der erzeugten Zahlen weiter vom Mittelwert weg. Das war aber zu erwarten. Bei
Produktbewertungen sollte man vorsichtig sein. Je größer die Zahl der Bewertungen ist, desto geringer wird
die Möglichkeit der Manipulation. Bei einer beschreibenden Statistik werden 100 Prozent herangezogen, bei einer
schließenden, etwa bei Hochrechnung in Wahlen werden "Typische Wahlkreise" heran gezogen, die so gewählt
haben wie der Rest gesamt. So wurde mein Heimatdorf(etwa 3kmnördlich von Amberg(Opf.), hat einen ellenlangen Namen nach einer Heiligen) ein Kanidat dafür. Die ARD war damals im Wahllokal und hatte auch mich zu meinem Wahlverhalten befragt.

Das ist übrigens auch bei anderen Bewertungen so, etwa bei der Bewertung
von Arbeitgebern auf www.kununu.com.

Dort fällt auf, das positive Bewertungen überwiegend von Angestellten kommen. Also aus dem leitenden Bereich.
Eigentlich klar, wenn 15 Leiharbeiter ihre Meinung dort posten, ist das was anderes als bei dem Projektleiter(der
mit positiven Bewertungen auf Opferjagd gehen will?). Erst recht wenn man eine Statistik über Leiharbeiter ansieht:
Anhang anzeigen 227 Anhang anzeigen 228

Wenn nur ein Mitarbeiter etwas negatives schreibt ist das eine Sache, wenn gleich mehrere negatives berichten etwas anderes.

Meine eigene persönliche Erfahrung ist:
"No smoke without Fire"

Übrigens hat einer meiner Nachbarn, der in einem größeren Betrieb als Angestellter arbeitet mir berichtet, das diese letztes
Jahr nicht einen Leiharbeiter bekommen hätten, weil alle wissen, das die Beschäftigungsdauer sehr begrenzt ist(!!!).

Wenn zum Beispiel eine LKW-Ladung mit Produkten geliefert wird, so wird im Allgemeinen eine AQL, ein Acceptable Quality Level
vereinbart. Das heißt, das Prozesskontrolle bei Produktionsprozessen nicht nur am Anfang vorgenommen werden, sondern ständig in die
Bewertung einfließen. Das nennt sich dann Kaizen, oder PDCA(Plan Do Check Act), was eine Art Regelkreis
darstellt bei der Produktkontrolle:
Planen->Ausführen->Überprüfen->Agieren(besser Reagieren).
Zudem sollte man bei Bewertungen nachsehen wie diese zu Stande gekommen sind. Wenn einer zum Beispiel beim
Kirchweihfest irgendwo zum Beispiel in Bayern eine Alkoholkontrolle durchführt, so stellt das garantiert nicht den
durchschnittlichen Alkoholkonsum aller Deutschen dar.

Wenn man zum Beispiel eine Gruppe von Millionären fragen würde über die Fleischqualität bei einem Discounter, so
kommen da andere Bewertungen raus als wie wenn ich Harz IV Empfänger oder Leiharbeiter befrage.

In der Industrie versucht man zum Beispiel beim Maschinenbau durch sogenannte Shewart-Karten und Stichproben
verschiedene Maschinen und Messmittel separat zu halten. Da kommt es darauf auch an, das nicht mit verschiedenen
Bügelmessschrauben gemessen wird. Bei Messschieber kommt es auch auf das Gefühl der Leute an. Nicht jeder drückt
die Messschnäbel wie ein Elefant zusammen. Das ist von Person zu Person unterschiedlich.

Hierzu verweise ich auf meine Arbeiten mit LibreOffice bei

www.libreoffice-forum.de->LIBREOFFICE COMMUNITY ->INFOS-> Verfahren 1,2,3(Prüfmittelmanagement)

Auf diesem Forum habe ich auch da was über Prüfniveaus veröffentlicht.
Wenn ich nun einen Kontrolleur stetig eine volle LKW-Ladung mit 10000 Teilen komplett kontrollieren würde, hättest
du möglicherweise garantiert irgendwo ein Ausschuß drinnen. Da kommen die berühmten six-sigma (Gaußsche Glocke)
ins Spiel.
Übrigens:
Im deutschsprachigen Raum werden 95/99 Prozent, im englischsprachigen Raum 95,44/ 99,97 für Eingriffsgrenze und Warngrenze (Rinne Seite 337) verwendet.

Bei Qualitätsmerkmalen unterscheidet man zwischen
Quantitative Merkmale:
-Diskrete Merkmale(Zählwerte, etwa Stückzahl, Bohrungsanzahl)
-kontinuierliche Merkmale(Messwerte wie Bohrungsdurchmesser oder Länge)

und

Qualitative Merkmale
-Ordinalmerkmale(etwa Hellgrau, Mittelgrau, Dunkelgrau)
-Nominalmerkmale(keine Ordnungsbeziehung, wie herber Geschmack, milder Geschmack, süß, sauer)

Salopp kann man Qualität mit Erfüllung von Anforderungen bezeichnen.

Beispiel:
Für jemand ist ein Handy oder Taschenrechner mit möglichst vielen Funktionen gut.
Ein anderer, zum Beispiel Schüler sagt:
"Wenn mein Handy oder Taschenrechner nicht gleich kaputt geht, wenn er mir mal aus der Tasche fällt, ist er gut."
Das soll aber nicht heißen das man zur Prüfung auf eine 4 Meter lange Leiter steigt, um das Gerät fallen zu
lassen, sondern etwa wie wenn der Taschenrechner mal versehentlich vom Tisch fällt.

Das hat übrigens mit dem Gesetz der großen Zahlen zu tun:

Gesetz der großen Zahlen – Wikipedia

de.wikipedia.org

Wie bezeichnet man den Effekt, dass ein Durchschnitt mit wachsender Anzahl sinkt?

dominik

Aktives Mitglied

Lowl3v3l

Aktives Mitglied

BAGZZlash

Moderator

dominik

Aktives Mitglied

dominik

Aktives Mitglied

lord_haffi

Moderator

dominik

Aktives Mitglied

rustyoldguy

Mitglied

rustyoldguy

Mitglied

Gesetz der großen Zahlen – Wikipedia