Auch wenn es kein (elektro)technisches Thema ist, scheint mir der Ort aufgrund der letzten Diskussionen passend und
auf diese Weise bleibt Reno_Barths Thread von diesem OT-Inhalt verschont.
Die Diskussion dreht sich immer wieder um die Ergebnisse von Tests und ihre Bewertung; eine salopp (nur sinngemäß zitierte) Anmerkung lautet "fünf Versuche sind nicht genug, wir brauchen mindestens 20 und im Casion sind fünfmal rot (oder schwarz) auch häufiger vorgekommen" .
Kurz zu den Grundlagen der Testerei; man formuliert die sog. Nullhypothese, mit der man behauptet, Testergebnisse seien durch Raten zustande gekommen, sowie die Alternativhypothese, mit der man behauptet, es gäbe einen wahrnehmbaren Unterschied zwischen den Testgegenständen.
Man berechnet nach einem Test die Wahrscheinlichkeit dafür, daß ein bestimmtes Ergebnis nur durch Raten zustande kam und entscheidet anhand dieser Wahrscheinlichkeit (mit Hilfe einer vorher festgelegten Schwelle), ob man die Nullhypothese oder die Alternativhypothese bestätigt sieht.
Diese vorher festgelegte Schwelle ist das sog. Signifikanzniveau und wird auch als Irrtumswahrscheinlichkeit bezeichnet.
Überlicherweise wird eine Irrtumswahrscheinlichkeit von 5% bei Experimenten mit menschlicher Wahrnehmungsfähigkeit als akzeptabel angenommen, d.h. wenn die Wahrscheinlichkeit, durch reines Raten ein bestimmtes Testergebnis zu erzielen, geringer ist als 5%, dann weist man die Nullhypothese zurück.
Nimmt man einen Test mit 5 Durchgängen (z.B. perfekte Münze mit Kopf und Zahl), dann ist die Wahrscheinlichkeit für Kopf und Zahl bei jedem Durchgang gleich und liegt bei 1/2 . Die Wahrscheinlichkeit bei 5 Durchgängen fünfmal Kopf zu erhalten liegt bei 0.5 hoch 5, d.h. die Wahrscheinlichkeit für dieses Ergebnis beträgt ~3,1% .
Als Vergleich ein Test mit 20 Durchgängen; die Wahrscheinlichkeit 15mal (oder öfter) Kopf zu erhalten liegt bei (Berechnung über Binomialverteilung) ~2,1% .
In beiden Fällen liegt die Wahrscheinlichkeit, per Zufall das Ergebnis zu erzielen, unterhalb von 5% und beide Irrtumswahrscheinlichkeiten liegen trotz der deutlich unterschiedlichen Durchgangszahlen relativ eng beieinander. Man würde in beiden Fällen die Nullhypothese zurückweisen.
Der Vergleich mit dem Kasino führt in die Irre, denn im Kasino wird eine ununterbrochene Reihe von Zufallsexperimenten durchgeführt und innerhalb dieser sehr langen Reihe kann man wahrscheinlich auch "fünfmal Kopf" hintereinander finden.
Ein Beispiel mit dem Münzwurf (K für Kopf, Z für Zahl) bei zwei aufeinanderfolgenden 5er Tests:
ZKZKKKKKZZ
finden wir eine Reihe von 5 Kopftreffern, aber die wahren Testresultate wären zwei 5er Tests mit jeweils nur 3 Treffern. Die Wahrscheinlichkeit für 3 (und mehr) Treffer von 5 liegt bei 50% und auch zusammengenommen hätte man nur 6 (und mehr) Treffer von 10 mit der Ratewahrscheinlichkeit von ~37,7% .
Aus diesem Grund ist es eine "Todsünde" der Testung ohne vorherige Festlegung solange zu testen, bis eine "passende" Trefferzahl hintereinander auftaucht.
Gruß
auf diese Weise bleibt Reno_Barths Thread von diesem OT-Inhalt verschont.
Die Diskussion dreht sich immer wieder um die Ergebnisse von Tests und ihre Bewertung; eine salopp (nur sinngemäß zitierte) Anmerkung lautet "fünf Versuche sind nicht genug, wir brauchen mindestens 20 und im Casion sind fünfmal rot (oder schwarz) auch häufiger vorgekommen" .
Kurz zu den Grundlagen der Testerei; man formuliert die sog. Nullhypothese, mit der man behauptet, Testergebnisse seien durch Raten zustande gekommen, sowie die Alternativhypothese, mit der man behauptet, es gäbe einen wahrnehmbaren Unterschied zwischen den Testgegenständen.
Man berechnet nach einem Test die Wahrscheinlichkeit dafür, daß ein bestimmtes Ergebnis nur durch Raten zustande kam und entscheidet anhand dieser Wahrscheinlichkeit (mit Hilfe einer vorher festgelegten Schwelle), ob man die Nullhypothese oder die Alternativhypothese bestätigt sieht.
Diese vorher festgelegte Schwelle ist das sog. Signifikanzniveau und wird auch als Irrtumswahrscheinlichkeit bezeichnet.
Überlicherweise wird eine Irrtumswahrscheinlichkeit von 5% bei Experimenten mit menschlicher Wahrnehmungsfähigkeit als akzeptabel angenommen, d.h. wenn die Wahrscheinlichkeit, durch reines Raten ein bestimmtes Testergebnis zu erzielen, geringer ist als 5%, dann weist man die Nullhypothese zurück.
Nimmt man einen Test mit 5 Durchgängen (z.B. perfekte Münze mit Kopf und Zahl), dann ist die Wahrscheinlichkeit für Kopf und Zahl bei jedem Durchgang gleich und liegt bei 1/2 . Die Wahrscheinlichkeit bei 5 Durchgängen fünfmal Kopf zu erhalten liegt bei 0.5 hoch 5, d.h. die Wahrscheinlichkeit für dieses Ergebnis beträgt ~3,1% .
Als Vergleich ein Test mit 20 Durchgängen; die Wahrscheinlichkeit 15mal (oder öfter) Kopf zu erhalten liegt bei (Berechnung über Binomialverteilung) ~2,1% .
In beiden Fällen liegt die Wahrscheinlichkeit, per Zufall das Ergebnis zu erzielen, unterhalb von 5% und beide Irrtumswahrscheinlichkeiten liegen trotz der deutlich unterschiedlichen Durchgangszahlen relativ eng beieinander. Man würde in beiden Fällen die Nullhypothese zurückweisen.
Der Vergleich mit dem Kasino führt in die Irre, denn im Kasino wird eine ununterbrochene Reihe von Zufallsexperimenten durchgeführt und innerhalb dieser sehr langen Reihe kann man wahrscheinlich auch "fünfmal Kopf" hintereinander finden.
Ein Beispiel mit dem Münzwurf (K für Kopf, Z für Zahl) bei zwei aufeinanderfolgenden 5er Tests:
ZKZKKKKKZZ
finden wir eine Reihe von 5 Kopftreffern, aber die wahren Testresultate wären zwei 5er Tests mit jeweils nur 3 Treffern. Die Wahrscheinlichkeit für 3 (und mehr) Treffer von 5 liegt bei 50% und auch zusammengenommen hätte man nur 6 (und mehr) Treffer von 10 mit der Ratewahrscheinlichkeit von ~37,7% .
Aus diesem Grund ist es eine "Todsünde" der Testung ohne vorherige Festlegung solange zu testen, bis eine "passende" Trefferzahl hintereinander auftaucht.
Gruß
Kommentar