Übertrag aus einem anderen Thread
Wie David schon feststellte, die Frage ist, ob ich wahrgenommene Unterschiede objektivieren möchte, oder ob mir meine Empfindungen genügen und ich mich nur darüber mit anderen austauschen will.
Blindtests sind ein probates Mittel gehörte Unterschiede zu objektivieren. Allerdings ist ihre Aussagekraft stark von der Art der Durchführung abhängig. Wenn die Unterschiede, die man detektieren möchte, leicht wahrnehmbar sind, sind sie ein Kinderspiel und damit im Grunde überflüssig. Solange Unterschiede in der Entwicklung der Audiotechnik in einer für jeden noch hörbaren Größenordnung lagen, war ein unmittelbarer Anreiz gegeben, die Technik immer weiter zu verbessern. Heutzutage ist die Entwicklung folgerichtig so weit gelangt, das Unterschiede auf der elektronischen Seite bestenfalls marginal ausfallen können und ihre Bedeutung Anlass zum Streit gibt. Egal wie unvollkommen die vielen negativen privaten Tests alle ausgeführt worden sein mögen, so berechtigt die Kritik daran im Einzelnen sein mag: ihre Aussagekraft wird dadurch nicht völlig entwertet, sondern läßt immer noch den sicheren Schluß zu, dass es bei Kabeln Verstärkern und Digitalquellen allenfalls um sehr kleine Unterschiede nahe den Hörgrenzen gehen kann. Unterschiede, die sich mit simplen kurzen Blindtests nicht unmittelbar zu erkennen geben, denn deutlichere Unterschiede würden sich auch in einem simplen Testdesign offenbaren.
Wenn man zur allgemeinen Klärung dieser Frage bis an die Hörgrenzen detektieren will, also die Testempfindlichkeit steigern will, dann steigen Aufwand und Anforderungen an einen durchdachten Testaufbau dummerweise sozusagen exponentiell an, aus verschiedenen Gründen. Zum einen, weil das Ohr unter guten Bedingungen fabelhaft empfindlich ist. (Im Bereich der für die Klangfarben eines Instruments oder der menschlichen Stimme besonders charakteristischen Obertöne, zwischen 2 und 5 kHz ist es tatsächlich sogar empfindlicher als jedes gegenwärtig verfügbare Hifi-Mikrofon, ungefähr um den Faktor zwei.) Zum anderen, weil gute Ohren heutzutage selten sind, viele Leute haben unbemerkte Hörschäden, man muß also viele Leute testen, um echte Goldohren zu finden - es geht ja nicht darum Leute zu überführen die sich überschätzen, von denen es allerdings viele gibt....
Für verallgemeinerbare Tests an den Wahrnehmungsgrenzen werden üblicherweise hunderte von Leuten einzeln getestet, so ein Procedere zieht sich über Monate, z.T. auch deswegen, weil die Erkennungsleistung manchmal erst über lange Zeit bis zum Anschlag trainiert werden muss, um an die echten Grenzen zu kommen. (Ich habe mal als einer von vielen an so einer Studie teilgenommen, bei der es um minimal wahrnehmbare taktile Unterschiede ging. Jeder musste über drei Wochen alle zwei oder drei Tage für 2Stunden anrücken, und pro 30 minütiger Sitzung mit entsprechenden Pausen konzentriert hunderte von Durchgänge absolvieren...)
Um den Test genügend empfindlich zu machen, muß man nicht nur viele Leute testen, sondern auch viele Durchgänge pro Person fahren, es müssen hunderte, nicht nur zehn oder zwanzig sein. Schließlich muß man beim Testdesign die Eigenheiten der menschlichen Wahrnehmung berücksichtigen: Die Wahrnehmungsschwellen liegen im unbewussten und verlaufen zudem unscharf, sie sind statitischer Natur, es gibt kein eindeutiges hör ich noch - hör ich nicht mehr, es gibt nur zunehmende Unsicherheit und stärkeres "Rauschen" der Reizantworten des Gehörs. Erst mit forced-choice-Methoden kann man diese unbewussten feinen Effekte nahe den Hörschwellen erfassen, die sonst nicht zugänglich sind, andernfalls erhält man falsch negative Ergebnisse. Der Grund liegt daran, dass die von der Wahrnehmung tatsächlich noch registrierten feinsten Reizunterschiede zwar nicht unmittelbar ins Bewusstsein gelassen werden, aber dennoch registriert und für den Sinneseindruck unbewußt ausgewertet werden. Das Gehirn konstuiert aus dem an der Warhnehmungsgrenze mit schwächerem Signal zunehmend verrauschten statistischen Verlauf der Reizantwort eine künstliche schärfere Grenze. Es macht wahrgenommene Unterschiede eindeutiger als sie sind, es schärft das Bild allerdings auf Kosten der bewusst erlebten Empfindlichkeit.
Viele Leute glauben fälschlich nach beliebig langen zermürbenden Durchgängen bessere Entscheidungen treffen zu können. Genau das ist falsch, weil dann feinste unbewusst registrierte Unterschiede vom Gehirn u.U. aktiv weggeregelt werden, wenn Mechanismen der sog. Wahrnehmungskonstanz eingreifen und uns eine stabile Umgebung ohne Unterschied simulieren, was biologisch einen anderen Sinn hat. Diese Regelung und auch die Ermüdung der Reizantwort muß man unterlaufen, wenn man an die Schwellen herankommen will, und hier liegen vielleicht auch die Ursachen für die immer wieder propagierten Lästigkeits- oder Langzeit- oder Zeitfehlereffekte, denen man mit der Methodik der forced choice Experimente bei Blindtests wahrscheinlich besser auf die Spur kommen könnte, vielleicht auch bei sich zu Hause. Mit endlos langen Durchgängen und beliebig langer Zeit zur Entscheidung hat man dagegen keine Chance sie zu erfassen, weil zu stark "rational kontrolliertes" Wahrnehmen und Dauerexposition von Reizen Feinheiten wegnivellieren kann. (Vielleicht kennen manche ähnliche Effekte vom indirekten astronomischen Sehen her, wo feinste Helligkeitsunterschiede auch nicht durch bewusstes Hingucken, sondern durch geübtes Danebenblicken erkennbar werden)
Ich würde daher auch bei privaten Tests dafür plädieren, Probanden nicht solange herumprobieren zu lassen wie sie wollen, um Unterschiede bewusst zu hören, sondern sie in A/B Vergleichen eine möglichst große Zahl (am besten mehrere hundert) von kurzen Durchgängen fester Dauer (10-20 sec) mit jeweils sofort danach abverlangter Entscheidung absolvieren lassen. Dabei ist wichtig den Probanden einzuschärfen, die Entscheidung jeweils nach ihrem besten Bauchgefühl zu treffen, und zwar immer so konzentriert wie nur möglich, auch dann, wenn sie längst keine Unterschiede mehr wahrzunehmen glauben. Also kein willkürliches unmotiviertes Herumraten erlauben, das nur in Richtung Zufallsverteilung nivelliert, sondern konzentriertes motiviertes Raten abverlangen, eine Art „emotional guess“ für den man bei jedem Durchgang unmittelbar nach Präsentation eines A/B Reizes nur kurz Zeit hat. Alle Probanden müssen mit dem Bemühen antreten, Unterschiede hören zu wollen, auch eine positive Motivation ist für maximale Erkennungsleistung sehr sehr wichtig! Was sie dabei _tatsächlich_ erkannt haben, zeigt dann erst die spätere Auswertung.
Zum guten Schluß müßte man sich bei einem umfassenden Test auch Gedanken machen, mit welchen Signalen man die Hörtests fahren will. Man sollte neben kontrolliert variierten Musikbeispielen eine ganze Reihe künstlicher Signale entwerfen, die definierte minimale Reizunterschiede (Pegel, Rhythmik, Impulse, Dauertöne, Rechtecke, Sinus, bandbegrenztes Rauschen - Zwicker-Frequenzgruppen etc.) enthalten. Die Konzeption solcher Signale wäre ein Kapitel für sich, schließlich muß man intelligent raten, was das Ohr vielleicht noch hören könnte, obwohl man das nicht so genau weiß, und dazu alle möglichen Parameter kombiniert abzuklopfen versuchen, Stichwort Mustererkennung. Dass in Mustern Unterschiede erkannt werden können, die objektiv gar nicht meßbar sind, kompliziert die Kontrolle des Ganzen zusätzlich. (Weshalb es auch falsch ist zu behaupten, alle wahrnehmbaren Unterschiede wären messbar) .
Dass eine einwandfreie Gerätetechnik und Einzeltestung - keine Gruppenveranstaltung - ebenso aufwändig sind, muß nicht besonders betont werden. Insgesamt ist so ein Procedere um den Wahrnehmungsgrenzen möglichst objektiv auf die Spur zu kommen nicht vergnüglich, sondern harte erschöpfende Arbeit - und stellt Anforderungen, an der private Tests zum Vergnügen scheitern dürften. Aber vielleicht könnte man schon allein mit der forced-choice Methodik (viele kurze Durchgänge, konzentriertes Raten mit abverlangter Antwort) auch ohne hunderte Leute zu testen und ohne Testsignale zu designen in privaten Vergnügungstests einen Schritt in Richtung höherer Empfindlichkeit weiter kommen. Und damit entweder doch kleine Unterschiede nachweisen, oder die Luft für die pauschalen Blindtestkritiker noch ein bisschen dünner werden lassen...
Wie David schon feststellte, die Frage ist, ob ich wahrgenommene Unterschiede objektivieren möchte, oder ob mir meine Empfindungen genügen und ich mich nur darüber mit anderen austauschen will.
Blindtests sind ein probates Mittel gehörte Unterschiede zu objektivieren. Allerdings ist ihre Aussagekraft stark von der Art der Durchführung abhängig. Wenn die Unterschiede, die man detektieren möchte, leicht wahrnehmbar sind, sind sie ein Kinderspiel und damit im Grunde überflüssig. Solange Unterschiede in der Entwicklung der Audiotechnik in einer für jeden noch hörbaren Größenordnung lagen, war ein unmittelbarer Anreiz gegeben, die Technik immer weiter zu verbessern. Heutzutage ist die Entwicklung folgerichtig so weit gelangt, das Unterschiede auf der elektronischen Seite bestenfalls marginal ausfallen können und ihre Bedeutung Anlass zum Streit gibt. Egal wie unvollkommen die vielen negativen privaten Tests alle ausgeführt worden sein mögen, so berechtigt die Kritik daran im Einzelnen sein mag: ihre Aussagekraft wird dadurch nicht völlig entwertet, sondern läßt immer noch den sicheren Schluß zu, dass es bei Kabeln Verstärkern und Digitalquellen allenfalls um sehr kleine Unterschiede nahe den Hörgrenzen gehen kann. Unterschiede, die sich mit simplen kurzen Blindtests nicht unmittelbar zu erkennen geben, denn deutlichere Unterschiede würden sich auch in einem simplen Testdesign offenbaren.
Wenn man zur allgemeinen Klärung dieser Frage bis an die Hörgrenzen detektieren will, also die Testempfindlichkeit steigern will, dann steigen Aufwand und Anforderungen an einen durchdachten Testaufbau dummerweise sozusagen exponentiell an, aus verschiedenen Gründen. Zum einen, weil das Ohr unter guten Bedingungen fabelhaft empfindlich ist. (Im Bereich der für die Klangfarben eines Instruments oder der menschlichen Stimme besonders charakteristischen Obertöne, zwischen 2 und 5 kHz ist es tatsächlich sogar empfindlicher als jedes gegenwärtig verfügbare Hifi-Mikrofon, ungefähr um den Faktor zwei.) Zum anderen, weil gute Ohren heutzutage selten sind, viele Leute haben unbemerkte Hörschäden, man muß also viele Leute testen, um echte Goldohren zu finden - es geht ja nicht darum Leute zu überführen die sich überschätzen, von denen es allerdings viele gibt....
Für verallgemeinerbare Tests an den Wahrnehmungsgrenzen werden üblicherweise hunderte von Leuten einzeln getestet, so ein Procedere zieht sich über Monate, z.T. auch deswegen, weil die Erkennungsleistung manchmal erst über lange Zeit bis zum Anschlag trainiert werden muss, um an die echten Grenzen zu kommen. (Ich habe mal als einer von vielen an so einer Studie teilgenommen, bei der es um minimal wahrnehmbare taktile Unterschiede ging. Jeder musste über drei Wochen alle zwei oder drei Tage für 2Stunden anrücken, und pro 30 minütiger Sitzung mit entsprechenden Pausen konzentriert hunderte von Durchgänge absolvieren...)
Um den Test genügend empfindlich zu machen, muß man nicht nur viele Leute testen, sondern auch viele Durchgänge pro Person fahren, es müssen hunderte, nicht nur zehn oder zwanzig sein. Schließlich muß man beim Testdesign die Eigenheiten der menschlichen Wahrnehmung berücksichtigen: Die Wahrnehmungsschwellen liegen im unbewussten und verlaufen zudem unscharf, sie sind statitischer Natur, es gibt kein eindeutiges hör ich noch - hör ich nicht mehr, es gibt nur zunehmende Unsicherheit und stärkeres "Rauschen" der Reizantworten des Gehörs. Erst mit forced-choice-Methoden kann man diese unbewussten feinen Effekte nahe den Hörschwellen erfassen, die sonst nicht zugänglich sind, andernfalls erhält man falsch negative Ergebnisse. Der Grund liegt daran, dass die von der Wahrnehmung tatsächlich noch registrierten feinsten Reizunterschiede zwar nicht unmittelbar ins Bewusstsein gelassen werden, aber dennoch registriert und für den Sinneseindruck unbewußt ausgewertet werden. Das Gehirn konstuiert aus dem an der Warhnehmungsgrenze mit schwächerem Signal zunehmend verrauschten statistischen Verlauf der Reizantwort eine künstliche schärfere Grenze. Es macht wahrgenommene Unterschiede eindeutiger als sie sind, es schärft das Bild allerdings auf Kosten der bewusst erlebten Empfindlichkeit.
Viele Leute glauben fälschlich nach beliebig langen zermürbenden Durchgängen bessere Entscheidungen treffen zu können. Genau das ist falsch, weil dann feinste unbewusst registrierte Unterschiede vom Gehirn u.U. aktiv weggeregelt werden, wenn Mechanismen der sog. Wahrnehmungskonstanz eingreifen und uns eine stabile Umgebung ohne Unterschied simulieren, was biologisch einen anderen Sinn hat. Diese Regelung und auch die Ermüdung der Reizantwort muß man unterlaufen, wenn man an die Schwellen herankommen will, und hier liegen vielleicht auch die Ursachen für die immer wieder propagierten Lästigkeits- oder Langzeit- oder Zeitfehlereffekte, denen man mit der Methodik der forced choice Experimente bei Blindtests wahrscheinlich besser auf die Spur kommen könnte, vielleicht auch bei sich zu Hause. Mit endlos langen Durchgängen und beliebig langer Zeit zur Entscheidung hat man dagegen keine Chance sie zu erfassen, weil zu stark "rational kontrolliertes" Wahrnehmen und Dauerexposition von Reizen Feinheiten wegnivellieren kann. (Vielleicht kennen manche ähnliche Effekte vom indirekten astronomischen Sehen her, wo feinste Helligkeitsunterschiede auch nicht durch bewusstes Hingucken, sondern durch geübtes Danebenblicken erkennbar werden)
Ich würde daher auch bei privaten Tests dafür plädieren, Probanden nicht solange herumprobieren zu lassen wie sie wollen, um Unterschiede bewusst zu hören, sondern sie in A/B Vergleichen eine möglichst große Zahl (am besten mehrere hundert) von kurzen Durchgängen fester Dauer (10-20 sec) mit jeweils sofort danach abverlangter Entscheidung absolvieren lassen. Dabei ist wichtig den Probanden einzuschärfen, die Entscheidung jeweils nach ihrem besten Bauchgefühl zu treffen, und zwar immer so konzentriert wie nur möglich, auch dann, wenn sie längst keine Unterschiede mehr wahrzunehmen glauben. Also kein willkürliches unmotiviertes Herumraten erlauben, das nur in Richtung Zufallsverteilung nivelliert, sondern konzentriertes motiviertes Raten abverlangen, eine Art „emotional guess“ für den man bei jedem Durchgang unmittelbar nach Präsentation eines A/B Reizes nur kurz Zeit hat. Alle Probanden müssen mit dem Bemühen antreten, Unterschiede hören zu wollen, auch eine positive Motivation ist für maximale Erkennungsleistung sehr sehr wichtig! Was sie dabei _tatsächlich_ erkannt haben, zeigt dann erst die spätere Auswertung.
Zum guten Schluß müßte man sich bei einem umfassenden Test auch Gedanken machen, mit welchen Signalen man die Hörtests fahren will. Man sollte neben kontrolliert variierten Musikbeispielen eine ganze Reihe künstlicher Signale entwerfen, die definierte minimale Reizunterschiede (Pegel, Rhythmik, Impulse, Dauertöne, Rechtecke, Sinus, bandbegrenztes Rauschen - Zwicker-Frequenzgruppen etc.) enthalten. Die Konzeption solcher Signale wäre ein Kapitel für sich, schließlich muß man intelligent raten, was das Ohr vielleicht noch hören könnte, obwohl man das nicht so genau weiß, und dazu alle möglichen Parameter kombiniert abzuklopfen versuchen, Stichwort Mustererkennung. Dass in Mustern Unterschiede erkannt werden können, die objektiv gar nicht meßbar sind, kompliziert die Kontrolle des Ganzen zusätzlich. (Weshalb es auch falsch ist zu behaupten, alle wahrnehmbaren Unterschiede wären messbar) .
Dass eine einwandfreie Gerätetechnik und Einzeltestung - keine Gruppenveranstaltung - ebenso aufwändig sind, muß nicht besonders betont werden. Insgesamt ist so ein Procedere um den Wahrnehmungsgrenzen möglichst objektiv auf die Spur zu kommen nicht vergnüglich, sondern harte erschöpfende Arbeit - und stellt Anforderungen, an der private Tests zum Vergnügen scheitern dürften. Aber vielleicht könnte man schon allein mit der forced-choice Methodik (viele kurze Durchgänge, konzentriertes Raten mit abverlangter Antwort) auch ohne hunderte Leute zu testen und ohne Testsignale zu designen in privaten Vergnügungstests einen Schritt in Richtung höherer Empfindlichkeit weiter kommen. Und damit entweder doch kleine Unterschiede nachweisen, oder die Luft für die pauschalen Blindtestkritiker noch ein bisschen dünner werden lassen...
Kommentar