Hallo.
Hier mal ein paar Hintergrundinfos zum Testansatz
Allgemein
Verblindung
Das Ganze wird doppelt verblindet.
Der Proband weiss nicht, welches gerät sich hinter A und welches sich hinter B versteckt.
Derjenige, der zwischen A und B schaltet, weiß es auch nicht.
Derjenige, der protokolliert, detto.
Der Proband weiss nicht, ob wirklich geschaltet wurde oder nicht. Also kann er nur anhand eines wahrgenommenen Unterschieds erkennen, ob nach dem "Wechsel" ein anderes Gerät spielt oder nicht.
Genau so geht es demjenigen, der Protokoll führt.
Nur derjenige, der schaltet, weiss, ob es ein A/B, B/A, A/A oder B/B Wechsel war.
Und deshalb sitzt auch er hinter einem Schirm, sodass es keinen Kontakt zwischen ihm und dem Probanden geben kann.
Soundsamples
Als erstes müssen am besten von vielen hier Kriterien definiert werden, die gehörte Unterschiede zwischen Komponenten ausmachen können.
Beispiele sind: Räumlichkeit, Details, Impulsivität, Druck, etc.
Das ganze wird in einem eigenen Thread "Soundsamples" im Detail durchgenommen.
Danach werden Musikbeispiele gesammelt, welche diese Kriterien besonders deutlich machen.
Wir sollten mit 3 -4 Musikbeispielen die ganze Liste abdecken können. Am besten sollten sie aus unterschiedlichen Musikstilen kommen (Rock, Jazz, Klassik, Elektronik, etc.)
Auch Nominierungen von Beispielen sind in dem Thread erbeten und willkommen.
Zusätzlich soll ein Soundfile mit Weißem Rauschen mitlaufen.
Die Probanden bekommen die CD mit den Soundfiles ca. 2 Wochen vor dem Test zugeschickt, um sich mit den Stücken vertraut zu machen.
Vor dem Test können sie sich vor Ort auf die dortigen Bedingungen einhören und die für sie passende Lautstärke einstellen.
Equipment
Vor dem eigentlichen Test muss das Equipment qualifiziert werden.
Darunter verstehe ich den Nachweis, dass ein Setup einen Unterschied im Signal auch so wiedergibt.
Dazu soll ein Testsignal in definierten Frequenzbereichen manipuliert werden.
Danach wird das Signal über das Testsystem abgespielt und per Messmikro geschaut, ob genau diese Manipulation auch messbar ist (z.B. eine Absenkung eines Frequenzbereichs)
Auch dazu wird es einen eigenen Thread geben, in dem Inputs und Ideen willkommen sind.
Man kann andenken, den BT mit verschiedenen Setups durchzuführen, da auch diesbezüglich imer wieder Bedenken geäußert werden.
Ich dachte mir so etwas wie
Doch das bedeutet einen massiven Aufwand und eine verdreifachung der Durchlaufzeit.
Ds macht es fast unmöglich
Wie gesagt: Details bitte im eigenen Thread diskutieren, wenn er da ist.
Kontrollen
Erst Positiv- und Negativkontrollen helfen bei der Interpretation des Ergebnisses:
Negativkontrolle
Obwohl 10 Wechsel angesagt werden, sind es 10 Schaltungen A/A oder B/B.
Sollten hier Unterschiede gehört werden, deutet das auf suggerierte Unterschiede hin.
Positivkontrolle
Es wird 10x zwischen A/B/A/B etc. geschaltet, wobei in einem der beiden ein manipuliertes Signal abgespielt wird (Anhebung oder Absenkung in einem oder mehreren Frequenzbereichen)
Schaltsequenz
Es wird pro durchgang eine vorgeschriebene Schaltequenz durchgespielt:
Eine Sequenz besteht aus:
je 10 Wechsel bei:
Macht pro Sequenz 40 Datenpunkte.
Die jeweilige Anspieldauer muss noch definiert werden. Ich denke mir, sie kann irgendwo zwischen 10 und 30 sec liegen.
Folgende Sequenzen werden bei jedem Probanden durchgespielt (in geheimer Abfolge):
Macht pro Proband 240 Datenpunkte
Bei 10 Sec Anspieldauer macht das 40 Minuten pro Proband.
Man kann das ganze auch halbieren (nur je 1x Positiv, Negativ, Vergleich), das macht es nicht mehr ganz so wasserdicht, würde notfalls aber auch gehen.
.
Bleiben immer noch 120 Datenpunkte.
Dauer: ca. 20 min.
Spielen wir das mit B&W, Monitoren und KH durch, macht das pro Proband insgesamt 720 Datenpunkte (2 Stunden!) oder 360 Datenpunkte (1 Stunde).
Mir Pausen macht das dann 1,5 Stunden pro Proband.
Also sieht die Wahl für mich so aus:
Auswertung
Das ganze wird statistisch ausgewertet, inkl. Standardabweichungen.
Natürlich werden auch die Kontrollen dabei berücksichtigt.
Wie gesagt:
Details dazu in eigenen Threads.
Hier bitte um Inputs, die die Gesamtmethodik betreffen.
Wurde etwas ausgelassen?
Was kann man wie einfacher oder besser machen?
LG
Babak
Hier mal ein paar Hintergrundinfos zum Testansatz
Allgemein
- Es ist ein Kurzzeittest.
- So sinnvoll ein Langzeit-Test ist: der bedarf einer anderen Vorgehensweise und eines anderen Versuchsaufbaues und sollte somit getrennt durchgeführt werden.
- Getestet werden könenn Verstärker und Quellen. Bei Kabeln bin ich mir noch nicht sicher, wie das mit der Umschaltbox geht. Da muss ich noch mit David reden.
- Es finden immer paarweise vergleiche statt.
- Die Pegeln werden abgeglichen
Verblindung
Das Ganze wird doppelt verblindet.
Der Proband weiss nicht, welches gerät sich hinter A und welches sich hinter B versteckt.
Derjenige, der zwischen A und B schaltet, weiß es auch nicht.
Derjenige, der protokolliert, detto.
Der Proband weiss nicht, ob wirklich geschaltet wurde oder nicht. Also kann er nur anhand eines wahrgenommenen Unterschieds erkennen, ob nach dem "Wechsel" ein anderes Gerät spielt oder nicht.
Genau so geht es demjenigen, der Protokoll führt.
Nur derjenige, der schaltet, weiss, ob es ein A/B, B/A, A/A oder B/B Wechsel war.
Und deshalb sitzt auch er hinter einem Schirm, sodass es keinen Kontakt zwischen ihm und dem Probanden geben kann.
Soundsamples
Als erstes müssen am besten von vielen hier Kriterien definiert werden, die gehörte Unterschiede zwischen Komponenten ausmachen können.
Beispiele sind: Räumlichkeit, Details, Impulsivität, Druck, etc.
Das ganze wird in einem eigenen Thread "Soundsamples" im Detail durchgenommen.
Danach werden Musikbeispiele gesammelt, welche diese Kriterien besonders deutlich machen.
Wir sollten mit 3 -4 Musikbeispielen die ganze Liste abdecken können. Am besten sollten sie aus unterschiedlichen Musikstilen kommen (Rock, Jazz, Klassik, Elektronik, etc.)
Auch Nominierungen von Beispielen sind in dem Thread erbeten und willkommen.
Zusätzlich soll ein Soundfile mit Weißem Rauschen mitlaufen.
Die Probanden bekommen die CD mit den Soundfiles ca. 2 Wochen vor dem Test zugeschickt, um sich mit den Stücken vertraut zu machen.
Vor dem Test können sie sich vor Ort auf die dortigen Bedingungen einhören und die für sie passende Lautstärke einstellen.
Equipment
Vor dem eigentlichen Test muss das Equipment qualifiziert werden.
Darunter verstehe ich den Nachweis, dass ein Setup einen Unterschied im Signal auch so wiedergibt.
Dazu soll ein Testsignal in definierten Frequenzbereichen manipuliert werden.
Danach wird das Signal über das Testsystem abgespielt und per Messmikro geschaut, ob genau diese Manipulation auch messbar ist (z.B. eine Absenkung eines Frequenzbereichs)
Auch dazu wird es einen eigenen Thread geben, in dem Inputs und Ideen willkommen sind.
Man kann andenken, den BT mit verschiedenen Setups durchzuführen, da auch diesbezüglich imer wieder Bedenken geäußert werden.
Ich dachte mir so etwas wie
- Über große B&Ws
- Über Aktivmonitore
- Über gute Kopfhörer (weobei ich nciht weiss, wie man bei KH messen kann)
Doch das bedeutet einen massiven Aufwand und eine verdreifachung der Durchlaufzeit.
Ds macht es fast unmöglich
Wie gesagt: Details bitte im eigenen Thread diskutieren, wenn er da ist.
Kontrollen
Erst Positiv- und Negativkontrollen helfen bei der Interpretation des Ergebnisses:
Negativkontrolle
Obwohl 10 Wechsel angesagt werden, sind es 10 Schaltungen A/A oder B/B.
Sollten hier Unterschiede gehört werden, deutet das auf suggerierte Unterschiede hin.
Positivkontrolle
Es wird 10x zwischen A/B/A/B etc. geschaltet, wobei in einem der beiden ein manipuliertes Signal abgespielt wird (Anhebung oder Absenkung in einem oder mehreren Frequenzbereichen)
Schaltsequenz
Es wird pro durchgang eine vorgeschriebene Schaltequenz durchgespielt:
Eine Sequenz besteht aus:
je 10 Wechsel bei:
- Musik 1
- Musik 2
- Musik 3
- Rauschen
Macht pro Sequenz 40 Datenpunkte.
Die jeweilige Anspieldauer muss noch definiert werden. Ich denke mir, sie kann irgendwo zwischen 10 und 30 sec liegen.
Folgende Sequenzen werden bei jedem Probanden durchgespielt (in geheimer Abfolge):
- Positivkontrolle
- Positivkontrolle (mit Kontrolle in B)
- Negativkontrolle mit A
- Negativkontrolle mit B
- Vergleich A/B Durchgang 1
- Vergleich A/B Durchgang 2
Macht pro Proband 240 Datenpunkte
Bei 10 Sec Anspieldauer macht das 40 Minuten pro Proband.
Man kann das ganze auch halbieren (nur je 1x Positiv, Negativ, Vergleich), das macht es nicht mehr ganz so wasserdicht, würde notfalls aber auch gehen.
.
Bleiben immer noch 120 Datenpunkte.
Dauer: ca. 20 min.
Spielen wir das mit B&W, Monitoren und KH durch, macht das pro Proband insgesamt 720 Datenpunkte (2 Stunden!) oder 360 Datenpunkte (1 Stunde).
Mir Pausen macht das dann 1,5 Stunden pro Proband.
Also sieht die Wahl für mich so aus:
- Nur mit einem Setup, dafür vollständige Kontrollen
- Mit allen 3 Setups, und dafür mit weniger robusten Kontrollen
Auswertung
Das ganze wird statistisch ausgewertet, inkl. Standardabweichungen.
Natürlich werden auch die Kontrollen dabei berücksichtigt.
Wie gesagt:
Details dazu in eigenen Threads.
Hier bitte um Inputs, die die Gesamtmethodik betreffen.
Wurde etwas ausgelassen?
Was kann man wie einfacher oder besser machen?
LG
Babak
Kommentar