Хоча я відчуваю, що трохи по-суєтному суперечить як «поважному тексту», так і іншому користувачеві резюме, мені здається, що на формулу Спірмена-Брауна не впливає наявність предметів різної складності. Безумовно, формула Спірмена-Брауна зазвичай виводиться з припущення, що у нас є паралельні пункти, що означає (серед іншого), що предмети мають однакові труднощі. Але виявляється, це припущення не є необхідним; це може бути розслаблено, щоб дозволити нерівні труднощі, і формула Спірмена-Брауна все одно буде дотримуватися. Я демонструю це нижче.
Нагадаємо, що в класичній теорії випробувань вимірюванням прийнято вважати суму компонента "справжнього бала" і похибки компонента , тобто
з і некорельованими. Припущення про паралельні пункти полягає в тому, що всі елементи мають однакові істинні бали, що відрізняються лише своїми компонентами помилок, хоча вони вважаються однаковими. У символах, для будь-якої пари елементів іXTE
X=T+E,
TEXX′T=T′var(E)=var(E′).
Давайте подивимося, що станеться, коли ми розслабимо перше припущення, таким чином, що елементи можуть відрізнятись за своїми труднощами, а потім отримаємо надійність загального тестового балу за цими новими припущеннями. Зокрема, припустимо, що справжні бали можуть відрізнятися залежно від постійної добавки, але помилки все одно мають однакову дисперсію. У символах
Будь-які різниці у складності фіксуються адитивною константою. Наприклад, якщо , то оцінки на мають тенденцію бути вищими, ніж оцінки на , так що "легше", ніж . Ми можемо називати це
по суті паралельнимиT=T′+c′var(E)=var(E′).
c′>0XX′XX′пункти, аналогічно припущенню про "істотну тау-еквівалентність", яка аналогічно розслаблює тау-еквівалентну модель.
Тепер для отримання надійності тестової форми таких предметів. Розглянемо тест, що складається з по суті паралельних елементів, сума яких дає тестовий бал. Надійність - це, за визначенням, відношення справжньої відхилення балів до спостережуваної дисперсії балів. Для надійності окремих елементів випливає з визначення суттєвого паралелізму, що вони мають однакову надійність, яку ми позначимо з , з є істинною дисперсією балів та дисперсією помилок. Для надійності загального тестового бала спочатку вивчаємо дисперсію загального тестового бала, яка є
kρ=σ2T/(σ2T+σ2E)σ2Tσ2E
var(∑i=1kTi+Ei)=var(∑i=1kT+ci+Ei)=k2σ2T+kσ2E,
де (без ) - будь-який довільний істинний бал, на який можна зміщувати справжні результати всіх елементів через їх постійні умови, є істинна дисперсія балів, а - дисперсія помилок. Зауважте, що постійні умови випадають! Це ключове. Тож надійність загального тестового балу дорівнює
Tσ2Tσ2Ek2σ2Tk2σ2T+kσ2E=kσ2Tkσ2T+σ2X−σ2T=kρ1+(k−1)ρ,
що є лише класичною формулою Спірмена-Брауна, незмінною. Це свідчить про те, що навіть при зміні "складності" предметів, визначених як їх середні бали, формула Спірмена-Брауна все ще дотримується.
@JeremyMiles піднімає деякі цікаві та важливі моменти щодо того, що може статися, коли ми збільшимо довжину тесту "в реальному світі", але, принаймні, згідно з ідеалізованими припущеннями класичної теорії випробувань, зміни складності предмета не мають значення для надійності тестова форма (на відміну від припущень сучасної Теорії реагування на предмет!). Ця ж основна лінія міркувань також полягає в тому, що ми зазвичай говоримо про істотну тау-еквівалентність, а не про тау-еквівалентність, оскільки більшість усіх важливих результатів стосуються більш м'якого випадку, коли труднощі з предметом (тобто засоби) можуть відрізнятися.