Важливо правильно поставити питання і прийняти корисну концептуальну модель балів.
Питання
Потенційні пороги обману, такі як 55, 65 та 85, апріорі відомі незалежно від даних: їх не потрібно визначати з даних. (Отже, це не є ні проблемою виявлення, ні проблемою з розподілом.) Тест повинен оцінювати докази того, що деякі (не всі) бали трохи менше цих порогів були переміщені до цих порогів (або, можливо, трохи більше цих порогових значень).
Концептуальна модель
Для концептуальної моделі важливо розуміти, що бали навряд чи мають нормальний розподіл (ні будь-який інший легко параметризований розподіл). Це повністю зрозуміло у розміщеному прикладі та в кожному іншому прикладі з оригінального звіту. Ці бали представляють собою суміш шкіл; навіть якщо розподіл у будь-якій школі був нормальним (їх немає), суміш, швидше за все, не буде нормальною.
Простий підхід передбачає, що існує справжній розподіл балів: той, про який можна було б повідомити, крім цієї конкретної форми обману. Тому це непараметрична установка. Це здається занадто широким, але є деякі характеристики розподілу балів, які можна передбачити або спостерігати у фактичних даних:
Підрахунки балів , , будуть тісно взаємозв’язані, .i−1ii+11≤i≤99
У цих підрахунках будуть різні варіанти навколо деякої ідеалізованої плавної версії розподілу балів. Зазвичай ці варіанти мають розмір, рівний квадратному кореню підрахунку.
Обдурення відносно порогового значення не вплине на рахунки за будь-яку оцінку . Ефект його пропорційний кількості кожного балу (кількість учнів, які "ризикують" бути підданими обману). Для балів нижче цього порогу кількість буде зменшена на деяку частку і ця сума буде додана до .ti≥tic(i)δ(t−i)c(i)t(i)
Сума змін зменшується з відстанню між балом і порогом: є функцією, що зменшується, .δ(i)i=1,2,…
З огляду на поріг , нульовою гіпотезою (без обману) є те, що , що означає, що однаково . Альтернативою є те, що .tδ(1)=0δ0δ(1)>0
Побудова тесту
Яку тестову статистику використовувати? Згідно з цими припущеннями, (а) ефект є аддитивним у підрахунках, і (б) найбільший ефект буде мати місце біля порогу. Це вказує на перегляд перших відмінностей підрахунків, . Подальший розгляд пропонує піти на крок далі: за альтернативною гіпотезою ми очікуємо побачити послідовність поступових депресивних підрахунків, коли оцінка наближається до порогу знизу, то (i) велика позитивна зміна при наступним (ii) a великі негативні зміни при . Щоб досягти максимальної потужності тесту, давайте розглянемо другі відмінності,i t t t + 1c′(i)=c(i+1)−c(i)ittt+1
c′′(i)=c′(i+1)−c′(i)=c(i+2)−2c(i+1)+c(i),
тому що при це буде поєднувати велике негативне зниження з негативом великого додатного збільшення , тим самим збільшуючи ефект обману .i=t−1c(t+1)−c(t)c(t)−c(t−1)
Я буду гіпотезувати - і це можна перевірити - що послідовне співвідношення підрахунків біля порогу є досить малим. (Послідовне співвідношення в іншому місці не має значення.) Це означає, що дисперсія приблизноc′′(t−1)=c(t+1)−2c(t)+c(t−1)
var(c′′(t−1))≈var(c(t+1))+(−2)2var(c(t))+var(c(t−1)).
Раніше я запропонував для всіх (те, що також можна перевірити). Звідсиvar(c(i))≈c(i)i
z=c′′(t−1)/c(t+1)+4c(t)+c(t−1)−−−−−−−−−−−−−−−−−−−−√
приблизно повинна мати дисперсію одиниці. Для великої кількості балів (розміщена приблизно 20 000) ми також можемо очікувати приблизно нормального розподілу . Оскільки ми очікуємо, що вкрай негативне значення вказує на схему обману, ми легко отримуємо тест на розмір : write для cdf стандартного нормального розподілу, відкидаємо гіпотезу про відсутність обману на порозі коли .c′′(t−1)αΦtΦ(z)<α
Приклад
Наприклад, розглянемо цей набір справжніх тестових балів, отриманих у суміші трьох нормальних розподілів:
Для цього я застосував графік обману на порозі визначеному . Це зосереджує майже всі обману на один-два бали одразу нижче 65:t=65δ(i)=exp(−2i)
Щоб зрозуміти, що робить тест, я обчислював для кожного балу, а не лише , і склав його проти балу:zt
(Насправді, щоб уникнути проблем з невеликими підрахунками, я спочатку додав 1 до кожного підрахунку від 0 до 100, щоб обчислити знаменник .)z
Коливання поблизу 65 очевидні, як і тенденція, коли всі інші коливання мають розмір приблизно 1, що відповідає припущенням цього тесту. Статистика тесту - з відповідним значенням p , надзвичайно значущим результатом. Візуальне порівняння з малюнком у самому питанні дозволяє припустити, що цей тест може повернути значення р принаймні як невелике.z=−4.19Φ(z)=0.0000136
(Однак зауважте, що сам тест не використовує цей сюжет, який показаний для ілюстрації ідей. Тест дивиться лише на накреслене значення на порозі, ніде більше. Це все ж було б хорошою практикою робити такий сюжет щоб підтвердити, що тестова статистика дійсно виділяє очікувані пороги як локуси обману і що всі інші бали не піддаються таким змінам. Тут ми бачимо, що в усіх інших балах коливання коливаються приблизно від -2 до 2, але рідко Зауважте також, що для обчислення не потрібно насправді обчислювати стандартне відхилення значень у цій графіці , тим самим уникаючи проблем, пов'язаних із ефектами обману, що нагнітають коливання у кількох місцях.)z
При застосуванні цього тесту до декількох порогів було б розумним коригування розміру тесту Bonferroni. Додаткове коригування при застосуванні до декількох тестів одночасно також було б хорошою ідеєю.
Оцінка
Ця процедура не може бути серйозно запропонована до використання, поки вона не буде перевірена на фактичних даних. Хорошим способом було б взяти бали за один тест і використовувати некритичну оцінку для тесту як порогову. Імовірно, такий поріг не піддавався цій формі обману. Моделюйте обман за цією концептуальною моделлю та вивчіть модельований розподіл . Це вкаже (а) наскільки точні значення p та точність (b) потужність тесту для позначення імітованої форми обману. Дійсно, можна використати таке симуляційне дослідження на тих самих даних, які оцінюються, забезпечуючи надзвичайно ефективний спосіб перевірити, чи є тест відповідним і яка його фактична потужність. Тому що тестова статистикаzz настільки просто, моделювання буде практично зробити і швидко виконати.