Нещодавно я думав про альтернативний спосіб "тестування на еквівалентність", заснований на відстані між двома розподілами, а не між їх засобами.
Існують деякі методи, що забезпечують довірчі інтервали для перекриття двох розподілів Гаусса:
Перекриття (між?) Двох розподілів і має приємну ймовірнісну інтерпретацію:
де- загальна відстань варіації між та .O(P1,P2)P1P2
1−O(P1,P2)=TV(P1,P2)
TV(P1,P2)=supA∣∣P1(A)−P2(A)∣∣P1P2
Це означає, що, наприклад, якщо то ймовірності, задані і будь-якої події, не відрізняються більше ніж . Грубо кажучи, два розподіли роблять однакові прогнози до .O(P1,P2)>0.9P1P20.110%
Таким чином, замість того, щоб використовувати критерій прийняття на основі критичного значення для різниці між засобами та , як у класичному тестуванні на еквівалентність, ми могли б базувати його на критичному значенні для різниці між ймовірностями прогнозів, заданими два розподіли.μ1μ2
Я думаю, що є перевага з точки зору "об'єктивності" критерію. Критичне значенняексперт повинен надати справжню проблему: це має бути цінністю, за якою різниця має практичне значення. Але іноді ніхто не має ґрунтовних знань про справжню проблему, і немає жодного експерта, здатного надати критичну цінність. Прийняття звичайного критичного значення щодо може бути способом до критерію, не залежного від фізичної проблеми, що розглядається.|μ1−μ2|TV(P1,P2)
У випадку Гаусса з однаковими дисперсіями перекриття є один на один, пов'язане зі стандартизованою середньою різницею .|μ1−μ2|σ