Я викладаю базовий курс статистики, і сьогодні я висвітлю тест незалежності для двох категорій та тест на однорідність. Ці два сценарії концептуально відрізняються, але можуть використовувати однакову тестову статистику та розподіл. При тесті на однорідність граничні підсумки для однієї з категорій вважаються частиною самої конструкції - вони представляють кількість досліджуваних, вибраних для кожної експериментальної групи. Але оскільки тест у квадраті обертається навколо кондиціонування на всіх граничних підсумках, математичних наслідків для розмежування тестів на однорідність та тестів на незалежність з категоричними даними немає, принаймні жодного, коли використовується цей тест.
Моє запитання таке: чи існує школа статистичної думки або статистичний підхід, яка б давала різні аналізи, залежно від того, чи ми тестуємо на незалежність (де всі маргінали є випадковими змінними) або тест на однорідність (де один набір маргіналів встановлений дизайном)?
У безперервному випадку, скажімо, де ми спостерігаємо за тією ж темою, і перевіряємо на незалежність, або спостерігаємо у різних популяціях і перевіряємо, якщо вони походять з одного розподілу, метод відрізняється (кореляція аналіз проти t-тесту). Що робити, якщо категоричні дані надходять із дискретних безперервних змінних? Чи повинні тести на незалежність та однорідність не відрізнятись?