У мене є дані про серії виграшних та програшних ставок протягом 5 раундів ставок із виснаженням після кожного раунду. Я використовую дерево рішень на зразок наступного для відображення даних.
Вузли до вершини дерева - це ті, що мають виграшні ставки, а ті, хто знаходиться внизу дерева, мають програші, які програють. Я хочу переглянути (а) виснаження у кожному вузлі (b) зміни середніх розмірів ставок на кожному вузлі. Я дивлюся на швидкість виснаження кожного вузла від попереднього вузла та рівень виживання (використовуючи очікувану кількість людей у кожному вузлі, якщо ймовірність становить 50%). Наприклад, якщо ймовірність становить 50% на кожному вузлі, з 1000, що розпочалася, приблизно 500 чоловік повинні знаходитись у кожному другому вузлі, W і L. Гіпотеза: (а) швидкість виснаження вища після втрати ставки (б) середній розмір ставок зменшується після програшів та збільшується після переможців.
Я просто хочу зробити це спочатку в дуже простому універсальному середовищі. Як я можу виконати t-тест, щоб показати, що зміна середнього розміру ставки від вузла WW до вузла WWW є статистично значущим, якщо 50 людей випали? Я не впевнений, що це правильний підхід: кожна наступна ставка є незалежною, але люди випадають після програшів, тому вибірка не відповідає. Якби це був просто той самий клас, який складав серію іспитів один за одним, і ніхто не відмовлявся, я зрозумів би, як виконати відповідний t-тест, але я думаю, це трохи інакше.
Як я можу це зробити? Крім того, якщо результати спотворені невеликою кількістю клієнтів, як я можу взяти 5% верхнього та нижнього 5%? Просто видаліть клієнтів із найвищим сукупним розміром ставки зі ставки 1 - 3?
У мене є дані, з яких була створена фігура, тому у мене на кожному вузлі є середня, std, std помилка тощо.