Обговорюючи рівень виконання завдань, чи є спосіб показати, що 0 з 20 спроб "гірше", ніж 0 з 10 спроб?
Обговорюючи рівень виконання завдань, чи є спосіб показати, що 0 з 20 спроб "гірше", ніж 0 з 10 спроб?
Відповіді:
Припустимо, ми знаємо ймовірність успіху в спробі. У цьому випадку ми обчислюємо ймовірність 0 з 10 та 0 із 20 випадків.
Однак у цьому випадку ми підемо навпаки. Ми не знаємо ймовірності, у нас є дані і ми намагаємось оцінити ймовірність.
Чим більше випадків у нас, тим більш впевненими ми можемо бути щодо результатів. Якщо я перекину монету, і це буде голова, ви не будете дуже впевнені, що це двічі. Якщо я кину його 1000 разів, і це будуть всі голови, навряд чи це буде врівноважено.
Існують методи, розроблені з метою врахування кількості стежок при дачі оцінок. Один з них - добавка згладжування, яке @abukaj коментує вище. При адитивному згладжуванні ми враховуємо додаткові псевдопроби. У нашому випадку замість того, який ми бачили, ми додаємо ще два - один успішний та один невдалий.
Зауважимо, що присадка згладжування - це лише один метод оцінки. Ви отримаєте різні результати за допомогою різних методів. Навіть при самому згладжуванні добавки ви мали б різні результати, якби додали 4 псевдопроби.
Іншим методом є використання інтервалу довіри, як запропонував @mdewey. Чим більше зразків у нас, тим коротший буде довірчий інтервал. Розмір довірчого інтервалу пропорційний квадратному кореню зразків - . Тому подвоєння кількості зразків призведе до скорочення довіри . √
Середнє значення в обох випадках дорівнює 0. Це ми беремо рівень довіри 90% (z = 1.645)
У разі відсутності даних виникає невизначеність. Припущення, які ви робите, і зовнішні дані, які ви будете використовувати, змінить те, що ви отримаєте.
Розширюючи ідею виклику довірчих інтервалів, існує концепція точного біноміального інтервалу.
Біноміальний розподіл - це загальна кількість успіхів у незалежних випробуваннях, які закінчуються або 0 (невдача), або 1 (успіх). Імовірність отримання 1 (успіху) традиційно позначається , а його доповнення дорівнює . Тоді типовим результатом ймовірності є те, що ймовірність точно успіхів у випробуваннях єq = 1 - p k n
Концепція довірчого інтервалу полягає в обмеженні набору можливих значень параметрів моделі (тут, ймовірності успіху ), щоб ми могли робити імовірнісні (ну, частостістські ) твердження про те, чи справжнє значення параметра знаходиться всередині цього інтервалу (а саме , якщо ми повторимо ймовірнісний експеримент проведення 10 або 20 випробувань і побудуємо довірчий інтервал певним чином, ми будемо спостерігати, що справжнє значення параметра знаходиться всередині інтервалу 95% часу).
У цьому випадку ми можемо вирішити для у цій формулі:
Отже, якби ми хотіли одностороннього інтервалу 95%, ми встановимо щоб вирішити, що ймовірність того, що спостерігається нульовий підрахунок, буде не більше 5%. Для відповідь - (тобто на крайній випадок, якщо ймовірність успіху в кожному дослідженні становить 13,9%, то ймовірність спостереження за нульовими успіхами становить 5%). За відповідь - . Тож із вибірки ми дізналися більше, ніж із вибірки , в тому сенсі, що ми можемо `` виключити '' діапазон що вибірка все ще залишає як правдоподібне.
Функція ймовірності - це Бернуллі, а бета-розподіл є кон'югатом, що передує розподілу Бернуллі, отже, задній слід за розподілом Бета. Крім того, задність параметризується:
Отже:
Таким чином, якщо ви бачите 10 відмов, ваше очікування дорівнює , а якщо ви бачите 20 збоїв, ваше очікування - . Чим більше невдач ви побачите, тим нижче ваші очікування .
Це розумний аргумент? Це залежить від того, як ви ставитеся до статистики Баєса, чи готові ви моделювати невизначеність щодо якогось параметра використовуючи механіку ймовірності. І це залежить від того, наскільки розумний ваш вибір попереднього.