Як я можу оцінити ймовірність того, що випадковий член з однієї сукупності буде «кращим», ніж випадковий член з іншої сукупності?


15

Припустимо, у мене є вибірки з двох різних груп. Якщо я виміряю, скільки часу потрібно кожному члену, щоб виконати завдання, я можу легко оцінити середнє значення та дисперсію кожного населення.

Якщо я зараз припускаю гіпотезу про випадкове парування з однією людиною від кожної популяції, чи можу я оцінити ймовірність того, що перше швидше, ніж друге?

Я маю на увазі конкретний приклад: вимірювання - це моменти часу, коли я рухаюсь від А до В, а групи населення представляють різні маршрути, які я міг би пройти; Я намагаюся розібратися, якою є ймовірність того, що вибір маршруту А для мого наступного циклу буде швидшим, ніж вибір маршруту В. Коли я фактично виконую цикл, у мене з’являється ще одна точка даних для мого набору зразків :).

Я усвідомлюю, що це жахливо спрощений спосіб спробувати вирішити це, хоча б тому, що в будь-який день вітер швидше вплине на мій час, ніж будь-що інше, тому, будь ласка, повідомте мене, якщо ви думаєте, що я прошу неправильне запитання ...


Це можна зробити за допомогою простого біноміального тестування. У @Macro є хороша відповідь. Однак одне питання стосується самих зразків: чи є щось, що може вплинути на ваше рішення взяти маршрут А чи маршрут Б? Зокрема, ти любиш їхати по маршруту А, коли дороги сухі, вітер у тебе в спині, а вечеря чекає? :) Будьте обережні, будь-що, що могло б вплинути на людей, що пережили люди, в будь-якому наборі, або що могло б змістити зразки якимось чином. Наприклад, спробуйте встановити свій план вибірки завчасно, враховуючи необхідність зміни (наприклад, безпеку).
Ітератор

Ще одне врахування: припустимо, у вас є два маршрути з дуже схожими засобами, і жоден з них не домінує над іншим з точки зору ймовірності того, що він буде швидшим. Наприклад, один - це завжди 10 або 20 хвилин, а інший - точно 15 хвилин. Можливо, вам буде краще скасувати більшу невизначеність (наприклад, стандартне відхилення) або віддати перевагу тій, яка швидше за все займе менше ніж деякий поріг часу. Ваше запитання як - це добре; Я просто пропоную майбутнє вдосконалення.
Ітератор

Питання зі статистикою добре, але якщо ви хочете розробити ймовірність того, який маршрут швидший, я б запропонував виміряти довжину маршрутів. Якщо місцевість не горбиста, то коротший маршрут завжди буде швидшим.
mpiktas

Якщо вітер є важливим фактором і якщо швидкість вітру пов'язана для двох маршрутів, то, здається, людині знадобиться інформація про залежність між А і В, щоб точно відповісти на питання. Для цього вам знадобляться двовимірні дані, і важко їхати двома шляхами одночасно. Ви можете зарахувати когось іншого, який допоможе вам зібрати дані, але тоді потрібно буде враховувати мінливість між вершниками. Якщо A і B є незалежними, відповіді нижче чудові.

По-іншому: якщо я намагаюся вирішити, який шлях пройти, через тунель, через поле, а вітер дме, як божевільний, я можу дуже добре вибрати поле, навіть якщо воно в середньому жахливо гірше.

Відповіді:


12

Рішення

Нехай два засоби будуть і μ y, а їхні стандартні відхилення будутьμxμy та σ y відповідно. Тому різниця в часових режимах між двома їздами ( Y - X ) має середнє μ y - μ x і стандартне відхиленняσxσyYXμyμx . Стандартизована різниця ("z оцінка") єσx2+σy2

z=μyμxσx2+σy2.

Якщо ваш час їзди не має дивних розподілів, ймовірність того, що їзда займає більше часу, ніж їзда X , приблизно дорівнює нормальному кумулятивному розподілу evalu , оціненому в z .YXΦz

Обчислення

Цю ймовірність ви можете відпрацювати на одному з ваших поїздок, тому що у вас вже є оцінки тощо :-). Для цієї мети можна легко запам'ятати кілька значень ключових з Ф : Ф ( 0 ) = 0,5 = 1 / 2 , Φ ( - 1 ) 0,16 1 / 6μxΦΦ(0)=.5=1/2Φ(1)0.161/6 , , і Φ ( - 3 ) Φ(2)0.0221/40 . (Наближення може бути поганим для | z | набагато більше, ніж 2 , але знання Φ ( - 3 ) допомагає при інтерполяції.) У поєднанні з Φ ( z ) = 1 - Φ ( - z ) і трохи інтерполяцією, ви можна швидко оцінити ймовірність однієї значущої цифри, що є більш ніж точним врахуванням характеру проблеми та даних.Φ(3)0.00131/750|z|2Φ(3)Φ(z)=1Φ(z)

Приклад

Припустимо, маршрут займає 30 хвилин зі стандартним відхиленням 6 хвилин, а маршрут Y займає 36 хвилин при стандартному відхиленні 8 хвилин. При достатній кількості даних, що охоплюють широкий діапазон умов, гістограми ваших даних можуть з часом наблизитись до таких:XY

Two histograms

(Це функції щільності ймовірності для змінних Gamma (25, 30/25) та Gamma (20, 36/20). Зауважте, що вони чітко перекошені вправо, як можна було б очікувати на час їзди.)

Потім

μx=30,μy=36,σx=6,σy=8.

Звідси

z=363062+82=0.6.

Ми маємо

Φ(0)=0.5;Φ(1)=1Φ(1)10.16=0.84.

Тому ми оцінюємо, що відповідь становить 0,6 від 0,5 до 0,84: 0,5 + 0,6 * (0,84 - 0,5) = приблизно 0,70. (Правильне, але надто точне значення для нормального розподілу становить 0,73.)

Там в 70% ймовірність , що маршрут займе більше часу , ніж маршрут X . Зробивши цей розрахунок у себе в голові, ви знімете з розуму наступний пагорб. :-)YX

(Правильна ймовірність показаних гістограм становить 72%, хоча жодна з них не є нормальною: це ілюструє обсяг та корисність наближення норми для різниці у часі поїздки.)


P(X>Y)

@Macro: якщо дані можна звести до підсумкової статистики за Q, що цікавить, можна зберігати менше даних ... лише думка.
Ітератор

P(X>Y)YXYX

FWIW: @whuber описує t-тест Стьюдента на різницю середніх значень між двома зразками з різними стандартними відхиленнями.
Ітератор

1
Дякую, @whuber, це відповідь на питання, яке я намагався задати :).
Ендрю Ейлетт

6

Мій інстинктивний підхід може бути не найбільш статистично витонченим, але ви можете вважати, що це буде веселіше :)

Я отримав би лист паперу пристойного розміру і розділив стовпчики на часові блоки. Залежно від тривалості вашої їзди - ми говоримо про середній час 5 хвилин або години - ви можете використовувати блоки різного розміру. Скажімо, кожен стовпець - це блок на дві хвилини. Виберіть колір для маршруту A та інший колір для маршруту B, а після кожної їзди зробіть крапку у відповідному стовпчику. Якщо вже є крапка цього кольору, перемістіть один ряд вгору. Іншими словами, це була би гістограма в абсолютних числах.

Тоді ви б будували веселу гістограму з кожної їзди, і візуально бачите різницю між двома маршрутами.

Моє відчуття, засноване на моєму власному досвіді руху велосипедів (не підтверджене кількісною оцінкою) полягає в тому, що часи не будуть нормально розподілятися - вони матимуть позитивне перекос, або іншими словами довгий хвіст часів верхнього кінця. Мій типовий час не настільки довший, ніж мій найкоротший можливий час, але раз у раз я здається, що я потрапляю на всі червоні вогні, і там є набагато вищий верхній кінець. Ваш досвід може бути різним. Тому я думаю, що підхід гістограми може бути кращим, тому ви можете спостерігати за формою розподілу самостійно.

PS: Мені не вистачає респондентів для коментарів на цьому форумі, але я люблю відповідь Whuber! Він досить ефективно звертається до мого занепокоєння щодо косості з допомогою вибіркового аналізу. І мені подобається ідея обчислити у себе в голові, щоб відмовитися від наступного пагорба :)


1
+1 Для творчості. Власне, ваша ідея на шляху до практичної корисності. Було б трохи цікавіше використовувати один із сайтів для відстеження велосипедів (я зараз забуду, який зараз, але додайте, якщо знаєте) для відстеження часів сегменту. Якби ОП повернулася до CV або StackOverflow із запитанням про побудову сегментного часу та отримання щільності, пов'язаної з ним, це було б чудовою статистичною вправою - ГІС, статистична візуалізація та функції щільності, о, мій! :)
Ітератор

1
Я використовував Google MyTracks на своєму телефоні для відстеження велосипедних сегментів. Я вважаю, що телефон не дуже підходить для нього, оскільки він, як правило, не працює на пристрої, не оптимізованому для нього. Garmin (та інші) роблять GPS-пристрої, спеціально орієнтовані на бігунів та байкерів, щоб відстежувати час, витрачений на маршрути, та надавати акуратні схеми в Інтернет-інтерфейсі. Сам я не використовую виділений GPS-пристрій, але деякі мої друзі використовують їх для обміну маршрутами у facebook.
Джонатан

1
Ось приклад того, що виробляє пристрій Garmin. Проблема з діаграмами полягає в тому, що вони вже сильно попередньо обробляються, згладжуються тощо. Також немає зручного способу, наприклад, імпортувати дані в R. Але, як виділений пристрій, він чудово виконує свою роботу, я не уявляю, як бігти або їздити на велосипеді без нього.
mpiktas

+1 Зауважте, що від удару червоних вогнів не надто багато перекосів (якщо вони не приурочені): разом вони зазвичай додають лише деякий гауссовий шум до розподілу часу. (Обчислення її відхилення - це ще одна розумова вправа, яку ви можете зробити на наступному пагорбі.) На практиці косоокість походить від неаусівської варіації кількох важливих факторів, які контролюють всю їзду: погода, як ви себе почуваєте, з ким ви ' повторна їзда, а також випадкові аварії / об’їзд / пробки тощо
whuber

Тепер, коли я думаю про це ще трохи, ще одним дуже важливим фактором є час доби. Світлофори діють дуже по-різному в піковий час руху - набагато довша зелень для дороги з більш високим рівнем руху. У неробочий час світла мають тенденцію швидко їхати, дефолт до зеленого для дороги з великим рухом, але швидко змінюється, коли я натискаю кнопку перетину або автомобіль активує датчик.
Джонатан

5

Припустимо, два набори даних є Х і Y. Випадково вибирайте по одній людині з кожного населення, надаючи вамх,у. Запишіть "1", якщох>уі 0 в іншому випадку. Повторіть це багато разів (скажімо, 10000), і середнє значення цих показників дасть вам оцінкуП(Хi>Yj) де i,jє випадково вибраними суб'єктами з двох груп відповідно. У R код буде мати щось на зразок:

#X, Y are the two data sets
ii = rep(0,10000)
for(k in 1:10000)
{
   x1 = sample(X,1)
   y1 = sample(Y,1)
   ii[k] = (x1>y1) 
}

# this is an estimate of P(X>Y)
mean(ii)

Це хороша відповідь, але ви можете спростити її, видаливши forцикл: нехай x1 = sample(X, 10000, replace = TRUE)і y1 = sample(Y, 10000, replace = TRUE)потім обчислює mean(x1 > y1)разом з mean(x1 == y1)- щоб зрозуміти , скільки разів рівні значення.
Ітератор

Спасибі. Я знав, що цикл є непотрібним, але хотів, щоб логіка, що лежить в основі підходу, була до кінця чіткою. Ваш код, безумовно, дасть ті самі результати.
Макрос
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.