Чи має значення те, як ви відбираєте населення?


9

У мене добре змішаний чан, що містить нескінченну кількість мармуру. У чані є нескінченна кількість мармуру, але вони надходять лише у невідомій, але кінцевій кількості різновидів : невідомо, і для , малювання мармуру типу може бути скоріше, ніж малювання мармуру типу .

V={v1,v2,v3,...,vк}
кijvivj

В експерименті машина відбирає посуд за допомогою невідомої процедури. Машина повідомляє про набір описує різновиди мармуру зі свого зразка: Хqк

ХV;|Х|=q

Випробування цього експерименту повторюються ( фіксується через випробування), і ми отримуємо послідовність підмножин , .qV(Х1,Х2,)

Єдине, що ми знаємо, це:

  • випробування незалежні та ідентичні
  • машина повідомляє про найкращі сорти найчастіше зустрічаються у своєму зразкуq

Ми не знаємо точно, як машина відбирає мармур. Він міг підібрати велику кількість мармуру, а потім повідомити про найчастіше. Крім того, він може продовжувати збирати мармур, поки не з'являться різновиди . Є й інші речі, які це теж може зробити.qq

Чи вплине на розподіл наших випробувань процедура відбору проб машини?(Х1,Х2,)


3
+1 Це велике запитання, оскільки він цінує, що випадкових вибірок є більше, ніж якась невиразна форма свавілля чи відсутність знань про процедуру вибірки.
whuber

Правило вибірки, безумовно, матиме значення. В іншому випадку врахуйте цю процедуру: машина під час кожного випробування завжди вибирає один мармур типу 1 (перший сорт). Кожен розіграш буде незалежним і матиме однаковий розподіл (тривіально), і ви отримаєте q = 1, абсолютно не корисний результат.
AlaskaRon

Відповіді:


9

Простий спосіб перевірити, що метод має значення, - це вибрати певні ймовірності для типів мармуру та обчислити шанс кожного підмножини за деякими методами. Це не може довести, що метод не має значення.

Припустимо, є 3 типи та шанси кожного типу є 1/2, 1/4, і 1/4відповідно. Припустимо, ви обираєте2 види мармуру.

Припустимо, вибираючи мармур, ви ігноруєте решту роду. Шанс, який ви отримаєте{v2,v3} є 21/41/3=1/6.

Припустимо, ви відхиляєте пари з повторними типами. Шанс на{v2,v3} є

21/41/421/41/4+21/21/4+21/21/4=1/81/8+1/4+1/4=1/5.

Оскільки вони різні, метод, яким використовується машина, має значення. Відхилення пар з повторними типами має тенденцію до ваги пар із загальними типами менше.

Два згаданих вами методів еквівалентні. Ігнорування решти у своєму роді після вибору мармуру - це те саме, що вибирати, поки у вас немаєq різних типів.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.