Чи є результат іспиту двочленним?


31

Ось просте статистичне запитання, яке мені дали. Я не дуже впевнений, що це розумію.

X = кількість набраних балів в іспиті (багаторазовий вибір і правильна відповідь - це один бал). Чи розподілений X біноміал?

Відповідь професора:

Так, тому що є лише правильні чи неправильні відповіді.

Моя відповідь:

Ні, тому що кожне питання має різну "ймовірність успіху" стор. Як я зрозумів, біноміальний розподіл - це лише серія експериментів Бернуллі, кожен з яких має простий результат (успіх чи невдача) із заданою ймовірністю успіху p (і всі вони "однакові" щодо p). Наприклад, перевернувши (справедливу) монету 100 разів, це 100 експериментів Бернуллі, і всі мають p = 0,5. Але тут питання мають різні види p так?


14
+1 Ще більше: якщо справді це не дивний іспит, відповіді на запитання будуть сильно співвіднесені. Якщо X - загальний бал для індивіда, це виключатиме розподіл біномів. Чи можливо, питання працює в припущенні "нульова гіпотеза", в якому всі досліджувані незалежно і випадково вгадують усі відповіді?
whuber

2
Як це не парадоксально, я хоч би хотів лобіювати часткову позицію в цьому, але, здається, "відповідь" відображає неприхильність до його присудження :) (Я думаю, ти тут прав).
АдамО

1
Так, дякую: D, я думаю, що це більше біноміальне розповсюдження Пуассона (якщо що завгодно)
Павло


2
Я погоджуюся з усіма, що питання було поганим, але тут є обрамлення питання. Якщо це елементарний курс і це формат із короткими відповідями (щоб у вас був шанс пояснити свої міркування), я б сказав, що найкраща відповідь - це, мабуть, «так (при умові незалежності та однакової складності для кожного питання)»; це би означало професору, що (1) ви розумієте обмеження питання і (2) ви не намагаєтесь бути розумним.
Бен Болкер

Відповіді:


25

Xni

Pr{Xni=1}=eβnδi1+eβnδi

де можна вважати здатністю - особи, а як -й складність питання. Таким чином, модель дає змогу зрозуміти, що різні особи відрізняються здібностями, а питання різняться за складністю, і це найпростіша з моделей IRT.βnnδii

Ваша відповідь професора припускає, що всі питання мають однакову ймовірність "успіху" і є незалежними, оскільки двочлен - це розподіл суми ід випробувань Бернуллі. Він ігнорує два типи залежностей, описані вище.n

Як було помічено в коментарях, якщо ви подивилися на розподіл відповідей конкретної людини (тому вам не потрібно дбати про мінливість між особами) або відповіді різних людей на один і той же пункт (тож немає елементна мінливість), тоді розподіл був би пуассоно-біноміальним, тобто розподілом суми неіідних випробувань Бернуллі. Розподіл можна наблизити до двочленного чи Пуассона, але це все. Інакше ви робите припущення про ід.n

Навіть за умови «нульового» припущення про здогадки, це передбачає, що немає згаданих зразків, тому люди не відрізняються тим, як здогадуються, а предмети не відрізняються тим, як їх здогадуються - тому здогадки є чисто випадковими.


Що має сенс! Хоча я гадаю, ви могли б обчислити ймовірність успіху питання, але "здатність людей" звучить складно :) Ще одна ідея, яку я мав, - це моделювати це як суму розподілів Бернуллі? Наприклад, скажімо, що існує 2 питання, тому 2 ймовірності успіху p1 і p2. Аналогічно дві змінні X1 та X2 підрахунку (так 2 експерименти з Бернуллі). Тоді, наприклад, ймовірність отримати один загальний бал 1 дорівнює P (X1 = 1) * P (X2 = 0) + P (X1 = 0) * P (X2 = 1) = p1 (1-p2) + (p1 -1) р2. Це звучить розумно?
Павло

2
@Paul сума двох Бернуллі з різними p - Пуассоно-двочленна
Тім

4
"Нульове" припущення - це в основному сферично-коров'яча річ, ви завжди можете посперечатися, наскільки точно сферична корова.
Hong Ooi

5

Відповідь на цю проблему залежить від постановки питання та коли буде отримана інформація. В цілому я схильний погоджуватися з професором, але вважаю, що пояснення його / її відповіді є поганим, і питання професора повинно містити більше інформації.

Якщо ви розглядаєте нескінченну кількість потенційних запитань до іспиту, і ви малюєте їх навмання для питання 1, намалюйте їх навмання для питання 2 тощо. Потім перейдете до іспиту:

  1. Кожне питання має два результати (правильний чи неправильний)
  2. Існує фіксована кількість випробувань (питань)
  3. Кожне випробування може бути визнане незалежним (питання під питанням два, ваша ймовірність правильно визначити його така ж, як і під час першого питання)p

У цій рамках виконуються припущення біноміального експерименту.

На жаль, непропоновані статистичні проблеми дуже часто зустрічаються на практиці, а не лише на іспитах. Я б не вагався, щоб захистити ваше обгрунтування перед вашим професором.


Дже, я думаю, що це теж правильно. Питання просто "погано", оскільки ви можете аргументувати обидва способи, оскільки так мало інформації. Але я просто був незадоволений даною відповіддю мого професора.
Павло

4
@Paul, насправді досить складно написати хороші статистичні запитання. Я знаю, що я його багато разів промахував.
gung - Відновіть Моніку

1
If you consider an infinite number of potential exam questions, and you draw one at random for question 1, draw one at random for question 2, etc.- Я думаю, ви повинні чітко припустити, що екзаменаційні питання складаються незалежно від пула потенційних питань. Для них було б більш реальним співвіднести: якщо питання 1 легкий, ймовірно, вам здадуть легкий іспит і це питання 2 буде легким.
Адріан

0

Якщо є п питань, і я можу відповісти на будь-яке запитання правильно з вірогідністю р, і є достатньо часу, щоб спробувати відповісти на всі запитання, і я зробив 100 з цих тестів, то мої бали будуть нормально розподілені із середнім значенням np.

Але я не повторюю тест 100 разів, це 100 різних кандидатів, які роблять один тест, кожен зі своєю ймовірністю p. Розподіл цих p буде головним фактором. У вас може бути тест, де p = 0,9, якщо ви добре вивчили тему, p = 0,1, якщо ви цього не зробили, з дуже малою кількістю людей від 0,1 до 0,9. Розподіл точок матиме дуже сильні максимуми при 0,1 n та 0,9 n і ніде не буде близьким до нормального розподілу.

З іншого боку, є тести, де кожен може відповісти на будь-яке запитання, але забирає різну кількість часу, тому одні відповідатимуть на всі п ять питань, а інші - менше, тому що у них не вистачає часу. Якщо можна припустити, що швидкість кандидатів розподіляється нормально, то бали будуть близькими до нормальних розподілених.

Але багато тестів містять дуже важкі та дуже легкі запитання, навмисно, щоб ми могли розрізняти найкращих кандидатів (які відповідатимуть на всі запитання до певної міри складності) та найгірших кандидатів (які зможуть відповісти лише дуже прості запитання). Це досить сильно змінить розподіл балів.


2
Нормальний розподіл, який ви описуєте тут, - це нормальне наближення двочлена. Очевидно, що сума нулів і одиниць не була б безперервною і
Tim

2
@Tim Незважаючи на непотрібну залежність від нормальних розподілів та таємницю проходження 100 тестів, ця відповідь заслуговує на спробу продемонструвати, як конкретний випадок може призвести до очевидно небіноміального розподілу. Як такий, це може бути цінним внеском у відповіді, якщо ці технічні питання будуть вирішені.
whuber

0

За визначенням, біноміальний розподіл - це сукупність незалежних і однаково розподілених випробувань Бернуллі. У випадку іспиту з кращим вибором кожне з питань було б одним із випробувань Бернуллі.n n

Проблема тут виникає, тому що ми не можемо обгрунтовано припустити, що питань:n

  • Є однаково розподілені . Як ви сказали, ймовірність того, що студент знає, що відповідь на питання майже точно не буде такою самою, як ймовірність, яку вони знають у відповіді на питання тощо.12
  • Є незалежним . Багато іспитів ставлять запитання, які ґрунтуються на відповідях на попередні питання. Хто точно скаже, що цього не сталося на іспиті в цьому питанні? Є й інші фактори, які можуть дати відповіді на екзаменаційні питання, незалежні одне від одного, але я вважаю, що це найбільш інтуїтивно очевидно.

Я бачив запитання в класах статистики, які моделюють екзаменаційні запитання як біноміали, але вони оформлені десь так:

Який розподіл ймовірностей буде моделювати кількість запитань, відповідей правильно на іспиті з декількома варіантами, коли кожне питання має чотири варіанти, а студент, який здає іспит, здогадується про кожну відповідь навмання?

У цьому випадку, звичайно, це було б представлене як біноміальне розподіл з .p=14


З вашими фактами нічого не має, але логіка неправильна: недостатньо продемонструвати, що деякі припущення можуть не дотримуватися, оскільки (логічно) розподіл все-таки може бути двозначним у будь-якому випадку. Вам також потрібно продемонструвати, що ці припущення можуть провалюватися способами, які призводять до того, що розподіл балів точно не є двобічним.
whuber
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.