Чи змінить факт того, що мій син Італії буде відвідувати початкову школу, очікувана кількість італійських дітей, які будуть присутні в його класі?


37

Це питання, що випливає з реальної ситуації, на яке я щиро спантеличив її відповідь.

Мій син повинен почати початкову школу в Лондоні. Оскільки ми італійці, мені було цікаво дізнатись, скільки італійських дітей вже відвідують школу. Я запитав це до офіцера прийому під час подання заявки, і вона сказала, що в середньому вони мають 2 італійських дітей у класі (з 30).

Я зараз в той момент, коли я знаю, що мою дитину прийняли, але я не маю іншої інформації про інших дітей. Критерії прийому базуються на відстані, але для цього питання, я вважаю, ми могли б припустити, що він заснований на випадковому розподілі з великої вибірки претендентів.

Скільки італійських дітей очікується в класі мого сина? Чи буде ближче до 2 або 3?


39
Це нагадує мені старий анекдот: "Я завжди ношу бомбу, коли подорожую, бо які шанси двох людей, які мають бомбу в одному літаку?"
Білл Ящірка

2
Це те, що вступник повідомив вам, що в середньому вони мають 2 італійських дітей на клас, і ці дані мені "піддаються". Якби це випливало з реального обчислення, ви очікували б некругле число. Тож можливо, скажімо, справжнє значення 1,51 або 2,49. Крім того, оскільки працівник приймає більше шансів спробувати "порадувати вас" їхньою відповіддю, вони, можливо, закруглиться, а не вниз (якщо вони думають, що ви будете раді, щоб ваша дитина була серед інших італійців), припускаючи, що ймовірність розподіл за значеннями біля 2 було б несиметричним. Відповіді нижче можна адаптувати.
PatrickT

4
@PatrickT "Режим" - дійсний середній тип.
Ян Рінроуз

1
Дякую, хлопці, за відгук. Зараз я також розмістив подібне запитання, але з іншим обрамленням ( stats.stackexchange.com/questions/173969/… ), яке було викликано деякими вашими вводами / відповідями.
user90213

1
@PatrickT Я думаю, що є набагато більше слабко освічених людей, яких бентежить 1,5 ("Як у тебе пів дитини?"), Ніж статистичні дурниці, роздратовані надмірним округленням, мені здаються більш імовірними. (Якщо припустити, що більш точне число насправді не становить 1,9 або 2,1.)
Ден Нілі

Відповіді:


27

Як завжди потрібно розглянути ймовірнісну модель, яка описує, як школа розподіляє дітей між класами. Можливості:

  1. Школа дбає про те, щоб усі класи мали однакову кількість іноземних громадян.
  2. Школа навіть намагається переконатися, що кожна національність представлена ​​приблизно однаково у кожному класі.
  3. Школа взагалі не враховує національність та просто розподіляє випадковим чином або на основі інших критеріїв.

Все це розумно. З огляду на стратегію 2, відповідь на ваше запитання - ні. Коли вони використовують стратегію 3, очікування буде близьким до 3, але трохи менше. Це тому, що ваш син займає "слот", а у вас є один менший шанс для випадкового італійця.

Коли школа використовує стратегію 1, очікування також зростає; скільки залежить від кількості іноземних громадян за один клас.

Не знаючи своєї школи, немає можливості відповісти на це більш досконало. Якщо у вас всього один клас на рік, а критерії прийому такі, як описано, відповідь буде такою ж, як для 3 вище.

Розрахунок на 3 детально:

E(X)=1+E(B(29,2/30))=1+1.9333=2.9333.

X - кількість італійських дітей у класі. 1 походить від відомої дитини, 29 - це решта класу, а 2/30 - це ймовірність того, що невідома дитина буде італійкою з огляду на те, що говорить школа. B - біноміальний розподіл.

Зауважте, що починаючи з не дає належної відповіді, оскільки знаючи, що конкретна дитина є італійською, порушує обмінність, яку передбачає біноміальний розподіл. Порівняйте це з парадоксом хлопчика чи дівчинки , де це має значення, чи знаєте ви, що одна дитина - дівчина, а не знаючи, що старша дитина - дівчинка.E(X|X1)


2
Зробимо біноміальне припущення і нехай . Звісно ж , що вибір між E ( X ~ B ( 30 , 2 / 30 ) | Х 1 ) і Е ( Б ( 29 , 2 / 30 ) )n=30E(XB(30,2/30)|X1)E(B(29,2/30)) може залежати від припущень. Наприклад, якщо я припускаю, що будь-який батько Італії в Лондоні, швидше за все, буде настільки ж здивований, як @ user90213, а потім збирається поставити тут питання, то побачення цього питання не сильно змінює мої очікування. Я лише дізнався, що одна дитина є італійкою і обчислить E(X|X1) . Це те, що ви назвали "обмінністю"? Якщо з іншого боку user90213 є моїм близьким другом, і я знаю його сина, то я прийшов би до вашої відповіді.
амеба повідомляє Відновити Моніку

2
@amoeba Знаючи, що в конкретній школі та в певному класі є дитина користувача user90213, щоб відрізнити його від решти, це не залежить від того, наскільки особливі ваші стосунки з користувачем90213. Але складно в тому, що має значення те, як ви дізнаєтесь інформацію. Наприклад, якщо ви попросите електронною поштою про те, що найстарша італійська дитина в класі зв’язується з вами на ім’я, і ви отримаєте відповідь, ви б пішли на підхід навіть якщо згодом зможете відрізнити дитину. Спробуйте гуглити парадокс дівчини-хлопчика або навіть зробіть для цього більш загальне питання. Про це багато дискусій. E(X|X>1)
Ерік

Правильно, дякую Еріку. Що я мав на увазі в попередньому коментарі, щось подібне до прикладу вашої електронної пошти. Якщо я припускаю, що всі італійські батьки в класі опублікують питання тут, то побачити це питання точно так, як зв’язатися з найстаршою італійською дитиною. Здається, ми, як правило, згідні, +1. Вікі-посилання справді цікаве.
амеба каже, що повернеться до Моніки

(+1) Але спантеличено, чому ви говорите "Якщо у вас всього один клас на рік [...]".
Scortchi

@Scortchi If the school has just one class per year, then it can use the two strategies denominated 1 and 2, since every child that is accepted at the school this year ends up in the same class.
Erik

13

Another way to look a this is at the level of individual children. Assuming that 30 children drawn randomly from a population (which you've indicated we can), we can work backward to the rough probability of an Italian child being drawn from this population: 2/30 = 1/15.

Given that we know that one of the 30 is Italian, we only have to compute the probability for the remaining children:

291/15=29/15=1.933

So, knowing that your child is Italian changes the expected number of Italian children in the class to approximately 2.933, which is much closer to 3 than 2.


5

Here's my thoughts on how to approach this:

Let the random variable Sn denote the number of Italian children in a class that is currently of size n. Let X be the indicator for a new child's being Italian. Suppose that we add child X to this class. Then the expected number of Italian children in this augmented class of size n+1 is E(Sn+X)=E(Sn)+E(X)=E(Sn)+P(X=1). Note that independence doesn't matter here since we're only using the linearity of expectation. If child X is known to be Italian then X=1 with probability 1 so we have increased the expected value by 1.


1
So there'll be n+1 children in this class after the addition of the Italian child?
Scortchi - Reinstate Monica

Yes. Is there something that I'm missing related to that?
jld

1
Depends how you read the question. Suppose classes are of exactly 30 children.
Scortchi - Reinstate Monica

1
Maybe I misunderstood the question. I thought it was asking about how the addition of a known Italian child changes the expectation.
jld

1
That's a very good point about class sizes possibly being capped
jld

1

Based on the Admission Office info, the number of Italian children follows binomial Binom(30,2/30), assuming independence. Now you know in your class, there is at least one Italian child, so the expectation becomes E(X|X1). For XBinom(30,2/30), this evaluates to 2.28 (if I get my calculation right).


Edit. Evaluation of the expectation:

E[X|X1]=i=030iP(X=i|X1)=030iP(X=i,X1)P(X1)=130iP(i)1P(0)

(note the change in summation lower bound at last step)


1
Can you elaborate on the conditional expectation?
Antoni Parellada

3
Your answer is incorrect. The proper way to calculate this would be as 1 (the known child) + E(B(29, 2/30)) which turns out as 2.9333. And the assumption of binomial distribution is questionable.
Erik

One more thing I would like to point out: a) your calculation of the conditional expectation is wrong. But b) more importantly, starting with your conditional expectation is incorrect. Knowing that a specific child is Italians breaks the exchangibility assumed by the binormal distribution. It's very similar to the boy-girl paradox (en.wikipedia.org/wiki/Boy_or_Girl_paradox) where it makes a difference whether you know that the older child is a girl or know that one of the two children is a girl.
Erik

Scratch comment a) from above. But b) is more serious anyway ;)
Erik

I agree. For OP, the distribution is no longer binomial(30, 2/30), but indeed 1+binomial(29, 2/30)
jf328

-3

No. Your knowledge of the impending events changes nothing about the school's typical experience.


2
-1. This is incorrect, as explained in detail in other answers and comments here.
amoeba says Reinstate Monica

forgive my lack of advanced maths, but what makes this gent's child to be NOT one of the 'typically 2' children?.. such that we end up closer to 3.
Mart


Mart: Imagine I toss a coin ten times and count the heads; nothing odd about the coin or the way I toss it. I repeat that experiment many times, and on average I see almost exactly 5 heads in ten tosses; which results you see (1000 tosses in all, of which 50.3% were heads, well within the expected variation for a fair coin-tossing procedure; we decide agree that the process seems at least practically fair). Now I do the experiment one additional time with you, and you see that the first 4 tosses are all heads. What is the expected number of heads in the complete set of ten tosses? 5? more?
Glen_b -Reinstate Monica

Note that by your earlier argument, the first four "could have been four of the expected five". But then you'd be saying that there's less than a 50% chance on the next six tosses (in fact you're saying there's only a 1/6 chance on average). How would the coin know to come up heads less often?
Glen_b -Reinstate Monica
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.