Зважаючи на те, що сьогодні день високосний, чи знає хто ймовірність народження у високосний день?
Зважаючи на те, що сьогодні день високосний, чи знає хто ймовірність народження у високосний день?
Відповіді:
Звичайно. Детальніше пояснення див . Тут : http://www.public.iastate.edu/~mlamias/LeapYear.pdf .
Але по суті автор робить висновок: "За 2 тисячоліття існує 485 високосних років. Отже, за 2 тисячоліття загалом днів налічується З цих днів 29 лютого відбувається в 485 з них (високосні роки), тому ймовірність становить "485 / 730 485 = +0,0006639424
Щоб точно передбачити цю ймовірність, використовуючи статистику, було б корисно знати, де відбулися пологи.
На цій сторінці http://chmullig.com/2012/06/births-by-day-of-year/ є графік, що показує підмножину кількості народжених на день (множення 29-го на 4, що є неправильним та небажаним стосовно цього питання, але воно також посилається на вихідні дані та дає приблизну інформацію про те, що ви можете очікувати) у Сполучених Штатах. Я б припустив, що ця крива не відповідає дійсності для інших країн, а особливо для інших континентів. Зокрема, південна півкуля та екваторіальний регіон можуть виявити істотне походження від цих результатів - якщо припустити, що клімат є визначальним фактором.
Крім того, існує проблема "виборчого народження" (торкнулася авторів http://bmjopen.bmj.com/content/3/8/e002920.full ) - у бідніших регіонах земної кулі я б очікував іншого розподіл пологів, просто тому, що (без надзвичайних ситуацій) кесарів розтин або спричинене народження рідше, ніж у розвинених країнах. Це спотворює остаточний розподіл народжуваних.
Користуючись американськими даними, припускаючи, що ~ 29 мільйонів народжених (грубо середня середня сума * 366) та 46 000 народжених 29 лютого, не виправляючи розподіл високосних років у даних, оскільки точний період не вказаний, я припадаю на ймовірність близько ~ 0,000648. Це трохи нижче значення, яке можна було б очікувати за рівного розподілу народжень, і, таким чином, відповідно до загального враження, яке дає графік.
Я залишу тест на значущість цієї грубої оцінки мотивованому читачеві. Але з огляду на те, що 29-й (хоча і не виправлений - 2000 рік вводить у дані нижче середнього зміщення) набирає низьких показників навіть для вже низьких лютневих стандартів, я припускаю порівняно високу впевненість у тому, що нульовий гіптоз рівномірного розподілу може бути відхилений.
Я думаю, що відповідь на це питання може бути лише емпіричним. Будь-яка теоретична відповідь була б хибною без врахування явищ вибору дня народження, сезонності тощо. З цими речами теоретично неможливо розібратися.
Дані про день народження важко знайти в США з міркувань конфіденційності. Там один анонімний набір даних тут . Це із страхових заявок у США. Відмінність від інших звітів, наприклад, популярної, часто цитованої статті NYT , полягає в тому, що в ній перерахована частота народжень за датами, а не просто ранжування днів у році. Слабка сторона - це, звичайно, упередженість вибірки, оскільки це відбувається від страхування: незастраховані люди не включаються тощо
Згідно з даними, у лютому 29 народження було 325 від загальної кількості 481040. За даними Роя Мерфі , вибірка охоплює 1981-1994 рр . Вона включає 3 високосні роки, загалом 14 років. Без жодних коригувань вірогідність становитиме 0,0675% від народження 29 лютого між 1981 та 1994 роками.
Ви можете налаштувати ймовірність шляхом обліку частоти високосних років, що близько до 1/4 ( неточно , хоча ), наприклад , шляхом множення цього числа на , щоб прийти до оцінки 0,079%. Тут умовна ймовірність p народитися 29 лютого у високосний рік пов'язана із спостережуваною частотою F o = 325 частотою f L = 3 високосних років у вибірці: F o = f L / N ⋅ F ⋅ p , де N = 14
Як правило, ймовірність високосних років , отже, довгостроковій перспективі середня ймовірність P L про народження на 29 лютого становить: P L = р L ⋅ р ≈ р L ⋅ N
Вас може зацікавити умовна ймовірність народитися 29 лютого, враховуючи, що ви народились у високосний рік: p = N
Звичайно, ця дискусія була орієнтована на США. Хтозна, які закономірності в інших країнах.
ОНОВЛЕННЯ: Ми автоматично припускали, що ОП є григоріанським календарем. Це стає ще цікавішим, якщо розглянути різні календарі, такі як місячний календар Хіджі , де високосні роки кожні 30 років.
ОНОВЛЕННЯ 2:
Amitabh Chandra, Harvard University
Тепер, наскільки ймовірно, що дуже своєрідні дні в григоріанському календарі: 1 січня, 25 грудня та 29 дебату прийшли випадково як найпопулярніші дні народження? Я кажу, що це малоймовірна випадкова подія. Отже, ще цікавіше бачити, що відбувається в інших календарях, таких як Хіджі.
ОНОВЛЕННЯ 3:
ОНОВЛЕННЯ 4:
d=[0101 1482
...
1231 1352];
%%
tc = sum(d(:,2)); % total obs
idL = 60; % index of Feb 29
% theor frequency, assuming uniform
ny = 1994 - 1981 + 1; % num of years
nL = 3; % # of leap years: 1984, 1988, 1992
nd = 365*ny + nL; % total # of days
fc = tc/nd; % expected freq for calendar date in sample
td = ones(366,1)*fc*ny; % roll the dates into day of year
td(idL) = fc*nL;
fprintf(1,'non-leap day expected freq: %f\n',td(end))
fprintf(1,'leap day expected freq: %f\n',td(idL))
fprintf(1,'non-leap day average freq: %f\n',mean(d([1:idL-1 idL+1:end],2)))
fprintf(1,'non-leap day freq std dev: %f\n',std(d([1:idL-1 idL+1:end],2)))
fprintf(1,'leap day observed freq: %f\n',d(idL,2))
% plots
bar(d(:,2))
hold on
plot(td,'r')
legend('empirical','theoretical')
title('Distribution of birth dates 1981-1994')
set(gca,'XTick',1:30:366)
set(gca,'XTickLabels',[num2str(floor(d(1:30:366,1)/100)) repmat('/',13,1) num2str(rem(d(1:30:366,1),100))])
grid on
% chi^2 test
[h p]=chi2gof(d(:,2),'Expected',td)
ВИХІД:
non-leap day expected freq: 1317.144534
leap day expected freq: 282.245257
non-leap day average freq: 1317.027397
non-leap day freq std dev: 69.960227
leap day observed freq: 325.000000
h =
1
p =
0
Обкладинка моєї улюбленої книги коли-небудь дає дуже важливі докази проти припущення про рівномірне розподіл народжень за датами. Зокрема, що народження в США з 1970 року демонструють кілька тенденцій, накладених на одне інше: тривалий, багатодесятирічний тренд, неперіодичний тренд, тенденції денного тижня, тенденції денного року, святкові тенденції (адже такі процедури, як кесарів розтин) розділ дозволяє ефективно планувати дату народження, і лікарі часто не роблять це у святкові дні). Результатом є те, що ймовірність народження у випадково вибраний день у році неоднакова, а оскільки народжуваність змінюється між роками, не всі роки є однаковою ймовірністю.
Це також свідчить про те, що рішення Аксасала, хоча є дуже сильним претендентом, також є неповним. Невелика кількість високосних днів буде "забруднена" усіма наслідками, які тут грають, тому оцінка Аксасала також фіксує (зовсім випадково) ефект денних тижнів і довгострокових тенденцій разом з 29 лютого. ефект. Які ефекти і які не доцільно включати, у вашому запитанні чітко не визначено.
І цей аналіз стосується лише США, який має демографічні тенденції, які можуть сильно відрізнятися від інших країн чи населення. Наприклад, рівень народжуваності в Японії знижується, наприклад, десятиліттями. Рівень народжуваності в Китаї регулюється державою, що має певні наслідки для гендерного складу нації, а отже, і для народжуваності в наступних поколіннях.
Аналогічно, аналіз Гельмана описує лише кілька останніх десятиліть, і не обов’язково зрозуміло, що це навіть епоха, що цікавить ваше питання.
Для тих, хто захоплюється подібними речами, матеріал у обкладинці детально обговорюється в главі про Гауссові процеси.
29 лютого - дата, яка відбувається щороку, кратна 4 .
Однак роки, кратні 100, але не однієї з 400, не вважаються високосними (наприклад: 1900 - не високосний рік, а 2000 або 1600). Тому нині це одна і та ж закономірність кожні 400 років.
Тож давайте зробимо математику на інтервалі [0; 400 [ :
На період 400 років існує рівно 4 х 25 = 100 років, кратні 4 . Але ми повинні відняти 3 (роки кратні 100, але не 400), і отримаємо 100 - 3 = 97 років.
Тепер нам треба помножити 97 на 366, 97 x 366 = 35502 (кількість днів у високосний рік за період 400 років), залишається (365 x (400-97)) = 110 595 (кількість днів, що не стоять ' t у високосний рік за період 400 років).
Тоді нам просто потрібно додати ці два числа, щоб знати загальну кількість днів за період 400 років: 110 595 + 35502 = 146 097 .
На закінчення наша ймовірність - це число 29 лютого за період 400 років, тому 97, враховуючи, що існує 97 високосних років, поділених на загальну кількість днів нашого інтервалу:
p = 97/146097 ≈ 0,0006639424492
Сподіваюся, що це правильно і зрозуміло.
Я вважаю, що тут переплутано два питання. Перший - "Яка ймовірність того, що будь-який день стане 29 лютого?". Другий - (а насправді запитували) "Яка ймовірність народження у високосний день?"
Я помітив, що більшість відповідей вище розглядають це шляхом обчислення кількості високосних днів за певний період. Існує простіший спосіб отримати відповідь на 100% точно за визначенням:
Ми використовуємо високосні роки для пристосування звичайного (365 дня) календаря до середнього тропічного року (ака середнього сонячного року). Середній тропічний рік "- це час, який Сонце потребує, щоб повернутися до тієї ж позиції в циклі пір року, як видно із Землі" (Вікіпедія). Тропічний рік незначно змінюється, але середній (середній) тропічний рік становить ПРО 365,24667.
Якщо вихідні дні є правильними, то шанс випадково вибраного дня, який є високосним днем, є ((тропічний рік) - (не високосний рік)) / тропічний рік
Підключивши приблизну кількість у нас, це (365.24667-365) /365.24667, або 0.24667 / 365.24667, або 675 на мільйон (0.0675%).
Це, однак, для випадково вибраного дня. Я гадаю, що це істотно перекошене батьками, які не хочуть пояснювати своїм дітям: "Ваш справжній день народження приходить лише раз на 4 роки".