Лаплас був першим, хто визнав необхідність підрахунку даних, придумавши наближення:
G ( x )=∫∞xe−t2dt=1x−12x3+1⋅34x5- 1⋅3⋅58x7+ 1 ⋅ 3⋅5⋅716x9+ ⋯(1)
Перший сучасний стіл нормального розподілу був побудований пізніше французьким астроном Крістіан Kramp в Аналізувати де заломлення ЮТ Terrestres астрономічних даних (Par ль citoyen Крамп, Professeur де Chymie і де Статура expérimentale à l'Ecole Centrale їй Département - де - ла Roer, 1799) . З таблиць, пов’язаних із звичайним розповсюдженням: коротка історія Автор (и): Герберт А. Девід Джерело: Американський статистик, Vol. 59, № 4 (листопад 2005 р.), Стор 309-311 :
Крамп амбіційно дав восьмидесятичні ( D) таблиць розміром до D до D до і D до разом з різницями, необхідними для інтерполяції. Записуючи перші шість похідних він просто використовує розширення ряду Тейлора про з до терміна вЦе дозволяє йому переходити крок за кроком від до після множення на8x=1.24, 91.50, 101.99,113.00G(x),G(x+h)G(x),h=.01,h3.x=0х = год , 2 год , 3 год , … ,годе- х21 - h x + 13( 2 х2- 1 ) год2- 16( 2 х3- 3 х ) год3.
Таким чином, при цей продукт зменшується до
так що приx = 0.01 ( 1 - 13× .0001 ) = .00999967 ,
G ( .01 ) = .88622692 - .00999967 = .87622725 .
⋮
Але ... наскільки точним він міг бути? Добре, візьмемо як приклад:2,97
Дивовижний!
Перейдемо до сучасного (нормалізованого) виразу Гауссова pdf:
ПРВ є:N( 0 , 1 )
fХ( X= х ) = 12 π--√е- х22= 12 π--√е- ( х2√)2= 12 π--√е- ( z)2
де . Отже, .z= х2√х = z× 2-√
Тож переходимо до R і шукаємо ... Добре, не так швидко. Спершу ми маємо пам’ятати, що коли є постійне множення експонента в експоненціальній функції , інтеграл буде поділений на цей показник: . Оскільки ми прагнемо до тиражування результатів у старих таблицях, ми фактично множимо значення на , яке повинно з’явитися в знаменнику.ПZ( Z> z= 2,97 )еа х1 / ах2-√
Крім того, Крістіан Крамп не нормалізувався, тому нам доведеться відповідно виправити результати, отримані R, помноживши на . Остаточне виправлення виглядатиме так:2 π--√
2π−−√2–√P(X>x)=π−−√P(X>x)
У випадку вище, і . Тепер перейдемо до R:z=2.97x=z×2–√=4.200214
(R = sqrt(pi) * pnorm(x, lower.tail = F))
[1] 0.00002363235e-05
Фантастичний!
Давайте підемо вгору таблиці для розваги, скажімо, ...0.06
z = 0.06
(x = z * sqrt(2))
(R = sqrt(pi) * pnorm(x, lower.tail = F))
[1] 0.8262988
Що говорить Крамп? .0.82629882
Дуже близько...
Річ у тому, як саме, точно? Після всіх отриманих голосів я не зміг залишити фактичну відповідь. Проблема полягала в тому, що всі програми оптичного розпізнавання символів (OCR), які я спробував, були неймовірно вимкнені - не дивно, якщо ви подивилися на оригінал. Отже, я навчився цінувати Крістіана Крампа за завзятість його роботи, коли я особисто набирав кожну цифру в першій колонці його « Прем’єр таблиці» .
Після вагомої допомоги від @Glen_b, тепер це може бути дуже точним, і він готовий скопіювати та вставити на консоль R у цьому посиланні на GitHub .
Ось аналіз точності його розрахунків. Зберись...
- Абсолютна кумулятивна різниця між значеннями [R] та наближенням Крампа:
0.000001200764 - за розрахунок йому вдалося накопичити помилку приблизно в мільйон!3011
- Середня абсолютна помилка (MAE) або
mean(abs(difference))
зdifference = R - kramp
:
0.000000003989249 - йому вдалося в середньому допустити жахливо смішні мільярдні помилки!3
Щодо запису, в якому його обчислення були найбільш розбіжними порівняно з [R], перше значення десяткового знаку знаходилось на восьмій позиції (сто мільйонів). У середньому (середній) його перша "помилка" була в десятій десятковій цифрі (десятій мільярді!). І хоча він ні в якому разі не повністю погодився з [R], найближчий запис не розходиться до тринадцяти цифрових записів.
- Середня відносна різниця або
mean(abs(R - kramp)) / mean(R)
(те саме, що all.equal(R[,2], kramp[,2], tolerance = 0)
):
0.00000002380406
- Коренева середньоквадратична помилка (RMSE) або відхилення (надає більше ваги великим помилкам), обчислена як
sqrt(mean(difference^2))
:
0.000000007283493
Якщо ви знайшли зображення або портрет Чістіана Крампа, відредагуйте цю публікацію та розмістіть її тут.