У мене є три допоміжні посилання / аргументи, які підтримують дату ~ 1600-1650 для формально розробленої статистики та набагато раніше для просто використання ймовірностей.
Якщо ви приймаєте тестування гіпотез за основу, прогнозуючи ймовірність, то Інтернет-словник етимології пропонує таке:
" гіпотеза (n.)
1590-х років, "певна заява;" 1650-ті роки, "пропозиція, прийнята і сприйнята як належне, використовується як передумова", з середньофранцузької гіпотези та безпосередньо з пізньо-латинської гіпотези, з грецької гіпотези "підстава, основи, фундамент", отже, розширене використання "аргумент, припущення, "буквально" розміщення під, "від гіпо-" під "(див. гіпо-) + теза" розміщення, пропозиція "(від скороченої форми кореня PIE * dhe-" встановити, поставити "). Термін у логіці; вужчий науковий сенс - з 1640-х років. ".
Вікісховище :
"Записано з 1596 року, з середньофранцузької гіпотези, від пізньо-латинської гіпотези, від давньогрецької ὑπόθεσις (hupóthesis," підстава, основа аргументації, припущення "), буквально" розміщення під ", саме від ὑποτίθημι (hupotíthēmi," я поставив раніше, запропонуйте »), від ὑπό (hupó,« внизу ») + τίθημι (títhēmi,« ставлю, місце »).
Гіпотеза іменника (множинні гіпотези)
(науки) Використовується вільно, орієнтовна здогадка, що пояснює спостереження, явище чи наукову проблему, які можуть бути перевірені шляхом подальшого спостереження, дослідження та / або експерименту. Як науковий термін мистецтва див. Додану цитату. Порівняйте з теорією та цитатами, поданими там. цитати ▲
2005 р., Рональд Х. Пайн, http://www.csicop.org/specialarticles/show/intelligent_design_or_no_model_creationism , 15 жовтня 2005 року:
Занадто багато з нас викладали в школі, що вчений, намагаючись щось зрозуміти, спершу придумає «гіпотезу» (здогадку чи здогад - не обов’язково навіть здогадку про «освіту»). ... [Але т] слово "гіпотеза" повинно використовуватися в науці виключно для обґрунтованого, розумного, на основі знань пояснення того, чому якесь явище існує чи відбувається. Гіпотеза може бути ще неперевіреною; може бути вже випробуваний; можливо, були підроблені; можливо, ще не підроблені, хоча перевірені; або, можливо, безліч разів тестували безліч способів, не підробляючи їх; і може стати загальновизнаним науковим співтовариством. Розуміння слова "гіпотеза", яке використовується в науці, вимагає зрозуміти принципи, що лежать в основі Оккама " s Думка Бритви та Карла Поппера щодо "фальсифікованості" - включаючи думку про те, що будь-яка поважна наукова гіпотеза повинна, в принципі, бути "здатною" бути доведеною помилковою (якщо вона насправді має бути просто неправильною), але ніколи не можна довести, що це правда. Одним з аспектів правильного розуміння слова "гіпотеза", що використовується в науці, є те, що лише малий відсоток гіпотез може колись стати теорією ".
Про вірогідність та статистику Вікіпедія пропонує:
" Збір даних
Відбір проб
Коли не можуть бути зібрані повні дані перепису, статистики збирають вибіркові дані, розробляючи конкретні проекти експериментів та зразки опитування. Сама статистика також пропонує інструменти для прогнозування та прогнозування за допомогою статистичних моделей. Ідея робити висновки на основі вибіркових даних почалася приблизно в середині 1600-х рр. У зв'язку з оцінкою кількості населення та розробкою попередників страхування життя . (Довідка: Wolfram, Stephen (2002). Новий вид науки. Wolfram Media, Inc. p. 1082. ISBN 1-57955-008-8).
Щоб використовувати зразок як орієнтир для цілого населення, важливо, щоб він справді представляв загальну сукупність. Представницька вибірка запевняє, що умовиводи та висновки можуть безпечно поширюватися від вибірки на цілу сукупність. Основна проблема полягає у визначенні того, наскільки обраний зразок насправді репрезентативний. Статистика пропонує методи для оцінки та виправлення будь-яких упереджень у межах вибірки та процедур збору даних. Існують також методи експериментального проектування експериментів, які можуть зменшити ці проблеми на початку дослідження, посилюючи його здатність розпізнавати істини про населення.
Теорія вибірки є частиною математичної дисципліни теорії ймовірностей. Імовірність використовується в математичній статистиці для вивчення розподілу вибірки вибіркової статистики та, загалом, властивостей статистичних процедур. Використання будь-якого статистичного методу справедливо, коли розглянута система або сукупність задовольняє припущенням методу. Різниця в точці зору між класичною теорією ймовірностей та теорією вибірки полягає приблизно в тому, що теорія ймовірностей починається з заданих параметрів загальної сукупності для виведення ймовірностей, що стосуються вибірок. Однак статистичні умовиводи рухаються у зворотному напрямку - індуктивно виводячи із зразків параметри більшої чи загальної сукупності .
З "Wolfram, Stephen (2002). Новий вид науки. Wolfram Media, Inc., стор. 1082.":
" Статистичний аналіз
• Історія. Деякі обчислення шансів на випадкові ігри були зроблені ще в античності. Починаючи з приблизно 1200-х років все більш детальні результати, засновані на комбінаторному перерахуванні ймовірностей, були отримані містиками та математиками, систематично правильні методи були розроблені в середині 1600-х та на початку 1700-х років. Ідея робити висновки з вибіркових даних виникла в середині 1600-х років у зв'язку з оцінкою кількості населення та розробкою попередників страхування життя. Метод усереднення для виправлення випадкових помилок спостереження почав застосовуватися, насамперед, в астрономії, в середині 1700-х років, тоді як розміщення найменших квадратів та поняття розподілу ймовірностей стали встановлені близько 1800 р. Імовірнісні моделі, засновані на випадкові коливання між особами почали застосовуватися в біології в середині 1800-х років, і багато класичних методів, які зараз використовуються для статистичного аналізу, були розроблені в кінці 1800-х і на початку 1900-х років у контексті сільськогосподарських досліджень. У фізиці принципово ймовірнісні моделі були центральними для впровадження статистичної механіки наприкінці 1800-х років та квантової механіки на початку 1900-х років.
Інші джерела:
"Цей звіт, в основному нематематичний термін, визначає значення p, узагальнює історичні джерела підходу p значення до тестування гіпотез, описує різні застосування p≤0,05 у контексті клінічних досліджень та обговорює появу p≤ 5 × 10−8 та інші значення у вигляді порогових значень для геномних статистичних аналізів ".
У розділі "Історичне походження" зазначено:
"Опубліковані роботи з використання понять вірогідності для порівняння даних з науковою гіпотезою можна простежити століттями. Наприклад, на початку 1700-х років лікар Джон Арбутно проаналізував дані про хрещення в Лондоні протягом 1629–1710 років і зауважив, що кількість чоловічих народжень перевищувала жіночу народжуваність у кожному досліджуваному році. Він повідомив що якщо припустити, що баланс чоловічих та жіночих народжень ґрунтується на випадковості, то ймовірність спостерігати надлишок чоловіків понад 82 поспіль років - 0,582 = 2 × 10–25, або менше, ніж один у септиліона (тобто один на трильйон трильйонів) шансів.[1]
[1]. Арбутнотт Дж. Аргумент божественного провидіння, взятий з постійної регулярності спостерігав у народженнях обох статей. Філ Транс 1710; 27: 186–90. doi: 10.1098 / rstl.1710.0011 опубліковано 1 січня 1710 року
"Р-значення давно пов'язані з медициною та статистикою. Джон Арбутнот та Даніель Бернуллі були обома лікарями, крім того, що вони були математиками, і їх аналіз статевих співвідношень при народженні (Арбутнот) та схильність до орбіт планет (Бернуллі) забезпечують ці два" найвідоміші ранні приклади тестів на значимість . Якщо їх повсюдність у медичних журналах є стандартом, за яким їх судять, значення P також є надзвичайно популярними в медичній професії. З іншого боку, вони підлягають регулярні критики з боку статистиків і лише неохоче захищали Наприклад, десяток років тому видатні біостатисти, покійний Мартін Гарднер та Дуг Альтман1–45–789разом з іншими колегами організували успішну кампанію, щоб переконати Британський медичний журнал робити менший акцент на P-значеннях і більше на довірчих інтервалах. Журнал "Епідеміологія" їх взагалі заборонив. Останнім часом напади навіть з’явилися в популярній пресі . Значення P, таким чином, здається, є відповідною темою для Журналу епідеміології та біостатистики. Цей нарис представляє особистий погляд на те, що, якщо що, можна сказати, щоб захистити їх.10,11
Я пропоную лише обмежений захист P-значень. ... ".
Список літератури
1 Hald A. A history of probability and statistics and their appli- cations before 1750. New York: Wiley, 1990.
2 Shoesmith E, Arbuthnot, J. In: Johnson, NL, Kotz, S, editors. Leading personalities in statistical sciences. New York: Wiley, 1997:7–10.
3 Bernoulli, D. Sur le probleme propose pour la seconde fois par l’Acadamie Royale des Sciences de Paris. In: Speiser D,
editor. Die Werke von Daniel Bernoulli, Band 3, Basle:
Birkhauser Verlag, 1987:303–26.
4 Arbuthnot J. An argument for divine providence taken from
the constant regularity observ’d in the births of both sexes. Phil Trans R Soc 1710;27:186–90.
5 Freeman P. The role of P-values in analysing trial results. Statist Med 1993;12:1443 –52.
6 Anscombe FJ. The summarizing of clinical experiments by
significance levels. Statist Med 1990;9:703 –8.
7 Royall R. The effect of sample size on the meaning of signifi- cance tests. Am Stat 1986;40:313 –5.
8 Senn SJ. Discussion of Freeman’s paper. Statist Med
1993;12:1453 –8.
9 Gardner M, Altman D. Statistics with confidence. Br Med J
1989.
10 Matthews R. The great health hoax. Sunday Telegraph 13
September, 1998.
11 Matthews R. Flukes and flaws. Prospect 20–24, November 1998.
@Martijn Weterings : "Чи було Пірсоном у 1900 році відродження чи раніше ця ( частістська ) концепція з'явилася раніше? Як Джейкоб Бернуллі думав про свою" золоту теорему "у частолюбському розумінні чи в байєсівському розумінні (про що говорить і чи є Ars Conjectandi? є більше джерел)?
Американська статистична асоціація має веб-сторінку з історії статистики, на якій поряд з цією інформацією є плакат (відтворений частиною нижче) під назвою "Хронологія статистики".
AD 2: Докази перепису, завершеного під час династії Хань, збереглися.
1500-ті: Джироламо Кардано обчислює ймовірність різних рулонів кісток.
1600-ті роки: Едмунд Галлі пов'язує рівень смертності з віком і розробляє таблиці смертності.
1700-ті роки: Томас Джефферсон керує першим переписом США.
1839: Створена Американська статистична асоціація.
1894: Термін «стандартне відхилення» введений Карлом Пірсоном.
1935: Р. А. Фішер публікує «Дизайн експериментів».
У розділі "Історія" веб-сторінки Вікіпедії " Закон великих чисел " пояснюється:
"Італійський математик Героламо Кардано (1501–1576)заявив без доказів того, що точність емпіричної статистики, як правило, покращується із кількістю випробувань. Потім це було оформлено як закон великої кількості. Спеціальна форма LLN (для бінарної випадкової величини) вперше була доведена Якобом Бернуллі. Йому знадобилося понад 20 років, щоб розробити достатньо суворий математичний доказ, який був опублікований у його творі Ars Conjectandi («Мистецтво кон’юнктури») у 1713 році. Він назвав це своєю «Золотою теоремою», але він загалом став відомим як «Теорема Бернуллі». Це не слід плутати з принципом Бернуллі, названим на честь племінника Якова Бернуллі Даніела Бернуллі. У 1837 р. С.Д. Пуассон далі описав його під назвою "la loi des grands nombres" ("Закон великої кількості"). Після цього було відомо під обома назвами, але "
Після того, як Бернуллі та Пуассон опублікували свої зусилля, інші математики також внесли свій внесок у вдосконалення закону, включаючи Чебишева, Маркова, Бореля, Кантеллі, Колмогорова та Хінчіна ".
Питання: "Чи був Пірсон першою людиною, яка задумала p-значення?"
Ні, напевно, ні.
У " Звіті ASA про p-значення: контекст, процес та мета " (09 червня 2016 р.) Від Wasserstein та Lazar, doi: 10.1080 / 00031305.2016.1154108 є офіційна заява про визначення p-значення (яке немає сумніви, не узгоджені всіма дисциплінами, що використовують або відкидають значення p), яке звучить:
" . Що таке р-значення?
Неофіційно р-значення - це ймовірність за вказаною статистичною моделлю, що статистичний підсумок даних (наприклад, середня різниця вибірки між двома порівняними групами) буде рівним або більш крайнім, ніж його спостережуване значення.
3. Принципи
...
6. Сама по собі p-величина не дає хорошої міри доказів щодо моделі чи гіпотези.
Дослідники повинні визнати, що значення p без контексту чи інших доказів надає обмежену інформацію. Наприклад, значення р поблизу 0,05, взяте само собою, дає лише слабкі докази проти нульової гіпотези. Так само відносно велике р-значення не означає доказів на користь нульової гіпотези; багато інших гіпотез можуть однаково або більше відповідати спостережуваним даним. З цих причин аналіз даних не повинен закінчуватися обчисленням p-значення, коли інші підходи є доцільними та здійсненими. "
Відхилення нульової гіпотези, ймовірно, відбулося задовго до Пірсона.
Сторінка Вікіпедії на ранніх прикладах перевірки нульової гіпотези говорить:
Ранній вибір нульової гіпотези
Пол Міл стверджував, що гносеологічне значення вибору нульової гіпотези значною мірою не визнано. Коли нульова гіпотеза спрогнозована теорією, точнішим експериментом буде більш суворий тест основної теорії. Коли нульова гіпотеза за замовчуванням «не має різниці» або «немає ефекту», точнішим експериментом є менш суворий тест теорії, який мотивував виконання експерименту. Отже, вивчення походження останньої практики може бути корисним:
1778 рік: П'єр Лаплас порівнює народжуваність хлопчиків і дівчат у багатьох європейських містах. Він констатує: "природно зробити висновок, що ці можливості майже в одному співвідношенні". Таким чином, нікчемна гіпотеза Лапласа про те, що народжуваність хлопчиків і дівчаток повинна бути однаковою, отримуючи "загальноприйняту мудрість".
1900 рік: Карл Пірсон розробляє тест на квадрат чі, щоб визначити, "чи дана форма кривої частоти ефективно описує зразки, взяті з даної сукупності". Таким чином, нульовою гіпотезою є те, що популяція описується деяким розподілом, передбаченим теорією. Він використовує в якості прикладу цифри п’ять і шістдесят у даному викиданні кісток Weldon.
1904: Карл Пірсон розробляє концепцію "надзвичайних ситуацій", щоб визначити, чи результати не залежать від конкретного категоріального чинника. Тут нульовою гіпотезою є за замовчуванням, що дві речі не пов'язані між собою (наприклад, утворення рубців та смертність від віспи). Нульова гіпотеза в цьому випадку вже не передбачається теорією чи звичайною мудрістю, а натомість є принципом байдужості, який спонукає Фішера та інших до відмови від використання "обернених ймовірностей".
Незважаючи на те, що будь-яку людину зараховують за відмову від нульової гіпотези, я не вважаю за доцільне позначати їх " виявленням скептицизму на основі слабкої математичної позиції".