Статистика - це не математика?


20

Статистична математика чи ні?

Зважаючи на те, що це всі цифри, здебільшого викладають математичні кафедри, і ви отримуєте математичні заліки за це, мені цікаво, чи просто люди це мають на увазі, як вони говорять про це, напівжартома, як, мовляв, це незначна частина математики чи просто застосовувана математика.

Цікаво, чи можна вважати математику чимось на зразок статистики, де неможливо побудувати все на основних аксіомах. Наприклад, значення -значення - це поняття, яке виникло для осмислення даних, але це не є логічним наслідком більш основних принципів.p


10
Обов’язкове посилання на XKCD: xkcd.com/435 . У будь-якому випадку, це насправді має значення?
nico

2
(i) Як ми могли б оцінити такі речі? Це не так, як це було предметом опитування! (ii) Обчислення майже завжди включають цифри, але те, що робить його статистикою , на мій погляд, зазвичай не в обчисленнях . (iii) Коли я займався бакалавриатською статистикою, я не був на кафедрі математики. Місце, де я робив докторську ступінь - за участю двох досить відомих статистиків - теж не було кафедри математики. (iv) Я не думаю, що це жарт. Це стосується дуже важливої ​​ідеї - те, що робить статистику "статистикою", - це більше про спосіб міркування про певні типи проблем.
Glen_b -Встановити Моніку

6
Я відчуваю, що зобов’язаний дати коротку відповідь, оскільки я колишній чистий математик (доктор наук та 3,5 роки постдоктора в якійсь алгебрі), а зараз прикладний статистик ... ну, яку статистику ви дізнаєтесь для прикладної статистики, наприклад " коли я використовую -test "або що ні, для математика виглядає як книга рецептів, а не як математика. Але, наприклад, асимптотична статистика Ван дер Ваарта, безумовно, є математичною книжкою ... Проміжних рівнів багато - деякі з них недостатньо заселені, я думаю, що не вистачає книг, що пояснюють статистику з великою кількістю реальних прикладів і всього математичного деталі. t
Елвіс

5
Я не знаю, що робити із твердженням, " -значення, яке є концепцією, яка виникла для розуміння даних, але це не логічний наслідок більш основних принципів", я навіть не впевнений, чи це насправді навіть може бути правильним чи неправильним. Це, здається, виходить із заплутаних приміщень. p
gung - Відновіть Моніку

12
@Guy За аналогією ми могли б охарактеризувати хімію (іншу "математичну дисципліну") як теорію асимптотичного розподілу та алгебри С *. Це номінально точно, але так повністю пропускає суть того, що таке хімія, та її цілі, щоб жоден хімік не визнавав її. Аналогічно, порівняйте свою характеристику з тим, про що говорять статистичні дані провідних професійних товариств : вони є світами один від одного. "Наука про вивчення даних, вимірювання, контролю та передачі невизначеності". Немає жодної згадки про ймовірність.
whuber

Відповіді:


15

Математика має справу з ідеалізованими абстракціями, які (майже завжди) мають абсолютні рішення, або той факт, що такого рішення не існує, взагалі можна описати повністю. Це наука про виявлення складних, але необхідних наслідків від простих аксіом.

Статистика використовує математику, але це не математика. Це освічені здогадки. Це азартні ігри.

Статистика не стосується ідеалізованих абстракцій (хоча вона використовується як інструменти), вона має справу з явищами реального світу. Статистичні інструменти часто роблять спрощення припущень для зведення брудних даних реального світу до того, що вписується в проблемну область вирішеної математичної абстракції. Це дозволяє нам робити освічені здогадки, але це насправді все, що є статистикою: мистецтво робити дуже добре обізнані здогадки.

Розглянемо тестування гіпотез з р-значеннями. Скажімо, ми перевіряємо деяку гіпотезу зі значенням , і після збору даних знаходимо p-значення 0,001 . Тож ми відкидаємо нульову гіпотезу на користь альтернативної гіпотези.α=0.010.001

Але яка ця p-величина насправді? Яке значення? Наша тестова статистика була розроблена таким чином, що вона відповідала конкретному розподілу, ймовірно, студентському t. Згідно з нульовою гіпотезою, відсоток нашої статистики, що спостерігається, є р-значенням. Іншими словами, p-величина дає ймовірність того, що ми отримаємо значення, яке наближається до очікування розподілу (або далі), як спостережена статистика тесту. Рівень знаковості - це досить довільне відсікання правила великого пальця: встановлення його на рівнозначне твердженню: "прийнятно, якщо 1 зі 100 повторень цього експерименту передбачає, що ми відкидаємо нуль, навіть якщо нуль насправді відповідає дійсності. "0.01

Значення р дає нам ймовірність того, що ми спостерігаємо наявні дані, враховуючи, що нуль є істинним (а точніше, отримуючи трохи більш технічний характер), що ми спостерігаємо дані під нульовою гіпотезою, що дає нам принаймні як екстремальне значення перевірена статистика як та, яку ми знайшли). Якщо ми збираємось відхилити нуль, тоді ми хочемо, щоб ця ймовірність була невеликою, наблизилася до нуля. У нашому конкретному прикладі ми виявили, що ймовірність спостереження за зібраними нами даними, якщо нульова гіпотеза була правдивою, становила всього , тому ми відкинули нуль. Це було освіченою здогадкою. Ми ніколи не знаємо точно, що нульова гіпотеза є хибною, використовуючи ці методи, ми просто розробляємо оцінку того, наскільки сильно наші докази підтримують альтернативу.0.1%

Чи використовували ми математику для обчислення р-значення? Звичайно. Але математика не дала нам нашого висновку. На основі доказів ми сформували освічену думку, але це все-таки азартна гра. Ми знайшли ці інструменти надзвичайно ефективними протягом останніх 100 років, але люди майбутнього можуть з жахом замислитися над крихкістю наших методів.


6
Значення p - це не ймовірність того, що ми помиляємось, коли відкидаємо нульову гіпотезу, оскільки це також залежить від H1, який не входить до обчислення значення p (добре проілюстровано i.stack.imgur.com/tStr4 .png - ймовірність того, що H0 помиляється і що Сонце вибухнуло, менше менше p = 1/36).
Дікран Марсупіал

Чи можете ви запропонувати краще просте тлумачення мови значення p? "Можливо," ймовірність того, що ми спостерігаємо дані, що знаходяться під нулем, справжня ", можливо? Я вже заглиблювався в приклад p-значення, ніж я мав намір. Мій намір полягав у визначенні статистики, а не в навчальному посібнику з інтерпретації p-значень. Я не хочу занадто зірватися з речей. Дякуємо, що вказали на це в будь-якому випадку.
Девід Маркс

2
Значення р - це ймовірність результату принаймні такої ж екстремальної, як і спостережувана, якщо нульова гіпотеза відповідає дійсності. Справа в тому, що зв'язок між правдоподібністю нульової гіпотези і значенням p є значною мірою суб'єктивним, а не логічною необхідністю, але є хорошим моментом (+1). Мене останнім часом цікавить, чи тестування частої гіпотези є менш суб'єктивним, ніж байєсівський підхід, де принаймні суб'єктивність робиться більш явною.
Дікран Марсупіал

Мені не ясно, чим ваша інтерпретація / визначення p-значення відрізняється від альтернативи, яку я запропонував у своєму останньому коментарі. Безумовно, існує певний ступінь суб'єктивності тестування гіпотез, які часто проводяться, але це той самий суб'єктивність, який викликає інтерпретація фактору Байєса. І це не так, як рівень значущості не повідомляється (тобто суб'єктивність тут також робиться явною), вона часто вибирається на основі конвенції, тоді як зазвичай більше уваги вкладається у вибір (інформативних) байєсівських пріорів.
Девід Маркс

1
@David: "Принаймні як екстремальний" має велику різницю - ймовірність спостережуваного значення під нулем взагалі не є значенням p, навіть для дискретної статистики тестів, де це має сенс. Я знаю, що це дотично до точки, яку ви зробили, але якщо Вікіпедія зможе правильно це зробити, ми повинні мати змогу перехресно перевірити.
Scortchi

10

Язик міцно в щоку:

Ейнштейн, мабуть, писав

Що стосується законів математики, що стосуються дійсності, вони не визначені; і наскільки вони впевнені, вони не посилаються на реальність.

тому статистика - це галузь математики, яка описує реальність. ; o)

Я б сказав, що статистика - це галузь математики так само, як логіка - галузь математики. Це, безумовно, включає елемент філософії, але я не думаю, що це єдина галузь математики, де це відбувається (див., Наприклад, Морріс Клайн, "Математика - втрата визначеності", Oxford University Press, 1980).


2
Чи є логіка галуззю математики? Включаючи тризначні логіки та модальні логіки або просто числення предикатів першого порядку? Чи всі формальні науки якось математичні?
Scortchi

Я б вважав, що вивчення будь-якої системи маніпулювання символами відповідно до набору правил (наприклад, формальних мов) є різноманітною математикою, так що так, я вважаю, що, напевно, так і було б. Проблема з етикетками полягає в тому, що вони не завжди повністю описують все, до чого вони застосовуються (я б не сказав, що я був саме математиком, статистиком або інформатиком, але я маю деякі аспекти всіх трьох). Так само та сама річ часто може бути розміщена в декількох ієрархіях, тому, можливо, не існує унікального рішення питання!
Дікран Марсупіал

За вашою статистикою аргументів, як опис реальності, також входить геометрія та квантова теорія поля, але вона не включає тестування гіпотез (адже більшість гіпотез є протифактичними - вони мають бути фальсифікованими), а отже, просто не "описати реальність").
whuber

Цитата Ейнштейна була язиком у щоках, і його не передбачали сприймати серйозно; Я впевнений, що це не зовсім те, що насправді мав на увазі Ейнштейн!
Дікран Марсупіал

5

Ну, якщо ви скажете, що " щось на зразок статистики, де ви не можете побудувати все на основних аксіомах ", то, напевно, вам варто прочитати про аксіоматичну теорію ймовірності Колмогорова. Колмогоров визначає ймовірність абстрактно та аксіоматично, як ви можете бачити в цьому PDF на сторінці 42 або тут, внизу сторінки 1 та наступних сторінках .

Для того, щоб дати вам смак його абстрактних визначень, він визначає випадкову змінну як "вимірювану" функцію, як це пояснюється більш "інтуїтивним" способом: Якщо випадкова змінна є функцією, то як ми визначимо функцію випадкова величина

Маючи дуже обмежену кількість аксіом і використовуючи результати з (знову математики) теорії вимірювань, він може абстрактно визначати поняття - випадкові величини, розподіли, умовна ймовірність ... і отримувати всі добре відомі результати, такі як закон великих чисел, ... з цього набору аксіом. Раджу спробувати, і ви здивуєтеся математичній красі.

Для пояснення p-значень я посилаюся на: Нерозуміння P-значення?


1
Невже все ж не існує важливого розмежування між Теорією ймовірностей (Математикою) та її застосуванням до проблем умовиводу (Статистика)? Байєсівський і частолістський підходи показують той самий математичний апарат ( як правило, або майже ), що використовується з зовсім іншими поняттями ймовірності.
Scortchi

@Scortchi: Я не впевнений, чи відрізняються поняття ймовірності для відвідувачів та байесів; дивіться stats.stackexchange.com/questions/230415/…

Я не бачу розбіжностей між моїм коментарем та вашою відповіддю на питання: Чи є якась математична основа для байесівських та частоцистських дискусій? . Під математичним апаратом я маю на увазі те, що випливає з аксіом Колмогорова; Під поняттями маю на увазі інтерпретації як обмежуюча частота, ступінь переконання та c.
Scortchi

3

Я не маю суворої чи філософської основи для відповіді на це, але я чув, що скарги "статистика не є математикою" часто від людей, як правило, фізики. Я думаю, що люди хочуть гарантувати впевненість у своїй математиці, а статистика (як правило) пропонує лише ймовірнісні висновки із пов'язаними значеннями p. Власне, це саме те, що я люблю у статистиці. Ми живемо у принципово невизначеному світі і робимо все можливе, щоб його зрозуміти. І ми робимо чудову роботу, враховуючи всі речі.


2

Можливо, це тому, що я плеб і не пройшов жодних передових математичних курсів, але не знаю, чому статистика - це не математика. Аргументи, що знаходяться тут, і щодо дублюючого питання, схоже, стверджують два основні моменти щодо того, чому статистика не є математикою * .

  1. Це не точно / певно, і як таке спирається на припущення.
  2. Він застосовує математику до проблем, і коли ви застосовуєте математику, це вже не математика.

Не точно і використовує припущення

Припущення / наближення корисні для великої кількості математики.

Властивості трикутника, про які я дізнався ще в школі, я вважаю, що вважається справжньою математикою, навіть якщо вони не відповідають дійсності в неелукідовій геометрії. Тож чітко визнання обмежень чи іншим способом "припускаючи, що XYZ є дійсним", до гілки математики не позбавляє гілки від "справжньої" математики.

Перерахунок, я певний, вважатиметься чистою формою математики, але обмеження є основним інструментом, на якому ми будували його. Ми можемо продовжувати обчислення до межі, так само, як ми можемо продовжувати збільшувати розмір вибірки, але і не давати збільшити уявлення про певний поріг.

Після застосування математики це не математика

Очевидним протиріччям тут є те, що ми використовуємо математику для доведення математичних теорем, і ніхто не стверджує, що доведення математичних теорем не є математикою.

Наступним твердженням може бути те, що thing xце не математика, якщо ви використовуєте математику для отримання результату. Це теж не має сенсу.

Я б погодився з тим, що коли ви використовуєте результати розрахунку для прийняття рішення, то рішення не є математичним . Це не означає, що аналіз, який призводить до прийняття рішення, не є математичним .

Я думаю, що коли ми використовуємо статистичний аналіз, вся математика, що виконується, є реальною математикою. Лише коли ми передаємо результати комусь для інтерпретації, статистика виходить з математики. Як така статистика, і статистики займаються реальною математикою і є справжніми математиками. Це тлумачення, яке проводиться бізнесом та / або переклад результатів на діло статистиком, не є математичним.

З коментарів:

Уабер сказав:

Якби ви замінили "статистику" на "хімію", "економіку", "інженерію" або будь-яку іншу сферу, в якій використовується математика (наприклад, домашня економіка), схоже, жоден ваш аргумент не зміниться.

Я думаю, що ключова відмінність "хімії", "інженерії" від "балансування моєї чекової книжки" полягає в тому, що ці поля просто використовують існуючі математичні поняття. Наскільки я розумію, статистики, як Гуас, розширили сукупність математичних понять. Я вважаю (це може бути відверто неправильно), що для отримання доктора наук зі статистики ви повинні певним чином внести свій внесок у розширення масиву математичних понять. Кандидати кандидатів хімічних / технічних наук не вимагають моїх знань.

Відмінність того, що статистика сприяє сукупності математичних понять, полягає в тому, що відрізняє її від інших полів, які просто використовують математичні поняття .


*: Помітним винятком є ця відповідь, яка фактично стверджує, що межі є штучними через різні соціальні причини. Я думаю, що це єдина правдива відповідь, але де в цьому весело? ;)


1
Якби ви замінили "статистику" на "хімію", "економіку", "інженерію" або будь-яку іншу сферу, в якій використовується математика (наприклад, домашня економіка), схоже, жоден ваш аргумент не зміниться. Як таке, схоже, без жодної речовини.
whuber

Кандидати статистики не повинні "вносити внесок у сукупність математичних понять". Більшість статистичних наук присуджуються за внесок у статистичну методологію та теорію статистики . (Мало хто з математиків, якщо вони є, звертають увагу на статистичну літературу. Це просто не гарне джерело нових чи плідних математичних ідей взагалі. Я не маю на увазі літературу в теорії ймовірностей.) Більше того, хіміки, інженери, фізики тощо часто створюють (або, як правило, відновлюють) математичні ідеї у своїй роботі; що автоматично не перетворює їхні поля в гілки математики.
whuber

@whuber Це дуже цікаво. Схоже, у мене немає ноги, на якій стояти.
Ерік

1
Для запису я не відмовився від вашого внеску. Це дуже важлива тема для багатьох - наприклад, багато математичних факультетів коледжів все ще намагаються ставитися до статистиків як до математиків на шкоду обом - і тому це, ймовірно, викликає сильні реакції.
whuber

2
@whuber Я досить міцний, щоб витримати декілька голосів. :) Я думаю, що ви були шанобливі у будь-який час, тому не хвилюйтеся з цього приводу. Крім того, голосування є анонімним з причини. Не потрібно продовжувати записувати.
Ерік

2

Статистичні тести, моделі та інструменти для висновку формулюються мовою математики, а статистики мають математично доведені товсті книги з дуже важливими та цікавими результатами щодо них. У багатьох випадках докази дають переконливі докази того, що ці статистичні інструменти є надійними та / або потужними.

Статистика та її спільнота можуть бути недостатньо "чистими" для математиків певного смаку, але вона, безумовно, вкладається в математику надзвичайно глибоко, а теоретична статистика - це стільки ж галузь математики, скільки теоретична фізика чи теоретична інформатика.


2
Привіт Пол, як ви кажете, статистика сповнена приємних теорем і доказів (+1), є навіть аксіоматична теорія ймовірності, розроблена Колмогоровим, як я пояснюю у своїй відповіді.

-2

"Різниця" спирається на: індуктивне міркування проти дедуктивного міркування проти умовиводу . Наприклад, жодна математична теорема не може сказати, який розподіл чи раніше ви можете використовувати для своїх даних / моделі.

До речі, байєсівська статистика - аксіоматизована область.


Математика теж потребує індуктивних міркувань ...
Елвіс

@Elvis Так, тому мій приклад ... Я впевнений, що ви знаєте, що немає загальної відповіді на це питання ... Я відредагував відповідь, на ваше задоволення ...
Compay Segundo

Я дійсно не розумію вашої точки зору.
Елвіс

@CompaySegundo: Я не впевнений, що у вас тут є дійсна точка, принаймні, це чітко не зазначено.
Quora Feans

1
@QuoraFea Напевно, я занадто п’яний ...
Compay Segundo

-2

Це може бути дуже непопулярною думкою, але враховуючи історію та формулювання понять статистики (та теорії ймовірностей), я вважаю статистику підгалузкою фізики .

Дійсно, Гаусс спочатку формалізував модель регресії найменших квадратів в астрономічних прогнозах. Більшість внесків у статистику до Фішера були від фізиків (або високоприкладних математиків, чиї роботи за сьогоднішніми мірками би називались фізикою): Ляпунова, Де Мойвре, Гаусса та одного або декількох Бернуліса.

Основний принцип - це характеристика помилок і уявної випадковості, що поширюються з нескінченної кількості незмірених джерел варіації. Оскільки експерименти стали важче контролювати, експериментальні помилки необхідно було офіційно описати та врахувати для калібрування переваги експериментальних доказів проти запропонованої математичної моделі. Пізніше, коли фізика частинок заглибилася в квантову фізику, формалізація частинок як випадкових розподілів дала набагато більш стисну мову для опису начебто неконтрольованої випадковості з фотонами та електронами.

Властивості оцінювачів, такі як їх середнє значення (центр маси) та стандартне відхилення (другий момент відхилень), для фізиків дуже інтуїтивно зрозумілі. Більшість граничних теорем можуть бути слабо пов'язані із законом Мерфі, тобто обмежуючим нормальним розподілом є максимальна ентропія.

Тож статистика - це підгалузь фізики.


5
Ця теза настільки ж неправдоподібна, як і нелогічна. Як вказує Стівен Стіглер у своїх книгах, психологи, економісти та більшість інших соціальних учених не застосовували методів фізиків до іншого століття через реальні сумніви у їх застосовності та інтерпретації. Це prima facie доказ того, що статистика набагато більше, ніж галузь фізики. Інші дисципліни, починаючи від інженерії та біології, також використовують фізичні методи та фізичні теорії, але це також не робить їх галузями фізики - принаймні, не будь-якими змістовними чи проникливими способами.
whuber

Чи не інтерес Бернуллі до ймовірності був наслідком азартних ігор, а не фізики?
Дікран Марсупіал

@whuber Як і у моїй галузі, біостатистиці, я добре усвідомлюю, що ці прикладні науки існували в різних формах до їх чіткої ідентифікації як галузі науки. Я вважаю, що цим полям формально передувало саме поле статистики. Це, звичайно, не стосується фізики. Єдиною центральною темою в цих прикладних науках є формулювання процесу як моделі, що стосується якогось прогноктора до відповіді. Можливо, мова статистики частково народилася з необхідності узагальнення таких понять, що стосуються цих полів.
AdamO

1
Ви думаєте про Якобуса Бернуллі, посмертного автора ars conjectandi (ред. Ніколаус Бернуллі, 1713). Ймовірно, останніми людьми, які, здавалося, були мотивовані азартними проблемами, були Паскаль і Ферма в 1654 році, але навіть тоді, здається, вони використовували певні проблеми з азартними іграми ("проблема очок") лише як мотиваційний приклад, а не як фокус їх розслідування. (Сучасна наука насправді простежує проблему моменту ісламського контрактного права, c. 1200.) Останнім математиком, який справді був мотивований азартними іграми, ймовірно, був Кардано (1501-1576).
whuber

1
Діаконіс чарівник ? Я б не пов'язував азартні ігри з демонстрацією! У вас є сенс, але ви можете трохи відштовхнутися, підказавши, що багато «інвесторів» насправді є азартними гравцями, тому багато теоретиків з математичних фінансів справді можуть бути мотивовані такою формою азартних ігор. Просто думка ... У будь-якому разі зрозуміло, що до того часу, коли Гуйгенс опублікував свій маленький трактат у 1657 р., Люди створювали теорію ймовірності (і статистику) з причин, набагато глибших та далекосяжних, ніж робити краще за гральними столами .
whuber
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.