Чи можете ви сказати, що статистика та ймовірність схожі на індукцію та дедукцію?


17

Я прочитав цю тему , і мені здається, що можна сказати, що:

  • статистика = індукція?
  • ймовірність = відрахування?

Але мені цікаво, чи можуть бути ще якісь деталі щодо порівняння, яке мені не вистачає. Наприклад, чи статистика дорівнює індукції, чи це лише конкретний випадок? Здається, що ймовірність - це суб-випадок дедукції (оскільки це суб-випадок математичного мислення).

Я знаю, що це прискіпливе запитання, але в певному сенсі саме тому я його задаю - тому що я хочу бути впевненим, як можна точно порівняти ці терміни.


Не тому, що відповідає на ваше запитання, а тому, що вони пов'язані: stats.stackexchange.com/questions/665/… (мені дуже подобається відповідь Марка / Петра) та stats.stackexchange.com/questions/2641/…
Робін Жирард

Відповіді:


15

Я думаю, що найкраще швидко зрозуміти значення індуктивних та дедуктивних міркувань, перш ніж відповісти на ваше запитання.

  • Дедуктивна аргументація: "Дедуктивні аргументи - це спроба показати, що висновок обов'язково випливає з набору приміщень. Дедуктивний аргумент справедливий, якщо висновок випливає обов'язково з приміщень, тобто, якщо висновок повинен бути правдивим за умови, що приміщення є правдивим. . Дедуктивний аргумент є здоровим, якщо він дійсний, і його передумови є істинними. Дедуктивні аргументи є дійсними або недійсними, звуковими або невиправданими, але ніколи не є хибними або істинними ". ( цитується з wikipedia , наголос додано).

  • "Індуктивне міркування, також відоме як індукційна або індуктивна логіка, або освічена здогадка в розмовному англійською мовою, є своєрідним міркуванням, яке дозволяє викласти висновок помилковим, навіть якщо всі передумови є істинними. Приміщення індуктивного логічного аргументу вказують на певну ступінь підтримки (спонукальної ймовірності) для висновку, але не тягнуть за собою; тобто вони не забезпечують його правдивості. "( з Вікіпедії , наголос додано)

Щоб підкреслити головну відмінність: Оскільки дедуктивне міркування передає правду від суті до висновків, індуктивне міркування цього не робить. Тобто, якщо для дедуктивних міркувань ви ніколи не розширюєте свої знання (тобто все знаходиться в приміщенні, але іноді приховано і потрібно демонструвати через докази), індуктивне міркування дозволяє розширити свої знання (тобто ви можете отримати нові уявлення про те, що не містяться в приміщенні, однак, за витрати на незнання їх правди).

Як це стосується ймовірності та статистики?

На моїх очах, ймовірність обов’язково дедуктивна. Це галузь математики. Тож на основі деяких аксіом чи ідей (нібито правдивих) він виводить теорії.

Однак статистика не обов'язково є індуктивною. Тільки якщо ви спробуєте використати це для отримання знань про неспостережувані суб'єкти (тобто, ведучи статистику зараження, див. Також відповідь "onestop"). Однак якщо ви використовуєте статистику для опису вибірки (тобто декриптивної статистики) або якщо ви відібрали всю сукупність, вона все одно є дедуктивною, оскільки ви не отримаєте більше знань чи інформації, як це вже є у вибірці.

Отже, якщо ви думаєте про статистику як про героїчне починання вчених, які намагаються використовувати математичні методи, щоб знайти закономірності, що регулюють взаємодію емпіричних утворень у світі, що насправді ніколи не є успішним (тобто ми ніколи не дізнаємось, чи є наших теорій правдиво), то, так, це індукція. Це також Науковий метод, сформульований Френсісом Беконом, на якому заснована сучасна емпірична наука. Метод призводить до індуктивних висновків, які в кращому випадку є дуже ймовірними, хоча й не певними. Це, в свою чергу, призводить до непорозуміння серед науковців щодо значення наукової теорії та наукового доказу.


Оновлення: Після прочитання відповіді Conjugate Prior (я хотів би дещо додати). Я думаю, що питання про те, чи є (інфекційне) статистичне обґрунтування дедуктивним чи спонукальним, залежить від того, що саме вас цікавить, тобто до якого висновку ви прагнете.

Якщо вас цікавлять імовірнісні висновки, то статистичні міркування є дедуктивними. Це означає, що якщо ви хочете знати, якщо, наприклад, у 95 із 100 випадків значення сукупності знаходиться в певному інтервалі (тобто довірчий інтервал), то ви можете отримати значення істини (справжнє чи неправдиве) для цього твердження. Можна сказати (якщо припущення вірні), що у 95 із 100 випадків значення популяції знаходиться в інтервалі. Однак у жодному емпіричному випадку ви не знатимете, чи є показник популяції у вашому отриманому ІС. Або є, або ні, але немає можливості бути впевненим. Це ж міркування стосується ймовірностей класичної p-значення та байєсівської статистики. Ви можете бути впевнені у вірогідності.

Однак якщо вас цікавлять висновки щодо емпіричних утворень (наприклад, де значення чисельності населення), ви можете стверджувати лише індуктивний характер. Ви можете використовувати всі доступні статистичні методи для накопичення доказів, що підтверджують певні судження про емпіричні утворення або причинно-наслідкові механізми, з якими вони взаємодіють. Але ви ніколи не будете впевнені в жодній із цих пропозицій.

Резюме: Я хочу зробити так, що важливо, на що ви дивитесь. Ви можете вивести ймовірні речі, але для кожної певної пропозиції про речі ви можете знайти лише підтвердження на користь. Не більше. Дивіться також посилання onestop на проблему індукції.


Дякую, Генрік, - розрізнення між визначеннями (та вашими думками про них) було корисним.
Тал Галілі

Ваше оновлення було зрозумілим і до речі. Якби я міг дати тобі ще (+1), я би.
Тал Галілі

7

Статистика - це дедуктивний підхід до індукції. Розглянемо два основні підходи до статистичного висновку: частота і байєсівський.

Припустимо, ви часто відвідувач (в стилі Фішера, а не Неймана для зручності). Вам цікаво, чи приймає параметр суттєвого інтересу певне значення, тому ви будуєте модель, вибираєте статистику, що стосується параметра, і проводите тест. Значення р, сформоване вашим тестом, вказує на ймовірність бачити статистику такою ж або більш екстремальною, ніж статистика, обчислена з вашої вибірки, припускаючи, що ваша модель правильна. Ви отримуєте досить невелике p-значення, тому ви відкидаєте гіпотезу про те, що параметр дійсно приймає це значення. Ваші міркування є дедуктивними: якщо припустити, що модель є правильною, або параметр дійсно приймає значення суттєвого інтересу, але ваше - малоймовірний зразок, який видно, або він фактично не приймає цього значення.

Перехід від тесту гіпотези до довірчих інтервалів: для вашого параметра у вас є 95% довірчий інтервал, який не містить значення, що становить істотний інтерес. Ваші міркування знову дедуктивні: якщо припустити, що модель правильна, або це один з тих рідкісних інтервалів, які з’являться 1 в 20 разів, коли параметр дійсно має значення суттєвого інтересу (тому що ваш зразок малоймовірний), або Параметр насправді не має цього значення.

Тепер припустімо, що ви баєсець (в стилі Лапласа, а не Гельмана). Ваші припущення та обчислення моделі дають розподіл вірогідності (заднім числом) над значенням параметра. Більша частина маси цього розподілу далека від значення істотного інтересу, тому ви робите висновок, що параметр, ймовірно, не має цього значення. Ваші міркування знову дедуктивні: якщо припустити, що ваша модель є правильною, і якщо попередній розподіл представляв ваші переконання щодо параметра, то ваші переконання щодо нього з урахуванням даних описуються вашим заднім розподілом, що ставить дуже мало ймовірності на це значення. Оскільки цей розподіл не підтримує значення суттєвого інтересу, ви можете зробити висновок, що параметр насправді не має значення. (Або ви можете бути задоволеними, щоб вказати ймовірність цього зробити).

У всіх трьох випадках ви отримуєте логічну диз'юнкцію на основі своєї дії, на якій виведено дедуктивно / математично з припущень. Ці припущення зазвичай стосуються моделі формування даних, але можуть бути і попередніми переконаннями щодо інших величин.


1
Дякую Cp, ви зазначаєте цікавий момент. Хоча, з точки зору відповіді Генріка вище, ви все ще перебуваєте в царині індуктивних, оскільки описані вами статистичні міркування - це те, що передбачає невизначеність.
Тал Галілі

Будь ласка, дивіться (сподіваюся, зрозуміле) оновлення моєї відповіді, де я намагаюся вирішити питання, порушене тут.
Генрік

@Henrik Це ясніше (мені щонайменше). Лише невеликий нігтя: Не зовсім так, що "ті ж міркування стосуються ймовірностей у класичній p-величині та байєсівській статистиці". Останній буде давати вам поодинокі ймовірності подій, наприклад , ймовірність того, що істинне середнє значення між деяким значенням і іншим значенням (хоча інші ваші застереження застосовуються всі) в той час як «класичні» частотні методи , такі як довірчі інтервали навіть не будуть робити це, не дивлячись на те, прихильне і поширене сподівання, що вони роблять. Їх інтерпретація справді така, як ви її описуєте.
кон'югатприор

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.