Яка різниця між вірогідністю та статистикою?


Відповіді:


114

Коротка відповідь на це, що я чув від Персі Діаконіс, полягає в наступному: проблеми, які розглядаються ймовірністю та статистикою, є зворотними один одному. У теорії ймовірностей ми розглядаємо деякий базовий процес, який має деяку випадковість або невизначеність, змодельовану випадковими змінними, і ми з'ясовуємо, що відбувається. У статистиці ми спостерігаємо те, що трапилося, і намагаємось розібратися, який основний процес пояснив би ці спостереження.


2
Отже, статистика спостерігає за тим, що відбувається у фізичному світі, теоретизує про основний процес, а потім, знайшовши процес, використовує його у сенсі ймовірності, щоб передбачити, що буде далі?
hslc

Я не статистик, але, з мого розуміння, я б сказав, так, та частина того, що робить статистика.
Марк Меккес

16
Індукція проти вирахування?
Паоло

6
Як сказав Паоло, теорія ймовірностей в основному стосується дедуктивної частини, статистики з індуктивною частиною процесів моделювання з невизначеністю. Можливо, цікаво згадати, що якщо думати, що правдоподібні індуктивні міркування повинні бути послідовними, то насправді результатом є байєсівська статистика, і ще цікавіше це можна отримати з теорії ймовірностей. Отже, байєсівська статистика в основному застосовується теорією ймовірностей, так би мовити.
Thies Heidecke

1
@ Паоло Статистичний висновок вважається "Індуктивна статистика"
Кервін

77

Мені подобається приклад баночки з червоною та зеленою квасолею.

Імовірніст починається з того, що знає пропорцію кожного і запитує ймовірність намалювати червону квасолю. Статистичний лікар визначає частку червоних бобів, відбираючи проби з банки.


Але це не просто формулювання? Імовірнівець може запитати "якщо я намалював три червоні боби, яка ймовірність того, що пропорція становить п'ятдесят п'ятдесят?"
Томас Ейл

2
@ThomasAhle: Це не дуже чітко визначене ймовірне запитання, якщо ви не приймаєте якусь основоположну ймовірнісну модель для оригінального розподілу кольорів.
Марк Меккес

55

Оманливо просто сказати, що статистика - це просто зворотна ймовірність. Так, статистичні питання - це питання зворотної ймовірності, але вони є неправомірними зворотними проблемами , і це має велику різницю в плані їх вирішення.

Ймовірність - це галузь чистої математики - питання ймовірності можна ставити і вирішувати, використовуючи аксіоматичні міркування, і тому є одна правильна відповідь на будь-яке питання ймовірності.

Статистичні питання можуть бути перетворені на питання ймовірності за допомогою імовірнісних моделей . Після того, як ми зробимо певні припущення щодо механізму генерації даних, ми можемо відповісти на статистичні запитання, використовуючи теорію ймовірностей. ЯКЩО, правильне формулювання та перевірка цих імовірнісних моделей є настільки ж важливим або навіть важливішим, ніж подальший аналіз проблеми за допомогою цих моделей.

Можна сказати, що статистика складається з двох частин. Перша частина - питання про те, як сформулювати та оцінити ймовірнісні моделі для проблеми; це намагання лежить у галузі "філософії науки". Друга частина - питання отримання відповідей після прийняття певної моделі. Ця частина статистики справді є предметом прикладної теорії ймовірностей, а на практиці містить і численний аналіз.

Дивіться: http://bactra.org/reviews/error/


2
Я люблю тебе за цю відповідь
badatmath

16

Мені подобається це з розрахункових ставок Стіва Скієни (див. Посилання для повного обговорення):

Якщо підсумовувати, теорія ймовірностей дозволяє нам знайти наслідки даного ідеального світу, тоді як статистична теорія дозволяє вимірювати ступінь ідеальності нашого світу.


13

Ймовірність - це чиста наука (математика), статистика - про дані. Вони пов'язані, оскільки ймовірність утворює якусь основу для статистики, що забезпечує основні ідеї.


3
Так що ймовірність чиста математика, а статистика застосовується математика?
hslc

4
Статистика може застосовуватися, а може бути й ні; все ще концепція даних завжди присутня.

13

Таблиця 3.1 інтуїтивної біостатистики відповідає на це питання діаграмою, наведеною нижче. Зверніть увагу, що всі стрілки вказують праворуч на ймовірність, а вліво - на статистику.

ПРОБАБІЛЬНІСТЬ

Загальні ---> Конкретні

Населення ---> Зразок

Модель ---> Дані

СТАТИСТИКА

Загальний <--- Конкретний

Населення <--- Зразок

Модель <--- Дані


1
Отже, статистика є синонімом аналізу даних?
hslc

3
Я не бачу різниці.
Харві Мотульський,

3
Деякі аналізи даних не покладаються на статистику часто.
о.

11

Імовірність відповідає на запитання про те, що буде , статистика відповідає на питання про те, що сталося.


3
За цим визначенням, однак, інтервал прогнозування - це швидше вірогідність, а не статистика.
Glen_b

10

Ймовірність полягає у кількісному визначенні невизначеності, тоді як статистика пояснює відмінність певного показника інтересу (наприклад, чому різняться рівні доходів?), Які ми спостерігаємо в реальному світі.

Ми пояснюємо різницю, використовуючи деякі видимі фактори (наприклад, стать, рівень освіти, вік тощо для прикладу доходу). Однак, оскільки ми не можемо врахувати всі можливі фактори, що впливають на дохід, ми залишаємо будь-яку незрозумілу зміну випадковим помилкам (саме там відбувається кількісна оцінка невизначеності).

Оскільки ми приписуємо "Варіація = Ефект спостережуваних факторів + Ефект випадкових помилок", нам потрібні інструменти, надані ймовірністю, для обліку впливу випадкових помилок на варіацію, яку ми спостерігаємо.

Деякі приклади випливають:

Кількісне визначення невизначеності

Приклад 1: Ви перекидаєте 6-сторонній штамп. Яка ймовірність отримання 1?

Приклад 2: Яка ймовірність того, що річний дохід дорослої людини, обраного навмання зі США, становить менше 40 000 доларів?

Пояснення варіації

Приклад 1: Ми спостерігаємо, що річний дохід людини змінюється. Які фактори пояснюють різницю у доходах людини?

Зрозуміло, що ми не можемо врахувати всі фактори. Таким чином, ми пов'язуємо дохід людини з деякими спостережуваними факторами (наприклад, рівень освіти, стать, вік тощо) і залишаємо будь-які інші зміни до невизначеності (або мовою статистики: випадкові помилки).

Приклад 2: Ми спостерігаємо, що деякі споживачі обирають Tide більшу частину часу, коли купують миючий засіб, тоді як деякі інші споживачі вибирають миючий засіб маркою xyz. Що пояснює варіацію у виборі? Ми пов'язуємо варіацію вибору з деякими спостережуваними факторами, такими як ціна, назва фірми тощо і залишаємо незрозумілі зміни випадковим помилкам (або невизначеності).


1
Що робити, якщо випадкові помилки з часом стають більшими, ніж спостережувані фактори?
hslc

У такому випадку ви перепрацюєте свою модель, оскільки вона вже не відповідає дійсності.

8

Ймовірність - це обійми невизначеності, тоді як статистика - це емпіричне, несамовитий пошук правди (звісно, ​​прокляті брехуни виключаються).


Тут я маю на увазі всю частоту / байесівську ймовірність та всю описову / дослідницьку / інфекційну статистику.

7

Подібно до того, що сказав Марк, статистику історично називали зворотною ймовірністю , оскільки статистика намагається визначити причини події з огляду на спостереження, тоді як ймовірність, як правило, навпаки.


6

Імовірність кожної події є його довгостроковою перспективою відносної частоти. Отже, це в основному говорить вам про шанс , наприклад, отримати "голову" на наступному перевороті монети або отримати "3" на наступному рулоні плашки.

Статистики будь-яка числова міра обчислюється за вибіркою населення. Наприклад, середня вибірка. Ми використовуємо це як статистику, яка оцінює середнє значення сукупності, що є параметром. Тому в основному це дає вам якийсь підсумок зразка.

  • Ви можете отримати лише статистику з вибірки, інакше якщо обчислити числовий показник на сукупність, він називається параметром сукупності.

6

Імовірнісні дослідження, ну, наскільки ймовірні події. Ви інтуїтивно знаєте, що таке ймовірність.

Статистика - це вивчення даних: її показ (за допомогою таких інструментів, як діаграми), узагальнення їх (за допомогою засобів та стандартних відхилень тощо), досягнення висновків про світ, з якого отримані ці дані (пристосування рядків до даних тощо), та - це головне - кількісна оцінка того, наскільки ми впевнені у своїх висновках.

Для того, щоб оцінити, наскільки ми впевнені у своїх висновках, нам потрібно використовувати ймовірність. Скажімо, у вас є минулорічні дані про кількість опадів у регіоні, де ви живете та де я живу. Минулого року дощило в середньому 1/4 дюйма на тиждень, де ти живеш, і 3/8 дюйма, де я живу. Тож можна сказати, що кількість опадів у моєму регіоні в середньому на 50% більше, ніж там, де ви живете, правда? Не так швидко, Спаркі. Це може бути збіг обставин: можливо, минулого року просто трапилось дощ, де я живу. Ми можемо використовувати Імовірність, щоб оцінити, наскільки впевненими ми можемо бути в нашому висновку, що мій дім на 50% соковитий ніж ваш.

Тож в основному можна сказати, що ймовірність є математичною основою для теорії статистики.


5

У теорії ймовірностей нам певним чином задаються випадкові величини X1, X2, ..., а потім ми вивчаємо їх властивості, тобто обчислюємо ймовірність P {X1 \ в B1}, вивчаємо конвергенцію X1, X2, ... і т.д. .

У математичній статистиці нам дано n реалізацій деякої випадкової величини X та набір розподілів D; проблема полягає у пошуку серед дистрибутивів із D, який, швидше за все, генерує дані, які ми спостерігали.


Тож ми можемо знаходити лише зразки, які ми шукали в першу чергу?
hslc

4

Напевно, розподіл відомий і відомий заздалегідь - ви починаєте з відомої функції розподілу ймовірностей (або подібної) і вибираєте з неї вибірку.

У статистиці розподіл заздалегідь невідомий. Це може бути навіть непізнавальним. Припущення висувають гіпотезу про розподіл ймовірності за спостережуваними даними, щоб можна було застосувати теорію ймовірностей до цих даних, щоб знати, чи може нульова гіпотеза про ці дані може бути відхилена чи ні.

Існує філософська дискусія про те, чи є в реальному світі таке поняття, як вірогідність, чи це ідеальна фігура наших математичних уявлень, і всі наші спостереження можуть бути лише статистичними.


3

Статистика - це пошук правди в умовах невизначеності. Ймовірність - це інструмент, який дозволяє кількісно оцінити невизначеність.

(Я надав ще одну, довшу відповідь, яка припускала, що те, що просили, - це щось за принципом "як би ти пояснив це своїй бабусі?")


3

(Ω,F,P)θ(Ω,F,Pθ)θ

θθ

Відмова: вищезазначені математичні відповіді. Насправді значна частина статистики також стосується розробки / виявлення відповідних моделей, опитування існуючих моделей, розробки експериментів, роботи з недосконалими даними тощо. "Усі моделі помиляються".


4
Аналогічно, якщо запитати "що таке хімія?" ми можемо відповісти, що це набір диференціальних рівнянь. Опис математичної теорії може дати нам невелике уявлення про те, що стосується предмета, але це не сам предмет.
whuber

3

Ймовірність : З огляду на відомі параметри, знайдіть ймовірність спостереження за певним набором даних.

Статистика : З огляду на певний набір спостережуваних даних, зробіть висновок про те, якими можуть бути параметри.

Статистика "більш суб'єктивна" і "більше мистецтва, ніж науки" (щодо ймовірності).

Example_

p

p=12HHH

18

HHHp

Різні статистики даватимуть різні, часто давно відповіді.


3

Різниця між ймовірностями та статистикою полягає в тому, що у ймовірності немає помилки. Ми впевнені у вірогідності, оскільки точно знаємо, скільки сторін має монету чи скільки синіх карамелей у вазі. Але в статистиці ми досліджуємо частину населення, що б ми не досліджували, і з цього ми намагаємося бачити правду, але завжди є відсоток неправильних висновків. Єдина правда в статистиці - це% помилка, що насправді є ймовірністю.


2

Текст Savage Основи статистики цитуються понад 12000 разів у Google Scholar. [3] У ній сказано наступне.

Одностайно погоджуються, що статистика якось залежить від ймовірності. Але що стосується ймовірності та як це пов'язано зі статистикою, то з часів Вавилонської вежі рідко траплялися такі повні розбіжності та розрив спілкування. Безперечно, значна частина розбіжностей є лише термінологічною і зникала б при досить гострому аналізі.

https://en.wikipedia.org/wiki/Foundations_of_statistics

Тож те, що Теорія ймовірностей є фундаментом статистики, навряд чи заперечується. Все інше - чесна гра.

Але намагаючись бути більш корисним, практичним з відповіддю ...

Однак теорія ймовірностей містить багато, що здебільшого представляє математичний інтерес і не має безпосереднього відношення до статистики. Більше того, багато тем статистики не залежать від теорії ймовірностей

https://en.wikipedia.org/wiki/Probability_and_statistics

Сказане нічим не є вичерпним чи авторитетним, але я вважаю, що це корисно.

Зазвичай це допомагало мені бачити такі речі, як ...

Конкретна математика >> Теорія ймовірностей >> Статистика

Кожна з яких використовується в середньому в основах наступного. Тобто є великі перехрестя в тому, як ми вивчаємо основи наступного.

PS. Існує індуктивна та дедуктивна статистика, тому не в чому полягає різниця.


0

Багато людей і математиків кажуть, що "СТАТИСТИКА - це зворотна ПРОБАБІЛЬНІСТЬ", але це не особливо правильно. Спосіб наближення або спосіб вирішення цих 2 абсолютно різні, але вони ВЗАЄМОДАЄМО .

мені сподобається звернутися до мого друга Джона Кука .....

"Мені подобається приклад баночки з червоними та зеленими квасолями з желе.

Імовірніст починається з того, що знає пропорцію кожного, і скажемо, знайде ймовірність намалювати червону квасолю. Статистик визначає частку червоних бобів, відбираючи проби з банки ".

Тепер пропорція червоної квасолі, отриманої при відборі проб з банки, використовує імовірний лікар, щоб знайти ймовірність витягання червоної квасолі з банки

Розглянемо цей приклад ---- >>>

Під час іспиту 30% студентів провалили фізику, 25% - математику, 12% - фізику та математику. Студент вибирається навмання, знаходить ймовірність того, що студент зазнав невдачі у фізиці, якщо відомо, що він не вдався до математики.

Вищенаведена сума є проблемою ймовірності, але якщо ми уважно подивимось, то виявимо, що сума надається деякими статистичними даними

30% студентів не вдали фізики, 25% "" "математика" "Це в основному частоти, якщо відсотки обчислюються. Таким чином, нам надають статистичні дані, що, в свою чергу, допомагає нам знайти ймовірність

ТОМУ ПРОБАБІЛЬНІСТЬ ТА СТАТИСТИКА ДУЖЕ ВЗАЄМОДАЄМО ВЗАЄМОДАЄМО АБО РЕЧИМЕ, МОЖЕМО сказати, що ВІДПОВІДАЛЬНІСТЬ ЗАЛОЖЕНО ВІД СТАТИСТИКИ


0

Термін "статистика" чудово пояснюється Дж. К. Максвеллом у статті " Молекули" (" Природа 8", 1873, с. 437–441). Дозвольте мені процитувати відповідний уривок:

Коли робочі члени розділу F отримують звіт про перепис населення або будь-який інший документ, що містить числові дані економічної та соціальної науки, вони починаються з розподілу всього населення на групи відповідно до віку, податку на прибуток, освіти, релігійна віра чи кримінальні переконання. Кількість особи занадто велика, щоб дозволити простежити історію кожного окремо, щоб, щоб зменшити їхню працю в людських межах, вони сконцентрували свою увагу на невеликій кількості штучних груп. Різна кількість людей у ​​кожній групі, а не мінливий стан кожної людини є основною датою, з якої вони працюють.

Це, звичайно, не єдиний метод вивчення природи людини. Ми можемо спостерігати за поведінкою окремих чоловіків і порівнювати її з тією поведінкою, на яку їх очікували їх попередній характер та їх нинішні обставини, згідно найкращої існуючої теорії. Ті, хто практикує цей метод, прагнуть вдосконалити свої знання про елементи людської природи, приблизно так само, як астроном виправляє елементи планети, порівнюючи її фактичне положення з положенням, отриманим з отриманих елементів. Тому вивчення людської природи батьками та вчителями школи, істориками та державними діячами слід відрізняти від того, що проводилося реєстраторами та таблицями, та тими державними діячами, які вірять у свої цифри. Один можна назвати історичним, а другий - статистичним методом.

Рівняння динаміки повністю виражають закони історичного методу щодо застосованого до матерії, але застосування цих рівнянь передбачає досконале знання всіх даних. Але найменша частина речовини, яку ми можемо піддавати експерименту, складається з мільйонів молекул, жодна з яких ніколи не стає для нас чутливою індивідуально. Тому ми не можемо встановити фактичний рух будь-якої з цих молекул, так що ми зобов'язані відмовитися від суворого історичного методу та прийняти статистичний метод поводження з великими групами молекул.

Це пояснення статистичного методу він дає у кількох інших роботах. Наприклад, "У статистичному методі дослідження ми не слідкуємо за системою під час її руху, але ми концентруємо свою увагу на певній фазі і з'ясовуємо, перебуває вона у цій фазі чи ні, а також коли вона переходить у фазу і коли воно покине його "(Транс. Кембридж Філос. Соц. 12, 1879, с. 547–570).

Є ще один прекрасний уривок Максвелла про "ймовірність" (з листа до Кемпбелла, 1850 р., Передрукованого в "Життя Джеймса Клерка Максвелла" , стор. 143):

фактична наука логіки в даний час узгоджується лише з речами, певними, неможливими або цілком сумнівними, жодна з яких (на щастя) ми не повинні міркувати. Тому справжньою логікою для цього світу є обчислення ймовірностей, яке враховує величину ймовірності (яка є, або яка повинна бути розумною людиною).

Тож можна сказати:

- У статистиці ми "концентруємо свою увагу на невеликій кількості штучних груп" чи кількості; ми робимо свого роду каталогізацію чи перепис.

- Імовірно, ми обчислюємо нашу непевність щодо деяких подій чи кількості.

Два є різними, і ми можемо робити одне без іншого.

Наприклад, якщо ми проводимо повний перепис всього населення нації і підраховуємо точну кількість людей, що належать до певних груп, таких як вік, стать тощо, ми робимо статистику. Немає ніякої непевності - ймовірності - тому що цифри, які ми знаходимо, є точними та відомими.

З іншого боку, уявіть, як хтось проходить перед нами на вулиці, і ми дивуємось їх віку. У цьому випадку ми не впевнені, і ми використовуємо ймовірність, але статистики немає, оскільки ми не проводимо певного перепису чи каталогу.

Але обидва можуть відбуватися і разом. Якщо ми не можемо провести повний перепис населення, ми мусимо здогадатися, скільки людей у ​​конкретних вікових групах. Отже, ми використовуємо ймовірність, роблячи статистику. Навпаки, ми можемо розглянути точні статистичні дані про вік людей, і з таких даних спробуємо краще здогадатися про людину, яка проходить перед нами. Отже, ми використовуємо статистику, вирішуючи ймовірність.


Дякую за ваш внесок. Незважаючи на те, що це цікаво, це не відповідає тому, що статистики вважають статистикою ні такою, якою вони є насправді, як це показано на сайті stats.stackexchange.com/questions/140547/… .
whuber

Це суперечка. Я знаю професійних статистиків, які не згодні з визначенням ASA (що страшенно розпливчасто) і згодні з Максвеллом.
pglpm
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.