Яка різниця між описовою та інфекційною статистикою?


21

Моє розуміння полягало в тому, що описова статистика кількісно описує особливості вибірки даних, тоді як інфекційна статистика робила висновки про популяції, з яких брали зразки.

Однак на сторінці вікіпедії для статистичного висновку зазначено:

Здебільшого статистичні умовиводи висловлюють положення про популяції, використовуючи дані, отримані від сукупності, що цікавить, за допомогою якоїсь форми випадкової вибірки.

"Здебільшого" змусив мене думати, що, можливо, я не розумію належним чином цих понять. Чи є приклади інфекційних статистичних даних, які не говорять про населення?


Описова статистика: Монета була кинута десять разів і спускалася головами шість разів. Статистичний умовивід: Максимальна оцінка ймовірності головок становить , або, Ця інформація є недостатньою для відкидання гіпотези про те, що монета - це справедлива монета. 0.6
Діліп Сарват

2
Висновок без поняття "населення": Припустимо, що ваші дані породжуються деяким (частково) невідомим випадковим механізмом / правилом. Інференційні методи дозволяють оцінити властивості цього механізму на основі даних. Приклад: Ви хочете перевірити електрофізичну формулу на основі результатів, які можна виміряти лише приблизно або за недосконалих умов.
Майкл М

1
@Michael: Так; або дійсно змусити ваші дані генеруватися за відомим випадковим механізмом - випадковим призначенням експериментальних методів лікування.
Scortchi

Відповіді:


19

Виходячи з фонових наук про поведінку, я пов'язую цю термінологію особливо з вступними підручниками зі статистики. У цьому контексті різницею є те, що:

  • Описова статистика - це функції вибіркових даних, які невід'ємно цікаві при описі певної особливості даних. Класична описова статистика включає середнє, хв, макс, стандартне відхилення, медіану, перекос, куртоз.
  • Конференційна статистика - це функція вибіркових даних, яка допомагає зробити висновок щодо гіпотези про параметр сукупності. Класична інфекційна статистика включає z, t, , відношення F і т.д.χ2

Важливим моментом є те, що будь-яка статистика, інфекційний чи описовий характер є функцією вибіркових даних. Параметр - це функція сукупності, де термін «сукупність» є таким самим, як і «основний» процес формування даних.

З цього погляду стан заданої функції даних як описової або інфекційної статистики залежить від цілей, для яких ви їх використовуєте.

Однак, деякі статистичні дані явно корисніші для опису відповідних особливостей даних, а деякі цілком підходять для сприяння висновкам.

  • Конференційна статистика: на стандартну статистику тестів, таких як t і z, для даного процесу генерації даних, де нульова гіпотеза помилкова, на очікуване значення сильно впливає розмір вибірки. Більшість дослідників не побачили б таку статистику, як оцінку параметру сукупності, що представляє інтерес.
  • Описова статистика : На відміну від описової статистики оцінюють параметри сукупності, які, як правило, представляють інтерес. Наприклад, середнє значення вибірки та стандартне відхилення дають оцінки еквівалентних параметрів сукупності. Навіть описові статистичні дані, такі як мінімальний і максимальний, надають інформацію про еквівалентні або подібні параметри сукупності, хоча, звичайно, у цьому випадку потрібно набагато більше уваги. Крім того, багато описових статистичних даних можуть бути упередженими або інакше меншими, ніж ідеальні оцінки. Однак вони все ще мають певну корисність для оцінки параметру, який цікавить населення.

Отже, з цієї точки зору, важливі речі, які слід розуміти, це:

  • статистика : функція вибіркових даних
  • параметр : функція сукупності (процес генерації даних)
  • Оцінювач : функція вибіркових даних, що використовуються для надання оцінки параметра
  • умовивід : процес отримання висновку про параметр

Таким чином, ви можете або визначити відмінність між описовим та інфекційним на основі намірів дослідника, використовуючи статистику, або ви могли визначити статистику, грунтуючись на тому, як вона зазвичай використовується.


Як виправдано називати t або F бали (а не, наприклад, t- тести ) інфекційною статистикою?
jona

@jona Оцінка t - це "статистика", яка використовується в t-тесті, тому можна було б описати t-оцінка як інфекційну статистику, коли вона використовується як частина такого інфекційного процесу. Я думаю, я почав з припущення, що статистика є функцією даних. Але, можливо, ви натякаєте на те, що ми часто думаємо про інфекційну статистику як про більш широкий набір методів, що використовуються для висновку?
Джеромі Англім

Дозвольте мені викласти це по-різному - це не t-статистика опису вибірки, а не інфекційного твердження (наприклад, p-значення)?
jona

Ну так, функція даних еквівалентна опису вибірки. Я думаю, я думав, що така статистика використовується в інфекційному процесі (наприклад, дослідники пов'язують t-статистику з t-розподілом, щоб отримати значення p, а потім відносять p до альфа, щоб зробити висновок). Я часто бачив, як підручники використовують ці приклади. Але я припускаю, що p-значення та саме бінарне умовиводство можна розглядати як статистику (тобто функції вибіркових даних). І саме бінарний умовивід можна розглядати як найбільш чітко узгоджений з висновком. Це те, до чого ти потрапляєш?
Джеромі Англім

1
Так, наприклад, ви використовуєте дані, щоб дістатись до t, що пов'язано з розподілом, що дає вам p , що, в свою чергу, дає бінарний висновок про параметр популяції. Таким чином, з точки зору частолістської форми, t, p і бінарний умовивід - це все випадкові змінні. Усі були залучені до інфекційного процесу. Я не впевнений, які плюси і мінуси стосуються маркування всіх або лише деяких таких статистичних даних як інфекційних.
Джеромі Англім

8

Одна з форм висновку заснована на випадковому призначенні експериментальних методів лікування, а не на випадковому відборі з популяції (навіть гіпотетично). Оскар Кемпторн був прихильником.

Перший приклад Edgington (1995), Randomization Tests, добре ілюструє підхід. Дослідник отримує десять предметів, поділяє їх на дві групи навмання, виділяє лікування на одну групу &ABtt10/252=0.04

Прогнозування - ще одна сфера, де вам не обов'язково формулювати пропозиції щодо населення. (Я не знаю, що всі хотіли б назвати прогнозування «висновком», але є Гейзер (1993), Прогнозний висновок: Вступ ). Часто прогнозування випливає з пристосованої моделі населення, але не завжди; наприклад, класифікаційний приклад @ Метта, усереднення моделі (баєсівське або на основі ваг Akaike) або алгоритми прогнозування, такі як експоненціальне згладжування.

NB: Я думаю, що "інфекційна статистика та описова статистика" частіше відноситься до дисципліни "Статистика", а не до кількості, обчисленої на вибірках. Не існує суттєвої різниці між інфекційною та описовою статистикою; як зазначав @Jeremy, справа в тому, в яку користь ви його вкладаєте.


2

Я не впевнений, що класифікація обов'язково складає заяву про сукупність (и), з яких черпаються дані. Класифікація, як ви, мабуть, знаєте, використовує дані тренінгу, що складаються з деяких "функціональних" векторів, кожен з яких позначений певним класом, для прогнозування міток класів, що належать до інших немаркованих векторів ознак. Наприклад, ми можемо використовувати життєві ознаки пацієнта та діагноз лікаря, щоб передбачити, здорові чи хворі інші пацієнти.

Деякі класифікатори, звані "генеративними класифікаторами", намагаються чітко моделювати популяції чи процес генерації даних, який виробляє кожен клас. Наприклад, алгоритм Naive Bayes обчислює для кожного класуP(class=c|features)c

Однак інші класифікатори шукають відмінності між класами без моделювання самих класів; їх називають дискримінаційними класифікаторами. Одним із класичних прикладів є класифікатор найближчого сусіда, який призначає незазначений приклад класу свого найближчого сусіда (де близькість визначено певним чином для проблеми). Це не здається, що воно містить багато, якщо така є, інформації про популяції, з яких були отримані точки даних.

t


0

В одному рядку, з урахуванням даних, описова статистика намагається узагальнити вміст ваших даних з мінімальними втратами інформації (залежно від того, який захід ви використовуєте). Ви можете побачити географію даних. (Щось подібне, дивіться графік продуктивності класу та скажіть, хто вгорі, внизу тощо)

В одному рядку, з урахуванням даних, ви намагаєтеся оцінити та зробити висновок про властивості гіпотетичної сукупності, з якої походять дані. (Щось на кшталт розуміння учнів 7-го класу завдяки хорошій вибірці з класу, припускаючи, що базове населення достатньо велике, що ви не можете їх врахувати в цілому)


3
Я не думаю, що це визначення або характеристика описової статистики, яка спрямована на мінімальну втрату інформації. Цілком можливо мати описову статистику, яка не залишає важливих деталей, і це часто є проблемою.
Нік Кокс

0

Коротко

Описова статистика - це аналіз даних, які описують, показують або узагальнюють дані у змістовному значенні; це просто спосіб описати наші дані / поговорити про все населення. деякі з них - міри центральної тенденції та міра розповсюдження

Конференційна статистика - це техніка, яка дозволяє нам використовувати вибірки для узагальнення популяцій, з яких були взяті зразки. Приклад тестування гіпотез та


0

описова статистика - це аналіз даних, які описують, показують або узагальнюють дані змістовно; це просто спосіб описати наші дані / поговорити про все населення. деякі з них - міри центральної тенденції та міра розповсюдження

Конференційна статистика - це техніка, яка дозволяє нам використовувати зразки для узагальнення популяцій, з яких були взяті зразки.


Ласкаво просимо до перехресної перевірки ! Будь ласка, знайдіть хвилинку, щоб переглянути наш тур . Схоже, ви збиралися закінчити гарну відповідь, але щось сталося. сміливо редагуйте свою відповідь, щоб завершити свою думку. Ви також можете покращити свою відповідь, додавши цитати / посилання, які співпрацюють з тим, що ви тут виклали. Вам також потрібно відповісти на запитання "Чи є приклади інфекційної статистики, які не говорять про населення?"
Таврок
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.