Які неправильно використані статистичні терміни варто виправити?


103

Статистика є скрізь; Однак загальне використання статистичних термінів часто є незрозумілим.

Терміни ймовірність та коефіцієнти використовуються як взаємозамінні в просторовій англійській мові, незважаючи на їх чітко визначені та різні математичні вирази.

Не відокремлюючи термін ймовірність від ймовірності, звичайно бентежить лікарів, які намагаються кількісно оцінити ймовірність раку молочної залози, отримавши позитивну мамографію: «О, яка дурниця. Я не можу цього зробити. Ви повинні випробувати мою доньку; вона вивчає медицину ».

Не менш поширеним є використання кореляції замість асоціації . Або кореляція, що передбачає причинно-наслідковий зв’язок .

У відомому документальному фільмі " Альберта Гора" Незручна правда " слайд ілюструє співвідношення крижаного ядра та температури, залишаючи додаткову технічну роботу, щоб довести причину від обговорення:CO2

введіть тут опис зображення

ЗАПИТАННЯ: Які статистичні терміни створюють проблеми інтерпретації, коли вони використовуються без математичної суворості, і тому їх варто виправити?


4
Коефіцієнт проти ймовірності серед мирян не здається для мене проблемою, оскільки миряни все одно не будуть їх обчислювати, вони просто говорять, що значення низькі або високі, і два мають прямий кореляційний зв’язок.
Мехрдад

@Mehrdad Я згоден. Власне, в цьому і полягає справа ... чи існує ситуація, коли зловживання цими словами, які були прийняті та затверджені в межах статистики, призводить до проблем. Наприклад, очевидно, що за зміною клімату стоїть важливий комплекс досліджень, але за багатьох інших обставин можна висловлювати помилкові твердження, припускаючи, що кореляція дорівнює причинно-наслідковій причині. У випадку шансів і ймовірностей їх можна перетворити на інші, тому єдиний ризик - це нерозуміння ваших ставок.
Антоні Пареллада

3
@Mehrdad Суть про шанси є цікавою, але я думаю, що це складніше, ніж очі. Коли миряни говорять про шанси, вони зазвичай мають на увазі ігрові шанси, і вони дуже часто виражаються у форматі «шанси проти». Тож у системі, з якою знайома більшість людей, велике значення шансів пов'язане з низькою ймовірністю, хоча для статистиків великі шанси пов’язані з високою ймовірністю. Тому це досить дозріло для плутанини: дивіться також наш пост на тему " Програми, зроблені простими"
Срібна рибка

5
Напевно, варто пам’ятати, що деякі з цих термінів існували в англійській мові (з розрізненим значенням) до того, як вони були присвоєні статистикою та отримали суворі технічні визначення. Трохи конденсується взяти слово, змінити значення, а потім побігти, звинувачуючи інших у неправильному використанні, коли вони просто використовують його зі старим, нетехнічним, визначенням.
RM

Мені дуже не подобається називати тести "post hoc", навіть коли вони плануються заздалегідь. Я думаю, що це почалося з якогось пакета статистики, але він зараз поширений.
Девід Лейн

Відповіді:


101

Боротися з змінами в мові може бути марним. Але

параметр не означає змінну

У класичній статистиці, яка в даному випадку починається саме з Р. А. Фішера, який вперше вжив термін із таким значенням, параметр - це невідома константа, яку слід оцінити, скажімо, середнє значення чи кореляція. У математиці є споріднені, але не однакові значення, як коли параметрично задається крива. У багатьох науках параметр є лише іншим словом для вимірювання (сам термін, щільний з математичним значенням), властивістю або змінною, скажімо, довжиною або провідністю, пористістю або чеснотою, залежно від випадку. Звичайно, довжина або чеснота індивіда невідомі до його вимірювання. але статистично налаштованих людей можна збентежити, коли він використовуватиметься для набору таких вимірювань. У звичайній або вульгарній мові, параметри(майже завжди множина) часто означають межі чогось, скажімо, особистих стосунків чи політичної політики, можливо, що випливають із оригінальної плутанини з периметром . З високою попередньою ймовірністю можна припустити, що байєси будуть говорити самі за себе (вдячний кивок @conjugateprior).

косий не означає упередженого

Протягом століття і більше косостість мала специфічний статистичний сенс посилання на асиметрію розподілів, оцінювати їх графічно, вимірювати чисельно чи вважати теоретично питаннями віри чи надії. Значно довше, або так можна припустити, упередженість означає, що в середньому помиляється, що - поки ми знаємо правду, маючи на увазі справжнє або правильне значення - можна кількісно визначити як систематичну помилку. Скажений звичайною мовою має здоровий сенс викривлення або спотворення, і, таким чином, неправильний, неправильний, а також також упереджений. Цей сенс (наскільки я зауважив, зовсім недавно) почав фільтруватися назад у статистичні дискусії, так що первісне значення косості є в деякій небезпеці розмитись або зануритися.

кореляція не означає згоди

Кореляція залучила кілька точних почуттів у статистиці, які мають спільне уявлення про двовимірне співвідношення, досконале в деякому точному сенсі: провідними випадками є лінійні та монотонні відносини. Він часто розводиться навіть у статистичних дискусіях, щоб означати майже будь-які стосунки чи асоціації. Те, що кореляція не означає, обов'язково, є згода: таким чином, означає, що кореляція Пірсона або тих пір, поки , але угода вимагає дуже суворої умови .у=а+бх1-1б0у=ха=0,б=1

унікальний не означає виразного

Цілком звичайно говорити про окремі значення даних як унікальні , але унікальні все ще в ідеалі краще зберігаються як значення, що виникають лише один раз. Моя власна здогадка полягає в тому, що частина вини походить від утиліти Unix [sic] uniqта її імітаторів, які зводять можливі повторювані значення до набору, в якому кожне значення дійсно є унікальним. Використання, за цим припущенням, співвідносить введення та вихід програми. (І навпаки, якщо ми говоримо про дублікати в даних, ми рідко обмежуємо себе дуплотами, які трапляються точно вдвічі. Термін повторюємав би більше сенсу в лінгвістичному відношенні, але він був попереджений для навмисної реплікації елементів контролю в експериментах; отримані значення відповіді, як правило, зовсім не однакові, що значною мірою.)

зразки рідко повторюються

У статистиці вибірка включає декілька значень, і повторний відбір проб є високою теоретичною чеснотою, але це рідко практикується, за винятком моделювання, що є нашим звичним терміном для будь-якого виду підроблення кремнію . У багатьох науках зразок - це єдиний об'єкт, що складається з грудочки, шматка або краплі води, ґрунту, осаду, гірської породи, крові, тканини чи інших речовин, що відрізняються від привабливих через доброякісні до огидних; далеко не винятковий, взяття багатьох проб може бути суттєвим для будь-якого серйозного аналізу. Тут термінологія кожної галузі має ідеальний сенс для своїх людей, але іноді потрібен переклад.

помилка зазвичай не означає помилку; як зазначав Гарольд Джеффрі, первинне почуття є хаотичним, а не помилковим.

Тим не менш, нам слід остерігатися власних гріхів чи вигадок термінології:

регресія не йде назад

стаціонарний не означає нерухомий або нерухомий

впевненість не має нічого спільного з чиїмсь психічним чи психологічним станом

значення має лише іноді своє повсякденне значення

точний часто є почесним терміном, маючи на увазі зручне простежуване рішення або розрахунок, а не один відповідний проблемі

правильні коси розподіли для багатьох виглядають перекошеними зліва, і навпаки

логнормального так називається , тому що це нормально експоненціруются

але лонормальне є більш нормальним, ніж нормальне

Gaussian був виявлений Муавром

Пуассон не виявив Пуассона , не кажучи вже про регресію Пуассона

самозавантаження не допоможуть вам з вашої взуттям

складаний ніж не ріже

куртоз не є медичним станом

стеблосто-листяні ділянки не відносяться до рослин

фіктивна змінна є корисним, має сенсу або нерозумно

хто на Землі (або деінде) вважає, що гетероседастичність - це справді кращий термін над неоднаковою мінливістю ?

Надійна тепер має щонайменше два основних технічні значення для різних груп, жодна з яких не гальмує її частого використання навіть у технічних дискусіях, щоб означати лише щось на кшталт "стверджується, що добре поводитися".

IV зараз має принаймні два основних значення для різних груп

Фактор зараз має щонайменше два основних значення для різних груп

нормалізація та стандартизація мають незліченно багато значень (нам насправді потрібно стандартизувати там)

проти опису графа означає вертикальну змінну проти горизонтальну змінну , якщо вона не означає протилежну

і (останнє, але не менш важливе значення, щоб створити фразу) статистика має щонайменше три основні значення.

Примітки:

  1. Незважаючи на будь-які видимості навпаки, я вважаю, що це гарне, серйозне питання.

  2. Мода зміщується. Ну а в ХХ столітті, здається, багато людей (жодних імен, жодного патрону, але Карла Пірсона не можна було б згадати) могли вигадувати терміни, лише прагнучи до своїх грецьких та латинських словників. (Було б несправедливо не давати йому кредиту за розсип сюжету .) Але Р. А. Фішер захопив багато раніше існуючих англійських слів, включаючи дисперсію , достатність , ефективність та ймовірність . Зовсім недавно JW Tukey був майстром у використанні домашніх термінів, але мало хто повинен відчувати біду, що спломи та шкідливі вимоги не сприйняли .

  3. Один коментар заснований на спогаді "Життя є [...] Мультипликативним, а не адитивним: нормальний розподіл журналу є більш нормальним, ніж нормальний". Анон. 1962. Правила роботи Блогіна. В "Доброму", І. Дж. (Ред.), Вчений розмірковує: антологія частково висунутих ідей. Лондон: Heinemann, 212-213 (цитата на с.213).


Коментарі не для розширеного обговорення; ця розмова переміщена до чату .
whuber

Гетероскедастичність повністю розгойдує котячу коробку! "Нерівна мінливість?" [Фуа!]) (+1 дуже добре інакше;)
Олексій

1
Можливо, варто додати, що регресійне тестування часто використовується в контексті розробки програмного забезпечення, де, в цілому, йдеться про те, що йде назад.
Конрад

@Konrad Цікаво, але тоді (виправте мене, якщо я помиляюся) (a) це не було б неправильним вживанням слова і (b) слово там не має статистичного сенсу.
Нік Кокс

@NickCox Правильно.
Конрад

33

Деякі речі, з якими я стикаюся:

  1. Трактуйте рівень значущості та ймовірності покриття ІС як взаємозамінні, щоб люди в кінцевому підсумку робили такі речі, як говорять про "95% значимість".

    [Що ще гірше, коли люди, які роблять такі помилки, вказують на свої конспекти лекцій - або навіть підручник - як підтримку цьому; Іншими словами, помилка не є їхньою, а складається в стократну або багатотисячну кратність, а ще гірше, навіть якщо вони правильно її зрозуміли, їм, можливо, доведеться все-таки повторити помилку, щоб передати тему.]

  2. Існує також загальна тенденція думати, що "значимість" якимось чином існує поза конкретною гіпотезою / питанням (що призводить до запитань на кшталт "чи є мої дані вагомими", не маючи чіткого поняття, яке питання слід вирішувати). [Пов'язана проблема - "який тест я повинен використовувати для цих даних?" наче це були дані - а не питання, на яке потрібно відповісти, - це рушій вибору аналізу. (Хоча "дизайн" дослідження може вплинути на конкретні тести, які використовуються, питання, що цікавить, є більш важливим - наприклад, якщо у вас є три групи, але ваше питання, що цікавить, стосується лише порівняння двох з них, той факт, що у вас є три, не змушує вас робити однобічний аналіз типу, а не прямого порівняння двох зацікавлених груп ... до тих пір, поки ваш вибір аналізу не випливає з того, що показують дані. В ідеалі ви плануєте свої запитання та аналізи до того, як отримаєте дані, а не кидаєте аналіз на дані і бачите, які палички, які, здається, питання після аналізу - включаючи "який тест я повинен використовувати для цих даних?" - схильні вести до.)

  3. Епізодична тенденція позначати доповнення p-значення як якусь "впевненість у", або "ймовірність" альтернативи.

  4. "непараметричні дані"; інша, на жаль, знайдена в парі книг (і, на жаль, у статті, яка ніби виправляє загальну помилку) ця ця з'являється так часто, що вона міститься в моєму короткому списку автоматично сформованих коментарів (який починається "Дані не є ні параметричними, ні непараметричні; це прикметники, які застосовуються до моделей чи прийомів ... ") (дякую Ніку Коксу за те, що він нагадав мені саме цього клопа)

    Зазвичай те, що призначено - це "ненормальні дані", але параметричні не означають нормальних, а наявність приблизної нормальності не означає, що нам потрібні параметричні процедури. Так само ненормальність не означає, що нам потрібні непараметричні процедури. Іноді передбачається, що це "порядкові дані" або "номінальні дані", але в жодному випадку це не означає, що кінцево-параметричні моделі є недоречними.

  5. Поширена тенденція неправильного розуміння значення "лінійний" у "лінійній моделі" таким чином, який би не відповідав використанню терміна "лінійна" у "узагальненій лінійній моделі". Це частково є виною того, як ми використовуємо термінологію.

  6. з’єднання середньо-мінусового виду косості з косості третього моменту та поєднання нуля в обох (або навіть обох) із симетрією. Обидві помилки часто зустрічаються в основних текстах, широко використовуваних у деяких конкретних областях застосування. [Існує пов'язана помилка трактування нульової косості та нульового куртозу як надмірної норми]

  7. цей настільки поширений, що стає важче назвати його помилкою (частково завдяки зусиллям певної програми) - надлишок куртозу називається просто "куртозом"; помилка майже гарантовано призведе до проблем із спілкуванням.


2
+1. Хочу нагадати вам гротескні "непараметричні дані", які належать краще в цьому списку, ніж у моєму. Зайвий куртоз - це потворний брат сирого куртозу.
Нік Кокс

@Nick Спасибі, я сидів тут і дивився на свій список, кажучи: "є щось інше, що нас справді дратує, що я знаю, що тут належить". Це одне.
Glen_b

3
Ще один - «статистичний тест» розширився настільки широко, що це стає початковим питанням: який тест я повинен застосувати до своїх даних? часто в переконанні, що буде однозначна відповідь форм "Студентська т", "Манна-Вітні" або "Чі-квадрат". На що моя відповідь частіше, можливо, взагалі немає, або ми повинні уважно переглядати ваші дані та обговорювати, що є вашим справжнім питанням, перш ніж ми можемо подумати над цим.
Нік Кокс

@nick Це стосується мого пункту 2. Цікаво, чи є хороший спосіб розширити цей.
Glen_b

1
Я побоююся, що багато статистичних текстів (здається) заохочують таке мислення.
Нік Кокс

31

" Дані " множини . (У однині - "дата").


2
Ви справді говорите про дату? Зазвичай, ця точка ... ця цінність ..., це спостереження ..., принаймні, тут.
Нік Кокс

5
Дані - це також особливий андроїд, який засвоює дані про людей, за якими він зауважує, щоб дійти висновків даних, що часто керуються даними, часто з жартівливим ефектом.
Метью Друрі

2
Вам доведеться пройти довгий шлях, щоб почути це.
Нік Кокс

5
Для множинних даних потрібна не тільки згода дієслова - "дані є", а не "дані є", але і кількісні показники - "багато даних", а не "багато даних", "менше даних", а не "менше даних". Так мало кому вдається бути послідовним, що це здається втраченою причиною.
Scortchi

5
Незважаючи на роки (най десятиліття) боротьби з цим (мої вчителі латині були б задоволені), я прийшов до погляду, схожого на @ Scortchi's. Але я намагаюся використовувати набір даних слів, де це можливо, особливо під впливом практики StataCorp. Це вирішує деякі труднощі.
Нік Кокс

14

Хоча це і не є строго статистичним терміном, я голосую за відступ ендогенності . Він використовується для позначення всього, починаючи від зворотної причинної зв’язки через заплутаність до відбору та зміщення колайдера, коли всі люди дійсно хочуть зробити, це сказати: "Цей ефект не визначений".


Коментарі не для розширеного обговорення; ця розмова переміщена до чату .
Glen_b

13

"Регресія до середнього значення" не означає, що якщо ми спостерігали певну кількість зразків iid нижче очікуваного значення, наступні зразки iid, ймовірно, будуть вище очікуваного значення.


3
+1 Це важливо. Помітні люди були надзвичайно збентежені цим. Наприклад, популярна книга Пітера Бернштейна про аналіз ризику « Проти богів» . характеризує регресію до середнього різними способами - жоден з них не є правильним.
whuber

10

Відсоток проти відсоткових балів : якщо щось зросте з 1% до 2%, воно збільшиться на 100%. Або: можна сказати, що він збільшився на 1 відсотковий пункт.

Заявивши, що зростання склало 1%, дуже вводить в оману.


7

Я знаходжу абревіатури, які чітко не вказані - справжня проблема. Наприклад, я бачу такі речі, як GLM, і ніде не вказано, якщо це означає загальну лінійну модель або узагальнену лінійну модель. Як правило, можна зрозуміти, на що йдеться після копання у контексті, але я вважаю, що це особливо клопітно для студентів, які тільки починають дізнаватися про статистичні моделі.

Інший приклад цього - IV. Чи означає це інструментальна змінна чи незалежна змінна? Часто це не стає зрозумілим, поки ви не вивчите контекст.

Щось інше, в чому я бачу плутанину, - це "модератор" та "взаємодія". Крім того, населення (як і загалом населення) та зацікавлене населення, схоже, бентежать нових студентів, якщо це не буде чітко зрозуміло.


5
Я також бачив, як GLM використовував для позначення "Глобальні лінійні моделі" деякі в натовпі машинного навчання. Просто додати плутанину щодо вже перевантаженого терміну
Glen_b

1
Я частково підтримую цю відповідь / спостереження. Я думаю, що «Узагальнене» (що б воно не було) слід краще скоротити до Gz, а не до G. Такого, як GzLM (узагальнена лінійна модель).
ttnphns

2
@ttnphns: деякі з нас пишуть узагальнено з s
Генріха

Мені цікаво @ttnphns, яку частину цієї відповіді ви не підтримуєте і чому? Цілком можливо, у мене є щось непорозуміння, тому я хотів би дізнатися більше, якщо у вас є що запропонувати далі. Дякую!
СтатистикаСтуденти

1
Так, я думав, що IV означає "in vitro". = P
Мехрдад

7

Той, що є звичним у повсякденній мові:

середній

Для середньостатистичної людини там (цілком призначена гірка іронія) середнє, медіанне, режим і очікуване значення чого-небудь здаються однаковими. Вони мають природну схильність до точкової оцінки з несвідомим і незаперечним припущенням, що існує основне нормальне розподіл. І однаково несвідоме припущення дуже малої дисперсії. Віра в те, що така оцінка 1) існує і 2) буде дуже корисною для них, оскільки вони можуть сприймати це як практично певний провісник, настільки вкорінена, що переконати їх в іншому неможливо.

Для прикладу в реальному світі спробуйте поговорити з кухарем, який запитує "що таке картопля середнього розміру", абсолютно впевнений, що якщо ви скажете йому номер, він зможе використовувати цей рецепт для будь-якого рецепту, який визначає число картоплі, і вона виходить ідеальною кожного разу. І сердиться на вас, що намагаєтесь сказати йому, що "такої кількості немає". На жаль, це трапляється в ситуаціях із значно більшими ставками, ніж приготування супу.


3
Я думаю, це трохи перебільшено. Наприклад, мільйони, якщо не мільярди людей, здається, мають невеликі труднощі із середніми показниками в спорті.
Нік Кокс

1
@NickCox це, безумовно, залежить від контексту. Особливо обчислення середньої арифметичної для даних не є проблематичним. Я бачив проблеми конкретно в описаних нами випадках, коли їм потрібна бальна оцінка і припускаю, що "середній" дуже точний. Крім того, вони припускають, що цей "середній" буде обчислений як середній, але якщо ви попросите їх пояснити, що вони означають в середньому, вони приблизно описують режим.
румчо

@rumtscho, ти маєш рацію. Джо Середній може схильний думати про середнє як про режим або типовий.
Марк Л. Стоун

Коли люди говорять про "середні" ціни на житло у Великобританії, вони не можуть сказати мені тип середнього, який вони використовують, або якщо вилучені особи були виключені.
Ян Рінроуз

1
Ніщо не говорить про те, що засоби не можуть бути обчислені для мультимодальних розподілів, це просто так часто, це не є найбільшою мірою для опису розподілу. Крім того, я не впевнений, що це зробить чудові речі для іміджу статистиків, щоб сказати всім: "Ви не знаєте, що означає слово" середнє "! а потім, коли вони вказують на визначення словника, ми відповідаємо "Ну, а також словник!"
Кліф АВ

7

Куртоз не вимірює "піку".

Z4|Z||Z|

* Відняти 3 чи ні; це не має жодного значення в цьому питанні.


1
ZZ

1
У мене був греко-кіпрський професор статистики, який вчив нас, що лептокуртик, грецькою мовою, означає «вузькі плечі» або «горбатий». Таким чином, лептокуртичний розподіл (наприклад, Лаплас або подвійне експоненціалі) має меншу масу, ніж гауссівський (з однаковою різницею) у своїх «плечових» областях - і відповідно більше маси в області голови та хвоста. І навпаки, платикуртичний розподіл (наприклад, рівномірний) має більшу масу в плечах і меншу масу в області голови та хвоста, ніж нормальний.
Міко

2
Гарне пояснення слів, але насправді вони не мають нічого спільного з статистикою куртозу, яку розробив Пірсон. Пірсон помилявся, але, використовуючи вигадливі грецькі слова, він змусив інших думати, що він переживає щось глибоке. Його помилка шкодить статистичній освіті та грамотності вже понад 100 років. Дивіться в моєму документі точкові ("лепто") розподіли, де куртоз невеликий, а плоскі ("платині") розподіли, де куртоз майже нескінченний. Куртоз Пірсона нічого не говорить про "лепто" або "платі". ncbi.nlm.nih.gov/pmc/articles/PMC4321753
Пітер

5

Лінійні засоби:

  • у=а+бху=а+бх+cх2у=ахб

  • Лінійний в оцінюваних параметрах. Як і в регресійній моделі (лінійної, логістичної, GLM тощо), тягне за собою суму продуктів скалярних параметрів і незалежних змінних . У цьому відношенні нелінійне означає такі речіу=еа+бх1+еа+бху=а+бх+хмакс(х-θ,0)

  • ут=а+бут-1+cхут-ут-1=а+б(ут-1-хт-х)+c(хт-хт-1)+гхт-1

уха,б,c,гθ


5

Питання полягало у використанні статистичних термінів, які ми повинні ДАВЛЯТИ для виправлення. Я вже 10 років виправляю використання своїх тисячолітніх дітей терміна «випадковий», щоб означати речі, протилежні випадковому. З огляду на те, скільки моїх слухачів намагаються створити випадкову вибірку даних, яка насправді є випадковою, що сталося ще до цього вживання слова, опущення цього терміна в повсякденному сленгу - це криза.

Від OnlineSlangDictionary:

Definition of random


random

adjective
  • несподівано і дивно.
    All of the sudden this guy jumped out from behind the bushes, it was so random!
    The street cleaner never comes down our street. How random.
    
  • несподівано чудово.
    The party was totally random.
    

4

Тут уже занадто багато чудових прикладів, про які згадували Глен та Нік ... не так вже й багато!

Деякі аспекти регресії

  • термін помилки та залишковий (дещо смішно, коли люди пишаються, що їх залишки не співвідносяться з регресорами)

  • прогнозування та оцінка (чи варто ми навіть припиняти розрізняти, коли йдеться про передбачувані випадкові ефекти?)

  • інтервал прогнозування / прогнозування відносно довірчого інтервалу. Я думаю, що існує ймовірність> 0,5, щоб вказати неправильну.

  • регресора (стовпчик у проектній матриці) проти ковариабельного та ін. Особливо в технічних ситуаціях, коли розрізнення є суттєвим, багато людей (включаючи мене), як правило, неточні.


Вибачте, що я розгублений. Чи є різниця між прогнозуванням та оцінкою? Чи можете ви пояснити більше про свої останні два пункти? Дякую!
yuqian

3

Зокрема, у страхових середовищах звичайно використовувати дисперсію для позначення будь-якої різниці, а не середнього рівня різниць у квадраті між кожною точкою даних та середнім набором даних.


6
Я теж зустрічав дисперсію, що використовується в іншому значенні, але зауважте, що дисперсія була існуючим англійським словом, коли Р. А. Фішер захопив її для цієї мети в 1918 році. Отже, це інше використання; статистичні люди не можуть претендувати на право власності на справжнє значення.
Нік Кокс

3

Баєсівський

Студенти, які навчаються цьому, можуть не мати труднощів сказати вам, чи щось виглядає «байєсівською», але попросіть їх вирішити проблему за допомогою частолістського та байєсівського підходу, і вони, ймовірно, не зможуть.

З мого досвіду студентів, в кінцевому підсумку, навчають, що це лише філософська різниця, без конкретного прикладу, який би показував те саме проблема атакується обома підходами.

А тепер запитайте їх, чому хтось може скористатися частістським підходом у їхньому прикладі; найімовірніше, що їх найкращим поясненням стане щось на кшталт "ну, в минулі часи комп'ютерів не існувало ..."


Не могли б ви поділитися своїм поясненням, чому хтось може скористатися частістським підходом? Дякую!
yuqian

4
@yuqian: Так. Для мене важливою частиною є те, що ти робиш це тоді, коли хочеш, щоб люди об'єктивно погоджувалися з тобою. Байєсівські підходи вимагають попередніх розподілів, які за своєю суттю є суб'єктивними, а в реальних проблемах немає єдиного об'єктивно-правильного попереднього ... а це означає, що двоє людей можуть обчислити різні відповіді на одну і ту ж проблему залежно від того, що вони думають, що мають бути їхніми пріорами. При частістському підході такої неоднозначності немає, і це дозволяє об’єктивно порівняти результати з результатами інших.
Мехрдад

2

Ризик

Ризик не означає ймовірність

Ризик - це сума витрат усіх результатів, кожна з цих витрат помножена на ймовірність їх виникнення.

Зазвичай ризик зважується на винагороду - виграш, якого ми прагнемо досягти.

Ось один приклад: наскільки смертоносним є ваш кіловат . Тут ризики - кількість загиблих людей за різні джерела енергії - зважуються із винагородою - тераватними годинами енергії, виробленої цими джерелами енергії.

Так, наприклад: ризик ядерної енергетики не є ймовірністю того, що станеться крах; це ймовірність того, що станеться крах, помножена на кількість людей, які від цього помирають, підсумовується на кількість людей, які помирають від звичайних операцій, помножену на ймовірність того, що операції залишаться нормальними.


4
"Ризик" не має загальновизнаного стандартного визначення. Але, "сума витрат [збитків] усіх результатів, кожна з цих витрат [збитків], помножена на ймовірність їх виникнення" - це визначення очікуваних витрат [збитків]. З іншого боку, ризик, як правило, стосується (несприятливих) відхилень від очікуваних збитків. Отже, ваше визначення - це очікування, тоді як я думаю, що типові визначення ризику стосуються дисперсії.
А. Вебб

Наприклад, коли ми купуємо страховку, метою є зменшення ризику (зменшення впливу малоймовірних подій), але фактичні очікувані витрати вищі для страхувальника, різницею є витрати та прибуток страховика. Екстремальні втрати в хвісті торгуються для більш стійкої вартості премії.
А. Вебб

3
@ A.Webb FWIW, (міжнародне) Товариство з аналізу ризиків визначає ризик як "потенціал для реалізації небажаних, несприятливих наслідків для життя, здоров’я, власності чи навколишнього середовища; оцінка ризику зазвичай базується на очікуваній вартості умовна ймовірність того, що подія відбудеться в рази наслідком події, враховуючи, що вона сталася ". Таким чином, ризик, як видається, має стандартне визначення - і він показує, що ви праві відрізняти ризик від того, як його можна оцінити або виміряти.
whuber

1
П(А)/т

2

Фіксовані ефекти та випадкові ефекти можуть означати різні речі для різних людей. В економетрії фіксовані ефекти насправді випадкові, і коли ви думаєте про це, кожен ефект у статистиці є випадковим, тому називання чогось випадкового не дає жодної змістовної додаткової інформації.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.