Назвіть кілька прикладів анахронічної практики в статистиці?


55

Я маю на увазі практику, яка все ще зберігає свою присутність, хоча проблеми (як правило, обчислювальні), з якими вони були розроблені, в основному вирішуються.

Наприклад, корекція безперервності Йейтса була придумана для того, щоб зблизити точний тест Фішера з тестом, але це вже не практично, оскільки програмне забезпечення тепер може обробляти тест Фішера навіть з великими зразками (я знаю, це може бути не гарним прикладом "збереження його" присутність ", оскільки підручники, як категоричний аналіз даних Агресті , часто визнають, що" корекція Йейта "більше не потрібна").χ2

Які ще є приклади такої практики?


Я насправді не настільки впевнений, що тест на квадрат чи був застарілий наявністю обчислювальної потужності для виконання точного тесту Фішера, наприклад, чи справді ваші маргінали виправлені? Дивіться цю відповідь на інше питання, наприклад, від @gung. (Я майже впевнений, що у нас є тема, що обговорює цю проблему більш детально, але я не можу її знайти, оскільки у нас багато ", чи слід використовувати чі-квадрат, чи слід використовувати точний тест Фішера", яке з'являється, коли Я шукаю!)
Срібляста рибка

@Silverfish: Я не мав на увазі, що став застарілим, лише коригування Йейтса. Я вважаю, що дослідження показали, що корекція Йейтса занадто консервативна, коли рамки не визначені. Стаття Майкла Хабера « Корекція безперервності та статистичні випробування» надала огляд. χ2
Франциск


використання OLS замість LAD?
PatrickT

5
@PatrickT: У мене багато проблем, називаючи OLS анахронічним. Звичайно, є особливі випадки, коли LAD явно перевершує ... але те ж саме можна сказати і в іншому напрямку.
Кліф АВ

Відповіді:


49

P=0.05P=0.01P

P

Я зазначу, що я тут торкаюся хитромудрої та суперечливої ​​проблематики, в якій зосереджуються цілі книги та, мабуть, тисячі паперів, але це здається справедливим прикладом для цієї теми.


4
Чудовий приклад! Для довідки цей потік варто згадати: Щодо p-значень, чому 1% та 5%? Чому б не 6% чи 10%?
Френсіс

5
@ JM Я на 95% впевнений, що ти прав, хоча я не впевнений у 99%.
Марк Л. Стоун

5
α=0.038561

4
@CliffAB Я не думаю, що головним моментом точного P-значення є те, що ви вирішите, що воно є критичним рівнем, який ви хочете прийняти для прийняття рішення. Я, звичайно, цього не пропоную чи виступаю. Частина аргументу полягає не лише в тому, що 0,05 та 0,01 є найкращими звичайними рівнями, але тести дають один спосіб оцінити достовірність доказів проти нульової гіпотези, а не приймати двійкове рішення. На практиці рівні 0,05 та 0,01 залишаються дуже широко використовуваними у багатьох сферах.
Нік Кокс

4
@ Nick Cox І не забудьте рівень 0,1 для неспокійної натовпу.
Марк Л. Стоун

24

Один із методів, на який я думаю, що багато відвідувачів цього сайту погодиться зі мною - поетапна регресія. Це все ще робиться весь час, але вам не доведеться далеко шукати експертів на цьому сайті, які говорять про його використання. Метод на зразок LASSO є більш переважним.


4
ХА !! Ви рекомендуєте замінити анахронізм (поетапну регресію) анахронізмом наступного покоління (LASSO), який є анахронізмом свого часу, прихильники якого ще не усвідомлюють цього. Дивіться stats.stackexchange.com/questions/162861/… .
Марк Л. Стоун

3
@ MarkL.Stone: Ей, чоловіче, принаймні 20 років у правильному напрямку. Я не так знайомий з цими методами, тому мені доведеться прочитати їх, перш ніж я міг би дати їм своє схвалення.
Кліф АВ

2
Швидко прочитавши статтю, я трохи вагаюся, щоб вирішити, що LASSO офіційно застаріла, хоча це, очевидно, не завжди є оптимальним вибором. Можливо, через 5 років мені буде зручніше називати LASSO застарілим.
Кліф АВ

2
@amoeba: Я думаю, Марк має на увазі практику використання LASSO як інструменту найкращої регресії підмножини. Наприклад, я туманно згадую, як читав, коли хтось обговорював спочатку підгонку LASSO, а потім повторно встановлював не пенізовану модель, використовуючи ненульові параметри регресії. Найкраща регресія підмножини може бути більш прямим способом зробити це (хоча, як ви кажете, незрозуміло, що це гарна ідея, навіть якщо це те, що хоче робити аналітик ).
Кліф АВ

2
... і в роботі представлено щонайменше одну ситуацію (тобто моделювання за певними параметрами), коли це чітко виявляється, виконує LASSO, хоча, я думаю, ми всі точно знаємо, наскільки серйозно ми повинні сприймати такі результати самі.
Кліф АВ

17

Я вважаю, що принаймні в (прикладної) економетрії все більше є нормою використання міцної або емпіричної матриці коваріації, а не "анахронічної практики" покладання (асимптотично) на правильну специфікацію коваріаційної матриці. Звичайно, це не без суперечок: подивіться деякі відповіді, які я зв'язав тут у CrossValided, але це, безумовно, чітка тенденція.

E[uu]=σ2In

Інші приклади включають дані на панелі, Імбенс та Вулдрідж пишуть, наприклад, у своїх слайдах лекцій заперечують проти використання матриці коваріації дисперсії випадкових ефектів (неявно припускаючи деяку помилку в компоненті дисперсії за замовчуванням):

σc2σu2

Використовуючи узагальнені лінійні моделі (для розподілів, що належать до експоненціальної родини), часто рекомендується використовувати завжди так званий сендвіч-оцінювач, а не покладатися на правильні припущення щодо розподілу (анахронічна практика тут): див., Наприклад, цю відповідь або Кемерон з посиланням підраховувати дані, оскільки псевдомаксимальна ймовірність може бути досить гнучкою у випадку неправильної специфікації (наприклад, використання Пуассона, якщо негативний біноміал був би правильним).

Такі [білі] стандартні виправлення помилок повинні бути зроблені для пуассонової регресії, оскільки вони можуть зробити набагато більшу різницю, ніж аналогічні корекції гетерокедастичності для OLS.

Грін пише у своєму підручнику у розділі 14 (доступний на своєму веб-сайті), наприклад, із критичною запискою та детальніше описує переваги та недоліки цієї практики:

В сучасній літературі існує тенденція регулярно обчислювати цей [сендвіч] оцінювач, незалежно від функції ймовірності. честь, якщо ймовірність функції неправильно визначена, а інші умови для оцінки M не виконані.


4
Цікаво, але питання полягає в тому, що є анахронічним, а не тим, що зараз стає все більш стандартним, тому відповідь потрібно перевернути.
Нік Кокс

1
Привіт Нік, дякую за ваш коментар (і ваші правки), я змінив текст, щоб виділити те, що є анахронічною практикою, сподіваюся, що це стане трохи зрозумілішим. Я не перевернув весь текст, оскільки колишня практика близька до того, щоб нічого не робити спеціально щодо стандартної помилки.
Arne Jonas Warnke

У деяких випадках не є природним і не можливо використовувати надійні альтернативи, скажімо, часові ряди. Тому я думаю, що він не стає "більш популярним", а просто "більш популярним в деяких областях".
Генрі.L

13

m>1mm=1

m=30


Прийшов сюди, щоб опублікувати це. Також: Я не переконаний, що існує ситуація, коли FWER віддасть перевагу ще новішим методам FDR (через масштабованість та адаптованість).
Олексій

13

Більшість анахронічних практик, ймовірно, пов'язані з тим, як навчають статистику, і тим, що аналізи проводяться величезною кількістю людей, які пройшли лише пару базових занять. Ми часто навчаємо набір стандартних статистичних ідей та процедур, оскільки вони утворюють логічну послідовність зростаючої концептуальної витонченості, яка має сенс педагогічно (пор., Як ми можемо дізнатись відхилення чисельності населення? ). Я сам в цьому винен: я час від часу викладаю статистику 101 і 102, і постійно кажу: "Є кращий спосіб зробити це, але це виходить за межі цього класу". Для тих студентів, які не виходять за рамки вступної послідовності (майже всіх), їм залишаються основні, але замінені, стратегії.

  1. На прикладі статистики 101, мабуть, найпоширенішою анахронічною практикою є перевірка деякого припущення, а потім проведення традиційного статистичного аналізу, оскільки тест був несуттєвим. Більш сучасним / просунутим / захищаючим підходом було б використовувати метод, надійний до цього припущення з самого початку. Деякі довідки для отримання додаткової інформації:

  2. Для статистичних прикладів 102, будь-яка кількість моделювальних практик застаріла:

    • Yp
    • Y
    • Використання полінома вищого порядку для зйомки кривизни та кубічних сплайнів.
    • pR2
    • За допомогою даних повторних вимірювань класифікуйте безперервну змінну, щоб можна було використовувати rmANOVA або усереднювати кілька вимірювань порівняно з лінійною змішаною моделлю.
    • І т.д.

Сенс у всіх цих випадках полягає в тому, що люди роблять те, чого вчили спочатку у вступному класі, оскільки вони просто не знають більш прогресивних і відповідних методів.


5

Дуже цікавим прикладом є одиничні кореневі тести в економетриці. Незважаючи на те, що є багато варіантів для тестування проти або для одиничного кореня в поліномі лагу часового ряду (наприклад, (Доповнений) тест Діккі Фуллера або тест KPSS), проблему можна повністю усунути, коли використовується байєсівський аналіз . Сімс вказав на це в своїй провокаційній роботі під назвою Understanding Unit Rooters: Helicopter Tour з 1991 року.

Кореневі тести одиниці залишаються дійсними і використовуються в економетриці. Хоча я особисто пояснюю це тим, що люди неохоче підлаштовуються під байєсівські практики, багато консервативні економетрики захищають практику опробованих кореневих тестів, кажучи, що байєсівський погляд на світ суперечить передумові економетричного дослідження. (Тобто економісти думають про світ як місце з фіксованими параметрами, а не випадковими параметрами, якими керується деякий гіперпараметр.)


5
Мені було б цікаво коротке обговорення того, як байєсівські практики обходять ці випробування. Іншими словами, як би ви поставили справу до цієї вимоги?
Мистер Хантер

Я мушу визнати, що минув час, коли я прочитав статтю, але головний момент полягає в тому, що, використовуючи рівне перед Байєсовим аналізом часового ряду, можна використовувати стандартні значення t.
Єремія К

5

Сплата ліцензійних платежів за високоякісні статистичні системи програмного забезпечення. #R


1

Навчання / проведення двосторонніх тестів на різницю без одночасного тестування на еквівалентність у частістській царині тестування гіпотез є глибокою прихильністю до зміщення підтвердження .

Існує певний нюанс, оскільки відповідний аналіз потужності з продуманим визначенням розміру ефекту може захищати це і надавати більш-менш однакові умовиводи, але (a) аналіз потужності так часто ігнорується при поданні висновків, і (b) I наприклад, ніколи не бачили аналізу потужності, наприклад, для кожного коефіцієнта, оціненого для кожної змінної в декількох регресіях, але це досить просто для комбінованих тестів на різницю та тестів на еквівалентність (тобто тестів на відповідність).


0

Використовуючи негативну біноміальну модель, а не (надійну) модель Пуассона, щоб визначити параметр, що цікавить змінну підрахунку, лише тому, що є надмірна дисперсія?

Дивіться як довідку: https://blog.stata.com/2011/08/22/use-poisson-rather-than-regress-tell-a-friend/

Доказ того, що Пуассон є більш надійним у випадку фіксованих ефектів, є доволі недавним, оскільки він посилається на: Вулдрідж, Дж. М., «Оцінка без розподілу деяких нелінійних моделей панельних даних», Journal of Econometrics 90 (1999), 77–97.


-6

Ось кілька анахронізмів:

  • Неоплатонічне припущення про те, що в теоретичному ефірі є одне, "справжнє" населення, яке є вічним, нерухомим і непорушним, проти якого можна оцінити наші недосконалі зразки, мало що сприяє навчанню та знанню.

  • Редукціонізм, притаманний таким мандатам, як бритва Оккама, не відповідає часам. АБО можна підсумувати як "Серед конкуруючих гіпотез слід обрати ту, яка має найменше припущення". До альтернатив можна віднести " Принцип множинних пояснень " Епікура , який приблизно говорить: "Якщо більш ніж одна теорія узгоджується з даними, зберігайте їх усі".

  • Вся система експертного огляду відчайдушно потребує капітального ремонту.

* Редагувати *

  • З масивними даними, що містять десятки мільйонів функцій, більше немає потреби в змінній фазі вибору.

  • Крім того, інфекційна статистика є безглуздою.


Коментарі не для розширеного обговорення; ця розмова перенесена в чат .
whuber
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.