Різниця між усередненням даних, що підходять, та розміщенням даних, а потім усередненням


10

Якщо є, між пристосуванням рядка до декількох окремих "експериментів", то усередненням пристосувань або усередненням даних із окремих експериментів, то підходом усереднених даних. Дозвольте мені детальніше:

Я виконую комп'ютерне моделювання, яке генерує криву, показану нижче. Ми витягуємо величину, давайте назвемо її "А", встановивши лінійну область ділянки (тривалий час). Значення - це просто нахил лінійної області. Звичайно, є помилка, пов'язана з цією лінійною регресією.

Зазвичай ми виконуємо 100 моделей цих моделей з різними початковими умовами, щоб обчислити середнє значення "A". Мені сказали, що краще середні вихідні дані (на графіку нижче) розділити на групи, наприклад, 10, а потім підходити до "А" та оцінювати ці 10 "А" разом.

Я не маю інтуїції щодо того, чи є якась заслуга в цьому, чи це краще, ніж підходити до 100 індивідуальних значень "А" і усереднювати їх.

дані


Я не впевнений, що я розумію: ви вимірюєте А в різні моменти часу, а потім оцінюєте ? Тоді ви робите це кілька разів, і ви берете середнє значення всіх ? A=β0+β1tβ1

Вибач, ні. Наведений сюжет є результатом єдиного моделювання (назвемо це експериментом). Початкову нелінійну область відкидаємо, потім підводимо лінію до лінійної частини і отримуємо нахил, "А". Таким чином, одне ціле моделювання дає єдину оцінку "А". Звичайно, моє запитання обертається навколо того, чи усереднення багатьох сюжетів, то обчислення А чи відрізняється від просто обчислення А для купу сюжетів та їх усереднення. Надія, яка прояснює.
pragmatist1

1
Я не бачу, чому це має значення? (якщо припущення для лінійної регресії виконуються)

Я здогадуюсь, що примірник ніколи не помиляється / не сходить / не дає смішно крутих оцінок завдяки експериментам, кожен з яких малий? У цьому може допомогти поєднання перших (або ієрархічних моделей).
Бьорн

1
Ви також можете вмістити всі дані разом, але включити якийсь компонент для розмежування експериментів (різні перехоплення для кожного експерименту чи навіть різні схили), щось на зразок лінійного змішаного модельного підходу. Таким чином ви зможете наблизити загальний нахил, але зможете виявити будь-які "пакетні" ефекти або відмінності між експериментами
bdeonovic

Відповіді:


2

Уявіть, що ми перебуваємо в контексті даних панелі, де є різниця в часі та в різних фірмах . Розгляньте кожен часовий період як окремий експеримент. Я розумію ваше запитання як еквівалентно для оцінки ефекту, використовуючи:i ttit

  • Різниця поперечного перерізу середніх часових рядів.
  • Середні часові ряди варіації поперечного перерізу.

Відповідь взагалі - ні.

Установка:

У моїй постановці ми можемо розглядати кожен часовий період як окремий експеримент.t

Скажімо, у вас є врівноважена панель довжиною над фірмами. Якщо ми розбиваємо кожен проміжок часу тощо ..., ми можемо записати загальні дані у вигляді:n ( X t , y t )Tn(Xt,yt)

Y=[y1y2yn]X=[X1X2Xn]

Середня кількість приладів:

1Ttbt=1Tt(XtXt)1Xtyt=1TtSt1(1nixt,iyt,i)where St=1nixt,ixt,i

Підбір середніх показників:

Це взагалі не дорівнює оцінці, що базується на зміні середнього перерізу часових рядів (тобто між оцінкою).

(1nix¯ix¯i)11nix¯iy¯i

Де тощо ...x¯i=1Ttxt,i

Об'єднана оцінка OLS:

Щось, можливо, було б корисно подумати - це об'єднана оцінка OLS. Що це? Потім використовуємо

b^=(XX)1XY=(1nTtXtXt)1(1nTtXtyi)
bt=(XtXt)1Xtyi
=(1нТтХт'Хт)-1(1нТтХт'Хтбт)

Давайте і - наші оцінки за повним зразком і за період відповідно. Тоді ми маємо:S=1нТiХ'ХSт=1нХт'ХтЕ[хх']т

б^=1Тт(S-1Sт)бт

Це на зразок середнього значення для різних часових оцінок , але це трохи інакше. У певному вільному сенсі ви надаєте більше ваги періодам із більшою дисперсією змінних правої сторони.бт

Особливий випадок: змінні правої частини є інваріантними за часом та твердими особливостями

Якщо змінні правої сторони для кожної фірми є постійними протягом часу (тобто для будь-яких і ), тоді для всіх і у нас буде:iХт1=Хт2т1т2S=Sтт

б^=1Ттбт

Веселий коментар:

Це справа Fama та Macbeth, коли вони застосовували цю техніку усереднення оцінок поперечного перерізу для отримання послідовних стандартних помилок при оцінці того, як очікувана дохідність змінюється залежно від коваріації фірм з ринком (або інших факторових навантажень).

Процедура Fama-Macbeth - це інтуїтивно зрозумілий спосіб отримати послідовні стандартні помилки в контексті панелі, коли терміни помилок співвідносяться в поперечному перерізі, але не залежать від часу. Більш сучасна методика, яка дає подібні результати, - це кластеризація в часі.


1

(Примітка. У мене недостатньо репутації для коментарів, тому я публікую це як відповідь.)

На конкретне поставлене запитання відповідь fcop правильна: підміняти середнє значення є таким же, як усереднення підходів (принаймні для лінійних найменших квадратів). Однак варто зазначити, що будь-який із цих наївних " онлайн " підходів може дати необ'єктивні результати, порівняно з вміщенням усіх даних одразу. Оскільки обидва рівноцінні, я зупинюсь на підході "підходити до середнього". За суті, підгонки усереднених кривих ігнорує відносну невизначеність в значень між різними точками. Наприклад, якщо , , а , тоу¯[х]=у[х]уху1[х1]=у2[х1]=2у1[х2]=1у1[х2]=3у¯[х1]=у¯[х2]=2 , але будь-яка притаманна крива повинна піклуватися про невідповідність у порівняно з .х 2х1х2

Зауважте, що більшість наукових програмних платформ повинні мати інструменти для обчислення / оновлення справжнього "онлайн" найменшого розміру квадратів (відомого як рекурсивні найменші квадрати ). Тож можна використовувати всі дані (якщо це бажано).


1
Відповідь, опубліковану fcop, видалено. Ви можете трохи змінити свою відповідь
Glen_b -Встановіть Моніку
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.