Лівостороння та права бічна номенклатура в регресійних моделях


10

y=β0+β1x1+ε0

Мова для опису регресійних моделей, така як дуже проста лінійна регресія, зазначена вище, часто змінюється, і такі зміни часто несуть тонкі зрушення в значеннях. Наприклад, частина моделі в лівій частині рівняння може називатися (серед інших я не знаю) конотаціями та позначеннями в дужках:

  • Залежна змінна (натяки на причинну залежність)
  • Прогнозована змінна (має на увазі модель прогнозів / робить прогнози)
  • Змінна відповіді (передбачає причинність або принаймні часове послідовність)
  • Змінна результату (передбачає причинність)

Різниця в номенклатурі вірна і в правій частині рівняння (та сама відмова, що я ігнорам щодо інших термінів):

  • Незалежна змінна (передбачає причинний пріоритет, натяки на експериментальну розробку)
  • Змінна предиктора (передбачає прогнози, означає, що змінна має ненульову оцінку параметра, пов'язану з нею)

У ході пропонування перевірки чи спілкування досліджень у мене був привід не просто покликатись на використання того чи іншого терміна, а згодом назвати термін, який я вирішив замінити ним. Хоча люди, котрі дзвонили, звичайно, були педантичними (NB: Я професійний педант, тому я співчуваю), тому що, звичайно, всі ми розуміли, про що повідомляється , я все ще дивуюсь:

Чи є загальновживані терміни для лівої та правої змінних в регресійних моделях, які є агностичними щодо (a) зовнішнього використання моделі, (b) причинно-наслідкових зв’язків між змінними та (c) аспектів дослідження конструкції, що використовуються для виготовлення самих змінних?

NB: Я не запитую про важливі питання належного моделювання та належної інтерпретації (тобто я дуже дбаю про причинність, дизайн дизайну тощо), але мене більше цікавить мова для розмови про такі моделі.

(Я розумію, що "ліві змінні" та "правосторонні змінні", я думаю, можна вважати достовірною відповіддю, але ці терміни здаються незграбними ... можливо, це незграбне питання. :)


З цього приводу не повинно виникати плутанини.
Карл

1
Я думаю, що коротка відповідь - ні. На мій погляд, це є не дарма. У формальних випадках мова, що використовується для ідентифікації змінних, повинна бути достатньо відточеною, щоб мати на увазі чітке тлумачення в межах моделей, призначених для застосування / домену (тобто дуже важливо знати, припускається чи ні причинність у моделі регресії, і правильне використання номенклатури допоможе з цим).
Захарій Блюменфельд

2
@ZacharyBlumenfeld (a) Не відповідайте у коментарях. :) (b) І все ж ми говоримо про «регресію» в загальних рисах, не звертаючись до вивчення дизайну, дисциплінарних областей знань тощо (наприклад, багато людей говорять і пишуть про оцінку найменших квадратів, не посилаючись на дизайн дослідження, причинність тощо). Якщо у нас є прикладно-агностична мова для опису широкого класу статистичних зусиль, чому для компонентів таких починань не існує аналогічно агностичної мови?
Олексій

1
Не впевнений, чи варто це вважати відповіддю, тому я публікую це як коментар: Можливо, є якась термінологія, що виходить із прогнозів (як X(XX)1Xy є проекцією y на Xпростір)? Як і проектори та проектори (я їх зараз складаю, оскільки не пам'ятаю відповідних термінів). Ця термінологія не повинна містити ваших (а), (б) та (в).
Річард Харді

1
@Kenji Я щиро погоджуюся з більшою частиною вашої точки зору. Однак я не погоджуюся, що можна / слід говорити лише про рівняння регресії у застосованому випадку: у нас повинна бути мова, яка може говорити про змінну ліву і праву руку всіх моделей регресії, наприклад, під час вивчення застосування таких методів на метарівні між дисциплінами.
Олексій

Відповіді:


6

Це відмінне запитання. Насправді це так добре, що відповіді на нього немає. Наскільки мені відомо, не існує справжнього «агностичного» терміна для опису Y.

На своєму досвіді та читаннях я виявив, що семантика є доменною, а також модель-цільовою.

Економетрики використовуватимуть залежні змінні терміни при побудові моделі, яка є пояснювальною. Вони можуть використовувати терміни "Прогнозована" або "Пристосована" чи "Оціночна змінна", коли будують модель прогнозування, більш орієнтовану на точну оцінку / прогнозування, ніж на теоретичну пояснювальну силу.

Натовп Big Data / Deep Learning використовує зовсім іншу мову. І вони, як правило, використовують терміни Response змінної або Target змінної. Їх моделі - це такі чорні скриньки, що вони, як правило, не намагаються пояснити явище, а радше його передбачити та точно оцінити. Але якимось чином їх би не спіймали, використовуючи термін "Передбачуваний". Вони набагато віддають перевагу термінам Відповідь або Ціль.

Я менш знайомий із терміном змінної результату. Це може бути поширеним в інших сферах, де я менш піддається впливу таких соціальних наук, як психологія, медицина, клінічні випробування, епідеміологія.

З огляду на вищесказане, я не міг надати вам жодної "агностичної" семантики для опису Я. Натомість я надав трохи інформації про те, який семантичний засіб використовувати при харчуванні для різних аудиторій, а також відображаючи ціль вашої моделі. Підсумовуючи це, я не думаю, що хтось травмується, якщо говорити про залежну змінну з економетриками та змінну Response or Target із типами глибокого навчання. Сподіваємось, ви можете розділити ці натовпи один від одного, інакше у вас може бути словесна боротьба з їжею на руці.


Я хотів би, щоб я міг дати вам додатковий голос за "словесну боротьбу з їжею": D
Алексіс
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.