Я маю на увазі, що деякі з цих змінних сильно співвідносяться між собою. Як / чому / в якому контексті ми визначаємо їх як незалежні змінні?
Я маю на увазі, що деякі з цих змінних сильно співвідносяться між собою. Як / чому / в якому контексті ми визначаємо їх як незалежні змінні?
Відповіді:
Якщо ми відступимо від сьогоднішнього акценту на машинному навчанні та згадаємо, наскільки статистичний аналіз був розроблений для контрольованих експериментальних досліджень, то фраза "незалежні змінні" має багато сенсу.
У контрольованих експериментальних дослідженнях вибір лікарського засобу та його концентрації, або вибір добрива та його кількість на акр, дослідник робить самостійно . Цікаво, що залежність змінної реакції (наприклад, артеріального тиску, врожаю) залежить від цих експериментальних маніпуляцій. В ідеалі характеристики незалежних змінних чітко визначені, фактично не мають помилок у пізнанні їх значень. Тоді стандартна лінійна регресія, наприклад, моделює різниці між значеннями залежних змінних з точки зору значень незалежних змінних плюс залишкових помилок.
Той самий математичний формалізм, який застосовується для регресії в контексті контрольованих експериментальних досліджень, також може бути застосований до аналізу спостережуваних наборів даних з малоекспериментальним маніпулюванням, тому, мабуть, не дивно, що фраза "незалежні змінні" перейшла до таких типів дослідження. Але, як зазначають інші на цій сторінці, це, мабуть, невдалий вибір, з "прогнозовами" або "можливостями", більш підходящими в таких контекстах.
Я погоджуюся з іншими відповідями тут, що "незалежний" та "залежний" - це погана термінологія. Як пояснює ЕдМ , ця термінологія виникла в контексті контрольованих експериментів, коли дослідник міг встановлювати регресори незалежно один від одного. Є багато кращих термінів, які не мають цієї завантаженої причинної конотації, і на мій досвід, статистики, як правило, віддають перевагу більш нейтральним термінам. Тут вживається багато інших термінів , включаючи такі:
Особисто я використовую терміни пояснювальні змінні та змінну відповідей, оскільки ці терміни не мають конотації статистичної незалежності чи контролю тощо. (Можна стверджувати, що "відповідь" має причинну конотацію, але це досить слабка конотація, тому я не вважають це проблематичним.)
Щоб додати відповіді Френка Гаррелла та Пітера Флома:
Я згоден, що називати змінну "незалежною" чи "залежною" часто вводити в оману. Але деякі люди все одно так роблять. Я колись почув відповідь, чому:
"Залежний" і "незалежний" можуть бути заплутаними термінами. Одне сенс - псевдокаузальний або навіть причинний, і це той, що мається на увазі під час висловлення "незалежна змінна" та "залежна змінна". Ми маємо на увазі, що DV у певному сенсі залежить від IV. Так, наприклад, моделюючи співвідношення зросту і ваги у дорослих людей, ми говоримо, що вага - це DV, а зріст - IV.
Це дійсно фіксує те, чого не має "провісник", а саме - напрямок відносин. Зріст прогнозує вагу, але вага також передбачає зростання. Тобто, якби вам сказали відгадати зріст людей і їм сказали їх вагу, це було б корисно.
Але ми б не говорили, що висота залежить від ваги.
Виходячи з вищенаведених відповідей, так, я згоден, що ця залежна і незалежна змінна є слабкою термінологією. Але я можу пояснити той контекст, в якому він використовується багатьма з нас. Ви говорите, що для загальної проблеми регресії у нас є змінна вихідна величина, скажімо Y, значення якої залежить від інших вхідних змінних, скажімо, x1, x2, x3. Ось чому його називають "залежною змінною". І точно так само в залежності від цього контексту тільки , і просто диференціюються між виходом і входом змінної, x1, x2, x3, називаються незалежної змінної. Тому що на відміну від Y це не залежить від будь-якої іншої змінної (Але так, ми тут не говоримо про залежність від себе.)
Незалежні змінні називаються незалежними, оскільки вони не залежать від інших змінних. Наприклад, розглянемо проблему прогнозування цін на будинки. Припустимо, у нас є дані про house_size, розташування та house_price. Тут house_price визначається залежно від розміру і розміру будинку, але розмір і розмір будинку можуть змінюватись для різних будинків.