Чому проблеми регресії називають проблемами «регресії»?


36

Мені було просто цікаво, чому проблеми регресії називають проблемами «регресії». За якою історією стоїть назва?

Одне визначення для регресії: "Відношення до менш досконалого або розвиненого стану".


1
Дивіться другий параграф розділу "Історія" en.m.wikipedia.org/wiki/Regression_analysis
Марк Уайт

Відповіді:


34

Термін "регресія" вжив Френсіс Галтон у своїй роботі 1886 р. "Регресія до посередності у спадковому зростанні". Наскільки мені відомо, він використовував цей термін лише в контексті регресу до середнього . Потім цей термін був прийнятий іншими, щоб отримати більш-менш значення, яке він має сьогодні як загальний статистичний метод.


15
Галтон отримав лінійне наближення, щоб оцінити зріст сина від росту батька в цьому документі. Його рівняння було встановлено так, що батько середнього зросту мав би сина середнього зросту, але старший батько мав би сина, який вищий за середній на 2/3 від суми його батька. Те саме з коротшими, ніж середні. Це можна стверджувати як просту лінійну регресію (сьогоднішнє значення). І звичайно сьогодні регресія має ще більш широке значення: будь-яка модель робить постійні прогнози. Цікаво, наскільки змінилося його початкове вживання цього слова.
rm999

3
Відповідь NRH правильна. Наступне посилання надає набагато більше подробиць про роботу Френсіса Гальтона "Регресія до посередництва у спадковому статусі
Гаурав

чи настав час для статистичної спільноти слово «регресія» замінити на більш простий і зрозумілий термін, можливо, «формулярний прогноктор»?
Авіад Розенхек

4

На відміну від прогресу, ми повертаємося до середнього значення, тобто регресуємо. Звідси термін регресія! Я думаю, що це щось, що підхопилося і застрягло.


2

@Mark White вже згадував про посилання, але для тих із вас, хто не має багато часу для перевірки посилання, ось точна відповідна відповідь:

Походження "регресії"

Термін "регресія" був введений Френсісом Гальтоном у 19 столітті для опису біологічного явища. Явище полягало в тому, що висота нащадків високих предків має тенденцію до регресу вниз до нормальної середньої величини (явище, також відоме як регресія до середнього) (Галтон, перевиданий 1989 р.). Для Галтона регресія мала лише це біологічне значення (Галтон, 1887) , але згодом його роботи були поширені Удні Юлом та Карлом Пірсоном на більш загальний статистичний контекст (Пірсон, 1903).

Список літератури

https://en.wikipedia.org/wiki/Regression_analysis#History

Галтон, Ф. (1877). Типові закони спадковості. ІІІ. Природа, 15 (389), 512-514.

Галтон, Ф. (перевидано 1989 р.). Спорідненість та кореляція.Статистична наука, 4 (2), 80–86.

Пірсон, К. (1903). Закон спадкової спадщини предків. Біометріка, 2 (2), 211-228.


Регрес Галтона, як і в «регресії до середнього», має сенс. однак я не розумію використання слова «регресія», щоб означати «вивчити формулу від незалежних змінних до змінної результату»
Aviad Rozenhek

1
Це загалом означає, що, але машинне навчання використовує регресію, але регресія не є технікою машинного навчання, незважаючи на поширену, неправильну думку. Статистичне навчання є окремим від машинного навчання, але в цілому прихильники МЛ приймають статистичні методи і неправильно позначають їх як МЛ, тому очевидні невідповідності спливають. Регрес Галтона - це регресія; це стосується моделювання / прогнозування тенденції.
LSC

0

"Регресія" походить від "регресу", що в свою чергу походить від латинського "regressus" - повертатися назад (до чогось).

У цьому сенсі регресія - це техніка, яка дозволяє «повернутися назад» від безладної, важкої для інтерпретації даних, до більш чіткої та змістовної моделі. Як фізику мені подобається ця ідея, оскільки фізики бачать природні явища як численні можливі результати відносно простого природного закону.

Іншими словами, слово регресія, здається, говорить про те, що дані є лише видимим, відчутним ефектом "статистичної моделі". Іншими словами, модель виходить на перше місце, і ваше бажання - використовувати дані "повернутися" до того, що їх виникло.


0

Як мені відомо, слово regressionв статистичному значенні - це вимірювання відношення між середнім значенням однієї змінної та відповідними значеннями інших змінних.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.