Спираючись на попередні коментарі щодо переповнення стека:
Так, це має сенс. Тут я звертаюсь із загальним питанням і радо дозволю експертам R дописати найважливіші деталі. На мою думку, оскільки це зараз є перехресним підтвердженням, ми не повинні надто вузько зосереджуватися на улюбленому програмному забезпеченні плаката, хоча це важливо для однодумців.
Дати в будь-якому програмному забезпеченні, якщо не числові, можна перетворити на числові змінні, виражені в роках, днях, мілісекундах або тому, що починається з певного часу. Коефіцієнт, пов'язаний з кожною датою, має одиниці знаменника, які є будь-якими одиницями дати. Одиниці чисельника залежать від одиниць відповіді або залежної змінної. (Природні функції зв’язку без ідентичності ускладнюють це, природно.)
Однак зазвичай має найбільше сенс, коли дати зміщуються на походження, яке має сенс для дослідження. Зазвичай, але не обов'язково, походження має бути датою протягом періоду навчання або дуже близькою до неї.
Мабуть, найпростіший випадок - лінійна регресія за змінною дати у роках. Тут регрес деяких response
з date
виражених як дат, таких як 2000 або 2010, передбачає перехоплення, яке є значенням response
у році 0. Відміняючи деталі календаря, що такого року не було, такий перехоплення часто є абсурдно великим позитивним чи негативним, що є логічне, але відволікання в інтерпретації та викладі (навіть добре обізнаній аудиторії).
У реальному прикладі роботи зі студентами магістратури кількість циклонів на рік у певній області з часом збільшувалася незначно, і лінійна тенденція виглядала розумною першою оцінкою. Перехоплення від регресії було великим негативним числом, що спричинило багато спантеличення, поки не було зрозуміло, що це, як завжди, екстраполяція до року 0. Переміщення походження на 2000 рік дало кращі результати. (Власне, регресія Пуассона, що забезпечує позитивні прогнози, була ще кращою, але це вже інша історія.)
date - 2000
Таким чином, хороша ідея регресує на тому чи іншому. Змістовні деталі дослідження часто вказують на хорошу базову дату, тобто нове походження.
Використання інших моделей та / або інших прогнозів не підриває цей принцип; це просто затьмарює це.
Це також гарна ідея графікувати результати, використовуючи будь-які дати, які найпростіше думати. Це можуть бути початкові дати; це не суперечність, оскільки це лише той самий принцип використання того, що найпростіше думати.
Невелика думка показує, що принцип набагато більш загальний. Нам часто краще (вік - 20 років) чи щось подібне, щоб уникнути логічних, але незручних прогнозів для 0 років.
EDIT 21 березня 2019 р. (Оригінал 29 липня 2013 р.): Ці аргументи були обговорені в контексті Stata у Кокс, Нью-Джерсі 2015 р. Види походження. Stata Journal 15: 574-587
дивіться тут
EDIT 2 також 4 грудня 2015 р. @Whuber в коментарях порушує також важливу проблему числової точності. Часто одиниці часу є нормальними, а отримані дати або дати можуть бути дуже великими, викликаючи важливі питання щодо сум квадратів тощо, тощо. Він наводить приклад з Р. До цього ми можемо додати (наприклад), що дати в часі Stata становлять мілісекунди з початку 1960 року. Ця проблема зовсім не характерна для дат, оскільки вона може виникати, як правило, із великими числами або дуже маленький, але варто також позначити.