Взагалі я стандартизую свої незалежні змінні в регресіях, щоб правильно порівняти коефіцієнти (таким чином вони мають однакові одиниці: стандартні відхилення). Однак, використовуючи дані панелі / поздовжні, я не впевнений, як мені стандартизувати свої дані, особливо якщо я оцінюю ієрархічну модель.
Щоб зрозуміти, чому це може бути потенційною проблемою, припустимо, у вас індивідів, виміряних по t = 1 , … , T періодів, і ви виміряли залежну змінну, y i , t та одну незалежну змінну x i , t . Якщо ви запустили повну регресію об'єднання, тоді нормально стандартизувати свої дані таким чином: x . z = ( x - середнє ( x ) ) / sd ( ) , оскільки це не змінить t-статистику. З іншого боку, якщо вам підходить необгрунтована регресія, тобто одна регресія для кожної людини, ви повинні стандартизувати свої дані лише для окремих осіб, а не для всього набору даних (у коді R):
for (i in 1:n) {
for ( t in 1:T) x.z[i] = (x[i,t] - mean(x[i,]))/sd(x[i,])
}
Однак якщо ви підходите до простої ієрархічної моделі з різним перехопленням у людей, тоді ви використовуєте оцінювач усадки, тобто ви оцінюєте модель між об'єднаною та необгрупованою регресією. Як я повинен стандартизувати свої дані? Використання цілих даних, як об'єднана регресія? Використовуючи лише окремих осіб, як у випадку, якщо це не є об'єднаним?