Вам потрібно ґрунтовний огляд методу регресії. Однак ці питання є достатньо елементарними (не сприймайте це неправильно), що навіть хороший огляд базової статистики, можливо, вам піде на користь. Хоуелл написав дуже популярний підручник, який забезпечує широку концептуальну основу, не вимагаючи щільної математики. Можливо, варто того, щоб прочитати його. Тут неможливо висвітлити весь цей матеріал. Однак, я можу спробувати вас розпочати з деяких ваших конкретних питань.
По-перше, дні тижня включаються за допомогою схеми кодування. Найпопулярнішим є кодування 'довідкової категорії' (зазвичай його називають фіктивним кодуванням). Давайте уявимо, що ваші дані представлені в матриці, а ваші регістри - у рядках, а ваші змінні - у стовпцях. У цій схемі, якби у вас було 7 категоричних змінних (наприклад, для днів тижня), ви додали б 6 нових стовпців. Ви б обрали один день як опорну категорію, як правило, ту, яку вважають за замовчуванням. Часто про це повідомляють теорія, контекст або дослідницьке питання. Я не маю уявлення, що було б найкраще для днів тижня, але це теж не дуже важливо, ви можете просто вибрати будь-який старий. Після того, як у вас є довідкова категорія, ви можете призначити інших вашим новим 6 змінним, тоді ви просто вкажете, чи отримана ця змінна для кожного випадку. Наприклад, скажіть, що ви вибрали неділю як референтну категорію, ваші нові стовпці / змінні будуть понеділок-субота. Кожне спостереження, яке відбулося в понеділок, позначатиметься знаком "a"1010
З давніх пір я дивився на те, як Excel робить статистику, і не пам'ятаю це дуже чітко, тому хтось інший, можливо, зможе вам більше допомогти. На цій сторінці, схоже, є інформація про специфіку регресії в Excel. Я можу розповісти вам трохи більше про статистику, яку зазвичай повідомляють у регресійних результатах:
- r1
- rrrrr
- rr × r10r1R21rR2) сильно зміщений при множинній регресії. Тобто, чим більше прогнозів ви додасте до своєї моделі, тим вище ця статистика піде, чи є стосунки чи ні. Таким чином, вам слід бути обережними щодо їх тлумачення.
- тЖ
- p
- тЖpЖ1Ж
- ЖЖ
Останнє, що варто підкреслити, - це те, що цей процес не може бути відокремлений від його контексту. Щоб добре проаналізувати дані, ви повинні пам’ятати свої основні знання та дослідницьке питання. Я нагадав на це вище щодо вибору референтної категорії. Наприклад, ви зазначаєте, що розмір взуття не повинен бути актуальним, але для Flintstones це, мабуть, було! Я просто хочу включити цей факт, тому що він часто здається забутим.