Запитання з тегом «centering»

Центрування передбачає віднімання загальної середньої оцінки вибірки від початкової оцінки; стандартизація робить те ж саме з подальшим поділом на загальну стандартну відхилення вибірки.

7
Коли ви проводите множинні регресії, коли слід зосереджувати свої прогнозні показники, а коли їх стандартизувати?
У деякій літературі я читав, що регресія з декількома пояснювальними змінними, якщо вони є в різних одиницях, потрібно стандартизувати. (Стандартизація полягає у відніманні середнього значення та діленні на стандартне відхилення.) У яких інших випадках мені потрібно стандартизувати свої дані? Чи є випадки, коли я повинен зосереджувати лише свої дані (тобто, …

1
Як центрування даних позбавляється від перехоплення в регресії та PCA?
Я постійно читаю про випадки, коли ми центруємо дані (наприклад, з регуляризацією або PCA), щоб видалити перехоплення (про що йдеться в цьому питанні ). Я знаю, що це просто, але мені важко інтуїтивно зрозуміти це. Чи міг би хтось надати інтуїцію чи довідку, яку я можу прочитати?

1
Як центрування впливає на значення PCA (для розпаду SVD та власних властивостей)?
Яку різницю мають центрирування (або де-значення) ваших даних для PCA? Я чув, що це полегшує математику або що перешкоджає домінуванню на першому ПК засобами змінних, але я відчуваю, що ще не зміг зрозуміти цю концепцію. Наприклад, головна відповідь тут Як центрування даних позбавляється від перехоплення в регресії та PCA? описується, …
30 r  pca  svd  eigenvalues  centering 

3
Чому могло б центрування незалежних змінних змінювати основні ефекти з помірністю?
У мене виникло питання, пов'язане з множинною регресією та взаємодією, натхненною цією ниткою CV: Взаємодія з використанням ієрархічного регресійного аналізу змінних змінних? На які змінні слід зосередитись? Перевіряючи ефект модерації, я центрирую свої незалежні змінні та помножую центрировані змінні, щоб обчислити термін взаємодії. Потім я запускаю свій регресійний аналіз і …

2
Чи потрібні випадкові ліси для введення змінних або масштабування вхідних змінних?
Мої вхідні змінні мають різні розміри. Деякі змінні десяткові, а деякі сотні. Чи важливо централізувати (віднімати середнє значення) або масштабувати (поділити на стандартне відхилення) ці вхідні змінні, щоб зробити дані безрозмірними при використанні випадкових лісів?

1
Перетворення стандартизованих бета-версій до оригінальних змінних
Я розумію, що це, мабуть, дуже просте запитання, але після пошуку я не можу знайти відповідь, яку шукаю. У мене є проблема, коли мені потрібно стандартизувати виконання змінних (регресія хребта), щоб обчислити оцінки хребта бета. Потім мені потрібно перетворити їх назад у початкову шкалу змінних. Але як це зробити? Я …

3
центрування та масштабування фіктивних змінних
У мене є набір даних, який містить як категоричні, так і безперервні змінні. Мені порадили перетворювати категоріальні змінні у бінарні змінні для кожного рівня (тобто A_level1: {0,1}, A_level2: {0,1}) - я думаю, що деякі називають це "фіктивними змінними". З огляду на це, чи не введено в оману центр і масштабувати …

1
Чи потрібне центрування під час завантаження вибірки?
Читаючи про те, як наблизити розподіл середньої вибірки, я натрапив на непараметричний метод завантаження. Мабуть, можна наблизити розподіл до розподілу ˉ X ∗ n - ˉ X n , де ˉ X ∗ n позначає середнє значення вибірки завантажувального зразка.Х¯н- мкX¯n−μ\bar{X}_n-\muХ¯∗н- X¯нX¯n∗−X¯n\bar{X}_n^*-\bar{X}_nХ¯∗нX¯n∗\bar{X}_n^* Моє питання тоді: чи потрібно мені центрування? Для …

3
Як включити і до регресії і чи слід їх центрувати?
Я хочу включити термін та його квадрат (змінні предиктора) до регресії, тому що я припускаю, що низькі значення позитивно впливають на залежну змінну, а високі значення мають негативний ефект. повинен захопити ефект більш високих значень. Тому я очікую, що коефіцієнт буде позитивним, а коефіцієнт буде від'ємним. Крім , я включаю …

1
Термін взаємодії з використанням ієрархічного регресійного аналізу центрированих змінних? На які змінні слід зосередитись?
Я провожу ієрархічний регресійний аналіз, і у мене є невеликі сумніви: Чи обчислюємо термін взаємодії, використовуючи центрировані змінні? Чи повинні ми зосереджувати ВСІ безперервні змінні у наборі даних, крім залежної змінної? Коли ми повинні реєструвати деякі змінні (оскільки їх sd набагато вище їх середнього), чи будемо ми тоді центрувати змінну, …

6
Як групувати в центрі / стандартизувати змінні в R?
Заблокований . Це запитання та його відповіді заблоковано, оскільки це питання поза темою, але має історичне значення. Наразі не приймає нових відповідей чи взаємодій. Функції, які я знайомий, включають шкалу від базової R, масштаб масштабу від ARM. Можливо, найкращим способом було б використовувати якийсь варіант застосунку, вказавши одну або кілька …
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.