Запитання з тегом «standardization»

Зазвичай посилається на "z-стандартизацію", яка зміщує та змінює масштаб даних, щоб переконатися, що вони мають нульове середнє та одиничне відхилення. Можливі й інші "стандартизації".

7
Коли ви проводите множинні регресії, коли слід зосереджувати свої прогнозні показники, а коли їх стандартизувати?
У деякій літературі я читав, що регресія з декількома пояснювальними змінними, якщо вони є в різних одиницях, потрібно стандартизувати. (Стандартизація полягає у відніманні середнього значення та діленні на стандартне відхилення.) У яких інших випадках мені потрібно стандартизувати свої дані? Чи є випадки, коли я повинен зосереджувати лише свої дані (тобто, …

5
Яка різниця між нормалізацією та стандартизацією?
На роботі ми обговорювали це, оскільки мій начальник ніколи не чув про нормалізацію. У лінійній алгебрі нормалізація ніби позначає ділення вектора на його довжину. А в статистиці стандартизація, схоже, посилається на віднімання середнього, а потім ділення на його SD. Але вони здаються взаємозамінними і з іншими можливостями. Коли ви створюєте …

3
Змінні часто коригуються (наприклад, стандартизовані) перед виготовленням моделі - коли це гарна ідея, а коли погана?
За яких обставин ви хочете чи не хочете масштабувати або стандартизувати змінну до монтажу моделі? І які переваги / недоліки масштабування змінної?

3
Здійснювати нормалізацію функції до або в процесі перевірки моделі?
Поширена практика в машинному навчанні полягає в нормалізації характеристик або стандартизації даних змінних прогнозника, саме так, центрувати дані, що віднімають середнє значення, і нормалізувати його діленням на дисперсію (або стандартне відхилення теж). Для стримування самопочуття і, наскільки я розумію, ми робимо це для досягнення двох головних речей: Уникайте зайвих малих …

1
Як застосувати стандартизацію / нормалізацію до поїзного і тестового набору, якщо мета прогнозування?
Чи я транслюю всі свої дані або складки (якщо застосовується резюме) одночасно? напр (allData - mean(allData)) / sd(allData) Чи трансформую поїздку та набір тестів окремо? напр (trainData - mean(trainData)) / sd(trainData) (testData - mean(testData)) / sd(testData) Або я перетворюю набір поїздів і використовую обчислення на тестовому наборі? напр (trainData - …

3
Чи потрібна стандартизація перед відповідним логістичним регресом?
Моє запитання: чи потрібно нам стандартизувати набір даних, щоб переконатися, що всі змінні мають однакову шкалу між [0,1], перш ніж підходити до логістичної регресії. Формула така: хi- хв ( х)i)макс ( х)i) - хв ( хi)xi−min(xi)max(xi)−min(xi)\frac{x_i-\min(x_i)}{\max(x_i)-\min(x_i)} У моєму наборі даних є дві змінні, вони описують одне і те ж для …

2
Коли і як використовувати стандартизовані пояснювальні змінні в лінійній регресії
У мене є 2 прості запитання щодо лінійної регресії: Коли рекомендується стандартизувати пояснювальні змінні? Як тільки оцінка проводиться за допомогою стандартизованих значень, як можна передбачити нові значення (як слід стандартизувати нові значення)? Деякі довідки були б корисні.

3
чи слід змінити масштаб індикаторів / бінарних / фіктивних прогнокторів для LASSO
Для LASSO (та інших процедур вибору моделі) дуже важливо змінити масштаби прогнозів. Загальна рекомендація я дотримуюся просто використовувати 0, 1 середнє стандартне відхилення нормалізації для безперервних змінних. Але що тут робити з манекенами? Наприклад, кілька прикладних прикладів тієї ж (чудової) літньої школи, яку я пов’язував із перерахунком змінних безперервних змінних, …

2
Чи справді необхідна стандартизація перед Лассо?
Я прочитав три основні причини стандартизації змінних перед чимось таким, як Lassoрегресія: 1) Інтерпретабельність коефіцієнтів. 2) Можливість ранжувати значення коефіцієнта за відносною величиною оцінок коефіцієнта після усадки. 3) Не потрібно перехоплення. Але мені цікаво найголовніше. Чи є у нас підстави думати, що стандартизація поліпшила б узагальнення вибірки моделі? Також мені …


3
Що означає "нормалізація" та як переконатися, що зразок чи розподіл нормалізуються?
У мене є запитання, в якому він просить перевірити, чи нормалізується Уніфікований розподіл ( Uniform(a,b)Uniform(a,b){\rm Uniform}(a,b) ). Для одного, що означає нормалізація будь-якого розподілу? І два, як ми можемо перевірити, нормалізується чи ні розподіл? Я розумію, обчислюючи ми отримуємо нормалізовані дані , але тут він просить перевірити , нормалізується чи …

2
Питання про стандартизацію в регресії хребта
Ей, хлопці, я знайшов один-два документи, які використовують регресію хребта (для даних баскетболу). Мені завжди казали стандартизувати свої змінні, якщо я провів регресію хребта, але мені просто сказали це зробити, тому що хребет був варіантом масштабу (регресія хребта насправді не була частиною нашого курсу, тому наш лектор проглянув його). Ці …

2
Чи є гарною практикою стандартизація даних у регресії з даними на панелі / поздовжньому?
Взагалі я стандартизую свої незалежні змінні в регресіях, щоб правильно порівняти коефіцієнти (таким чином вони мають однакові одиниці: стандартні відхилення). Однак, використовуючи дані панелі / поздовжні, я не впевнений, як мені стандартизувати свої дані, особливо якщо я оцінюю ієрархічну модель. Щоб зрозуміти, чому це може бути потенційною проблемою, припустимо, у …

1
Необхідність центрування та стандартизації даних при регресії
Розглянемо лінійну регресію з деякою регуляризацією: Eg Знайдіть що мінімізуєxxx||Ax−b||2+λ||x||1||Ax−b||2+λ||x||1||Ax - b||^2+\lambda||x||_1 Зазвичай стовпці А стандартизовані, щоб мати нульове середнє і одиничну норму, а - по центру, щоб мати нульове середнє. Хочу переконатися, чи правильно я розумію причину стандартизації та центрування.bbb Створюючи засоби стовпців AAA і bbb нульових, нам більше …

2
Чи потрібні випадкові ліси для введення змінних або масштабування вхідних змінних?
Мої вхідні змінні мають різні розміри. Деякі змінні десяткові, а деякі сотні. Чи важливо централізувати (віднімати середнє значення) або масштабувати (поділити на стандартне відхилення) ці вхідні змінні, щоб зробити дані безрозмірними при використанні випадкових лісів?

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.