На роботі ми обговорювали це, оскільки мій начальник ніколи не чув про нормалізацію. У лінійній алгебрі нормалізація ніби позначає ділення вектора на його довжину. А в статистиці стандартизація, схоже, посилається на віднімання середнього, а потім ділення на його SD. Але вони здаються взаємозамінними і з іншими можливостями.
Коли ви створюєте якусь універсальну оцінку, яка складається з різних показників, які мають різні засоби та різні SD, ви б їх нормалізували, стандартизували чи щось інше? Одна людина сказала мені, що це лише питання взяття кожної метрики та розділення їх на свій SD, окремо. Потім підсумовуючи два. І це призведе до загальної оцінки, яка може бути використана для судження обох показників.
Наприклад, скажіть, у вас була кількість людей, які приймають метро на роботу (в Нью-Йорку) та кількість людей, які їхали на роботу (в Нью-Йорку).
Вагон ⟶ у
Якщо ви хотіли створити універсальний бал, щоб швидко повідомити про коливання руху, ви не можете просто додати та тому що буде набагато більше людей, які їдуть на поїзді. У Нью-Йорку живе 8 мільйонів людей, плюс туристи. Ось мільйони людей щодня їздять у поїзді, сотні тисяч людей у вагонах. Тому їх потрібно перетворити на аналогічний масштаб, щоб порівняти.середня ( у )
Якщо
і
Ви б нормалізували & тоді суму? Ви б стандартизували & а потім суму? Або ви поділили кожного на відповідний SD, а потім суму? Для того, щоб дістатись до числа, яке при коливанні представляє загальні коливання трафіку.y x y
Будь-яка стаття чи глави книг для довідок були б вдячні. ДЯКУЮ!
Також ось ще один приклад того, що я намагаюся зробити.
Уявіть, що ви декан коледжу, і ви обговорюєте вимоги до вступу. Можливо, ви хочете, щоб студенти мали принаймні певний бал та певний бал тесту. Було б непогано, як би вони обидва були в одній шкалі, тому що тоді ви можете просто скласти їх і сказати, "будь-хто з принаймні 7.0 може отримати допуск". Таким чином, якщо майбутній студент має 4,0 ГПД, вони можуть отримати низький бал, як тест 3,0, і все одно приймуть участь. І навпаки, якщо хтось мав 3,0 ГПД, він все одно може отримати визнання з оцінкою 4,0 тесту.
Але це не так. ACT за шкалою 36 балів, а більшість GPA мають 4,0 (деякі 4,3, так дратує). Оскільки я не можу просто додати ACT та GPA, щоб отримати якийсь універсальний бал, як я можу їх перетворити так, щоб вони могли бути додані, таким чином створюючи універсальну оцінку прийому. І тоді, будучи деканом, я міг просто автоматично приймати будь-кого з оцінкою вище певного порогу. Або навіть автоматично приймати всіх, рейтинг яких у топ-95% .... такі речі.
Це нормалізація? стандартизація? або просто розділивши кожен їх SD та підсумовуючи?