В даний час я використовую аналіз основних компонентів для вибору змінних, які використовуватимуться при моделюванні. На даний момент я роблю вимірювання A, B і C у своїх експериментах. Що я дійсно хочу знати: чи можу я зробити менше вимірювань і припинити запис C і або B, щоб заощадити час і сили?
Я вважаю, що всі 3 змінні сильно завантажуються на мій перший основний компонент, який становить 60% дисперсії моїх даних. Оцінки компонентів підказують мені, що якщо я додаю ці змінні разом у певному співвідношенні (aA + bB + cC). Я можу отримати оцінку на ПК1 для кожного випадку в моєму наборі даних і можу використовувати цю оцінку як змінну при моделюванні, але це не дозволяє мені припинити вимірювання B і C.
Якщо я квадратую навантаження A і B і C на PC1, я вважаю, що на змінну A припадає 65% дисперсії в PC1, а на змінну B припадає 50% дисперсії в PC1, а змінна C також на 50%, тобто деякі відхилення в PC1, що припадає на кожну змінну A, B і C, поділяється на іншу змінну, але A виходить на верхній облік трохи більше.
Неправильно думати, що я міг просто вибрати змінну A або, можливо, (AA + bB, якщо це необхідно) використовувати для моделювання, оскільки ця змінна описує велику частку дисперсії в PC1, а це, в свою чергу, описує велику частку дисперсії в дані?
Який підхід ви використовували в минулому?
- Єдина змінна, яка завантажує найважче на ПК1, навіть якщо є інші важкі навантажувачі?
- Оцінка компонентів на PC1 з використанням усіх змінних, навіть якщо вони всі важкі навантажувачі?