Ось класний уривок Jolliffe (1982), який я не включив у свою попередню відповідь на дуже схоже запитання: " Компоненти з низькою дисперсією в PCA, чи справді вони просто шум? Чи є спосіб перевірити це? " це досить інтуїтивно.
Припустимо, що потрібно передбачити висоту основи хмари, , важливу проблему в аеропортах. Вимірюються різні кліматичні змінні, включаючи температуру поверхні T s та температуру поверхні роси, T d . Тут T d - температура, при якій поверхневе повітря було б насичене водяною парою, а різниця T s - T d - це міра вологості поверхні. Зараз T s , T d, як правило, позитивно корелюють, тому основний компонентний аналіз кліматичних змінних буде мати високодисперсну складову, яка сильно корелює з THTsTdTdTs−TdTs,Td , і компонент з низькою дисперсією, який аналогічно корелює з T s - T d . Але Н пов'язано з вологістю іотже, Т з - Т д , тобто до низькою дисперсієюа не компонентвисокою дисперсією, такстратегіїяка відхиляє компонентинизьким рівнем дисперсії дають погані прогнози для H .Ts+TdTs−TdHТс- ТгН
Обговорення цього прикладу обов'язково розпливчасте через невідомі ефекти будь-яких інших кліматичних змінних, які також вимірюються та включаються в аналіз. Однак він показує фізично правдоподібний випадок, коли залежна змінна буде пов'язана з низькодисперсною складовою, що підтверджує три емпіричні приклади з літератури.
Крім того, приклад на основі хмарності був випробуваний на даних аеропорту Кардіфф (Уельс) за 1966–73 рр. З додатковою кліматичною змінною, температурою поверхні моря. Результати по суті були такими, як було передбачено вище. Останній головний компонент становив приблизно
, і він становив лише 0,4 відсотка від загальної зміни. Тим НЕ менше, в якості основного компонента регресії він був найважливішим прогностичним фактором для H . [Наголос додано]Тс- ТгН
Три приклади з літератури, про які йдеться в останньому реченні другого абзацу, були трьома, про які я згадував у своїй відповіді на пов'язане питання .
Довідка
Jolliffe, IT (1982). Примітка щодо використання основних компонентів при регресії. Прикладна статистика, 31 (3), 300–303. Отримано з http://automatica.dei.unipd.it/public/Schenato/PSC/2010_2011/gruppo4-Building_termo_identification/IdentificazioneTermodinamica20072008/Biblio/Articoli/PCR%20vecchio%2082.pdf .