Тут я запитую про те, що зазвичай роблять інші, щоб використовувати тест-квадрат чи для вибору функцій wrt для вибору функцій при контрольованому навчанні. Якщо я правильно розумію, чи перевіряють вони незалежність між кожною ознакою та результатом і чи порівнюють значення p між тестами для кожної функції?
У http://en.wikipedia.org/wiki/Pearson%27s_chi-squared_test ,
Хір-квадратний тест Пірсона - це статистичний тест, який застосовується до наборів категоричних даних, щоб оцінити, наскільки ймовірно, що будь-яка спостерігається різниця між множинами виникла випадково.
...
Тест на незалежність оцінює, чи парні спостереження за двома змінними, виражені в таблиці непередбачених ситуацій , не залежать одна від одної (наприклад, опитування відповідей людей різних національностей, щоб побачити, чи є національність людини у відповідь).
Тож чи повинні обидві змінні, незалежність яких перевіряється тестом, бути категоричними чи дискретними (дозволяючи впорядкувати, крім категорійних), але не бути суміжними?
З http://scikit-learn.org/stable/modules/feature_selection.html , вони
виконати тест до набору даних райдужки, щоб отримати лише дві найкращі характеристики.
У наборі даних райдужної оболонки всі функції є числовими та безперервними, а результат - мітками класів (категоричні). Як тест незалежності чи-ква застосовується до безперервних ознак?
Щоб застосувати тест незалежності chi до квадрата до набору даних, ми спочатку перетворюємо безперервні функції в дискретні функції, використовуючи бінінг (тобто спочатку дискретизуючи безперервні домени функцій у біни, а потім замінюючи функції на виникнення значень ознак у бункерах )?
Виникнення в декількох бункерах утворюють мультиноміальну ознаку (виникає або не є в кожному контейнері), тому тест незалежності чі може застосовуватися до них, правда?
До речі, мабуть, чи можемо ми застосувати тест незалежності чи в квадраті до особливостей та результатів будь-якого виду ?
Для підсумкової частини ми можемо вибрати особливості не лише для класифікації, але й для регресії, за допомогою тесту незалежності чи квадратів, шляхом поповнення безперервного результату, правда?
Сайт "scikit learn" також говорить
Обчисліть статистику хі-квадрата між кожною невід’ємною ознакою та класом.
Цей показник може бути використаний для вибору особливостей n_features з найвищими значеннями для тестової статистики хі-квадрата від X, яка повинна містити лише негативні ознаки, такі як булеві або частоти (наприклад, кількість термінів у класифікації документів), відносно заняття.
Чому для тесту потрібні негативні функції?
Якщо ознаки не мають ознак, але є категоричними або дискретними, чи може тест все-таки застосовуватись до них? (Дивіться мою частину 1)
Якщо функції негативні, ми завжди можемо бініти їхні домени та замінити їх появами (так само, як я думаю, застосувати тест до набору даних райдужки, див. Частину 2), правда?
Примітка. Думаю, Scikit Learn дотримується загальних принципів, і ось що я прошу тут. Якщо ні, то все одно гаразд.