Запитання з тегом «feature-selection»

Методи та принципи вибору підмножини атрибутів для використання в подальшому моделюванні

2
Вибір особливостей за допомогою випадкових лісів
У мене є набір даних з переважно фінансовими змінними (120 функцій, приклади 4 к), які в основному є дуже корельованими та дуже галасливими (наприклад, технічні показники), тому я хотів би вибрати приблизно 20-30 для подальшого використання при навчанні моделі (двійкова класифікація - збільшення / зменшення). Я думав про використання випадкових …

4
Низька точність класифікації, що робити далі?
Отже, я новачок у галузі ML та намагаюся зробити якусь класифікацію. Моя мета - передбачити результат спортивної події. Я зібрав декілька історичних даних і зараз намагаюся підготувати класифікатора. У мене було близько 1200 зразків, 0,2 з них я розділив для тестових цілей, інші я вклав у пошук сітки (включена перехресна …

1
Який багаторазовий метод порівняння використовувати для lmer-моделі: lsmeans або glht?
Я аналізую набір даних, використовуючи модель змішаних ефектів з одним фіксованим ефектом (умовою) та двома випадковими ефектами (учасник, обумовлений в рамках проекту та пари). Модель була згенерована з lme4пакетом: exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp). Далі я провів перевірку коефіцієнта ймовірності цієї моделі проти моделі без фіксованого ефекту (умови) і маю суттєву різницю. У моєму …

4
Text Mining: як кластерувати тексти (наприклад, статті новин) із штучним інтелектом?
Я створив кілька нейронних мереж (MLP (повністю підключений), Elman (повторюваний)) для різних завдань, таких як гра в понг, класифікація рукописних цифр та інше ... Крім того, я спробував створити кілька первинних нейронних мереж, наприклад, для класифікації багатозначних рукописних нотаток, але я абсолютно новий для аналізу та кластеризації текстів, наприклад, у …

1
Зменшення Джині та домішка Джині у дитячих вузлах
Я працюю над мірою важливості функції Джині для випадкових лісів. Тому мені потрібно обчислити зменшення домішки вузла Джіні. Ось як я це роблю, що призводить до конфлікту з визначенням, що говорить про те, що я десь повинен помилятися ... :) Для двійкового дерева та, враховуючи ймовірність лівих і правих дітей, …

2
LASSO / LARS проти загального до конкретного (GETS) методу
Мене цікавить, чому методи вибору моделі LASSO та LARS настільки популярні, хоча вони в основному є лише варіаціями поетапного вибору вперед (і, отже, страждають від залежності від шляху)? Аналогічно, чому загальновиробничі (GETS) методи вибору моделі здебільшого ігноруються, хоча вони й краще, ніж LARS / LASSO, оскільки вони не страждають від …

5
Застосування методів машинного навчання в невеликих вибіркових клінічних дослідженнях
Що ви думаєте про застосування методів машинного навчання, як-от випадкові ліси чи санкціоновані регресії (з покаранням L1 або L2, або їх комбінація) у невеликих вибіркових клінічних дослідженнях, коли метою є виділення цікавих прогнозів у контексті класифікації? Це не питання щодо вибору моделі, а також не питання про те, як знайти …

3
Чи мають для лінійних класифікаторів більші коефіцієнти важливіші характеристики?
Я програмний інженер, який працює над машинним навчанням. З мого розуміння, лінійна регресія (наприклад, OLS) та лінійна класифікація (наприклад, логістична регресія та SVM) роблять прогноз на основі внутрішнього добутку між тренованими коефіцієнтами та змінними характеристик → x :ш⃗ ш→\vec{w}х⃗ х→\vec{x} у^= f( ш⃗ ⋅ x⃗ ) = f( ∑iшiхi)у^=f(ш→⋅х→)=f(∑iшiхi) \hat{y} …

2
Змішування безперервних та бінарних даних з лінійним SVM?
Тож я грав із SVM, і мені цікаво, чи це добре робити: У мене є набір безперервних функцій (від 0 до 1) та набір категоричних ознак, які я перетворив на фіктивні змінні. У цьому конкретному випадку я кодую дату вимірювання у фіктивній змінній: У мене є три періоди, з яких …

1
Як саме працює функція підбору функції Chi-square?
Я знаю, що для кожної пари класів характеристик значення статистики чи-квадрата обчислюється і порівнюється з пороговою кількістю. Я хоч трохи розгублений. Якщо є особливості та k класи, як можна побудувати таблицю непередбачених ситуацій? Як можна вирішити, які функції зберігати, а які - видалити?ммmккk Будь-яке уточнення буде дуже вдячно. Спасибі заздалегідь

5
Чи краще робити дослідницький аналіз даних лише на базі даних тренувань?
Я роблю дослідницький аналіз даних (EDA) на наборі даних. Тоді я виберу деякі функції, щоб передбачити залежну змінну. Питання: Чи варто робити ЗНО на моєму навчальному наборі даних? Або я повинен приєднатися до наборів даних про навчання та тестування разом, а потім робити ЗНО на них обох та вибирати функції …

2
Різниця між вибором функцій на основі "F регресії" та на основі значень
Чи порівнюють функції, використовуючи F-regressionте саме, що співвідносити функції з міткою окремо і дотримуватися значення ?R2R2R^2 Я часто бачив, як мої колеги використовують F regressionдля вибору функцій у своєму трубопроводі машинного навчання sklearn: sklearn.feature_selection.SelectKBest(score_func=sklearn.feature_selection.f_regression...)` Деякі, будь ласка, скажіть мені - чому це дає ті ж результати, що і лише співвідносивши …

4
Як слід замовити вибір функції та оптимізацію гіперпараметрів у трубопроводі машинного навчання?
Моя мета - класифікувати сенсорні сигнали. Поняття мого рішення поки що: i) Інженерні особливості з необробленого сигналу ii) Вибір відповідних функцій за допомогою функції ReliefF та кластеризації підходу iii) Застосування NN, Random Forest та SVM Однак я захоплений дилемою. У ii) та iii) існують гіперпараметри, такі як k-Найближчі Neigbours для …

3
Байєсівський змінний вибір - чи справді це працює?
Я подумав, що я можу погратись із деяким байєсівським змінним вибором, дотримуючись приємного допису в блозі та пов'язаних з ним паперів. Я написав програму в rjags (де я досить новичок) і отримав дані про ціни на Exxon Mobil, а також деякі речі, які навряд чи пояснюють її повернення (наприклад, ціни …

1
Який алгоритм прямого ступінчатого регресії?
Можливо, я просто втомився, але у мене виникають проблеми, намагаючись зрозуміти алгоритм Forward Stagewise Regression. На сторінці «Елементи статистичного навчання» на сторінці 60: Регресія вперед-ступінь (FS) ще більш обмежена, ніж регресія вперед-ступінчасто. Він починається як регресія вперед, поступово, з перехопленням, рівним [середньому] y, і орієнтованими передбачувачами з коефіцієнтами спочатку всі …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.