Запитання з тегом «feature-construction»

Інженерія особливостей - це процес використання знань даних про домен для створення функцій для моделей машинного навчання. Цей тег призначений як для теоретичних, так і для практичних питань, що стосуються інженерії функцій, за винятком запитань про код, який би був поза темою на CrossValidated.

6
Принциповий спосіб згортання категоріальних змінних з багатьма рівнями?
Які методи доступні для згортання (чи об'єднання) багатьох категорій до кількох, з метою використання їх як вхідних даних (прогнозів) у статистичній моделі? Розглянемо таку змінну, як студент коледжу (дисципліна, яку обирає студент). Це не упорядковане і категоричне, але потенційно воно може мати десятки різних рівнів. Скажімо, я хочу використовувати мажор …

2
Автокодекси не можуть вивчити значущі функції
У мене є 50 000 таких зображень: Вони зображують графіки даних. Я хотів отримати функції з цих зображень, тому я використав код автокодування, наданий Theano (deeplearning.net). Проблема полягає в тому, що ці автокодери, схоже, не вивчають жодних функцій. Я спробував RBM, і це те саме. Набір даних MNIST забезпечує приємні …

7
як представити географію чи поштовий індекс у моделі машинного навчання чи в системі рекомендацій?
Я будую модель, і я думаю, що географічне розташування, ймовірно, дуже добре спрогнозує мій цільовий змінний. У мене є поштовий індекс кожного з моїх користувачів. Я не зовсім впевнений, що найкращий спосіб включити поштовий індекс як функцію передбачувача у свою модель. Хоча поштовий індекс - це номер, він нічого не …

2
Як ініціалізувати елементи матриці фільтра?
Я намагаюся краще зрозуміти конволюційні нейронні мережі краще, записуючи код Python, який не залежить від бібліотек (наприклад, Convnet або TensorFlow), і я застрягаю в літературі про те, як вибрати значення для матриці ядра, коли виконання згортки на зображенні. Я намагаюся зрозуміти деталі реалізації на кроці між картами функцій на зображенні …

2
Коли ми повинні дискретизувати / бін безперервні незалежні змінні / функції, а коли не слід?
Коли ми повинні дискретизувати / бін незалежні змінні / функції, а коли не слід? Мої спроби відповісти на питання: Взагалі, ми не повинні бініти, оскільки бінінг втратить інформацію. Бінінг насправді збільшує ступінь свободи моделі, тому можливе сприятливе пристосування після бінінгу. Якщо у нас є модель "з великим ухилом", бінінг може …

5
Чому функціональна техніка працює?
Нещодавно я дізнався, що один із способів пошуку кращих рішень для проблем ML - це створення функцій. Можна зробити це, наприклад підсумувавши дві функції. Наприклад, ми маємо дві особливості «атака» та «захист» якогось героя. Потім ми створюємо додаткову функцію під назвою "загальний", яка є сумою "атаки" та "оборони". Зараз мені …

2
Підручники з художньої інженерії
Як відомо всім, функціональна інженерія надзвичайно важлива для машинного навчання, проте я знайшов мало матеріалів, пов’язаних із цією областю. Я брав участь у декількох змаганнях з Kaggle і вважаю, що хороші характеристики можуть бути навіть важливішими, ніж хороший класифікатор в деяких випадках. Хтось знає які-небудь навчальні посібники щодо художньої інженерії, …

1
Оптимальна побудова особливості дня в нейронних мережах
Працюючи над проблемою регресії, я почав думати про представлення функції "день тижня". Цікаво, який підхід би краще: одна особливість; значення 1/7 за понеділок; 2/7 на вівторок ... 7 особливостей: (1, 0, 0, 0, 0, 0, 0) для понеділка; (0, 1, 0, 0, 0, 0, 0) за вівторок ... Важко це …

1
Що таке "простір функцій"?
Що таке визначення "простір функцій"? Наприклад, читаючи про SVM, я читав про "відображення в просторі для функцій". Читаючи про CART, я читав про "розділення для розміщення простору". Я розумію, що відбувається, особливо для CART, але думаю, що є якесь визначення, яке я пропустив. Чи існує загальне визначення поняття "простір функцій"? …

2
Змішування безперервних та бінарних даних з лінійним SVM?
Тож я грав із SVM, і мені цікаво, чи це добре робити: У мене є набір безперервних функцій (від 0 до 1) та набір категоричних ознак, які я перетворив на фіктивні змінні. У цьому конкретному випадку я кодую дату вимірювання у фіктивній змінній: У мене є три періоди, з яких …

5
Чи краще робити дослідницький аналіз даних лише на базі даних тренувань?
Я роблю дослідницький аналіз даних (EDA) на наборі даних. Тоді я виберу деякі функції, щоб передбачити залежну змінну. Питання: Чи варто робити ЗНО на моєму навчальному наборі даних? Або я повинен приєднатися до наборів даних про навчання та тестування разом, а потім робити ЗНО на них обох та вибирати функції …

2
Максимальна середня розбіжність (розподіл відстані)
У мене є два набори даних (вихідні та цільові дані), які слідують за різним розподілом. Я використовую MMD - це непараметричний розподіл відстані - для обчислення граничного розподілу між вихідними та цільовими даними. вихідні дані, Xs цільові дані, Xt адаптаційна матриця A * Прогнозовані дані, Zs = A '* Xs …

1
Особливості побудови та нормалізації в машинному навчанні
Скажімо, я хочу створити логістичний класифікатор для фільму М. Моїми характеристиками буде щось на зразок віку людини, статі, професії, місця розташування. Тож навчальний набір буде чимось на кшталт: Вікова стать Професія Місце подобається (1) / Не подобається (0) 23 M Програмне забезпечення США 1 24 F Лікар Великобританії 0 і …

1
Автоматичне вилучення ключових слів: використання схожих косинусів як функцій
У мене є документ-термін матриця , і тепер я хотів би отримати ключові слова для кожного документа з контрольованим методом навчання (SVM, Naive Bayes, ...). У цій моделі я вже використовую Tf-idf, Pos тег, ...ММM Але зараз мені цікаво про некси. У мене є матриця із косинусною схожістю між термінами.ССC …

2
Домен-агностична особливість інженерії, яка зберігає смислове значення?
Техніка особливостей часто є важливою складовою для машинного навчання (її активно використовували, щоб виграти Кубок KDD у 2010 році ). Однак я вважаю, що і більшість технічних методів знищити будь-яке інтуїтивне значення основних рис або дуже специфічні для певного домену або навіть конкретних типів функцій. Класичним прикладом першого є аналіз …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.