Запитання з тегом «feature-selection»

Методи та принципи вибору підмножини атрибутів для використання в подальшому моделюванні

2
Які функції, як правило, використовуються з дерев Парсера в процесі класифікації в NLP?
Я вивчаю різні типи структур дерев розбору. Дві широко відомі структури дерев розбору: a) Дерево розбору, засноване на окружності, і b) Деревові структури розбору на основі залежності. Я можу використовувати генерувати обидва типи структур дерева розбору за допомогою пакету Stanford NLP. Однак я не впевнений, як використовувати ці структури дерев …

1
Чим відрізняється одне гаряче кодування від одного кодування?
Я читаю презентацію, і вона рекомендує не використовувати кодування не залишати, але це добре з одним гарячим кодуванням. Я думав, що вони обоє однакові. Чи може хтось описати, у чому полягають відмінності між ними?

1
Особливість важливості з високою кардинальністю для регресії (числова змінна залежність)
Я намагався використовувати імпорт функцій з Random Forests, щоб здійснити деякий емпіричний вибір функції для проблеми регресії, де всі функції є категоричними і багато з них мають багато рівнів (порядку 100-1000). Зважаючи на те, що одне гаряче кодування створює фіктивну змінну для кожного рівня, імпорт функцій - для кожного рівня, …

1
Вибір особливостей за допомогою імпортів функцій у випадкових лісах із науковим досвідом
Я побудував схему імпортних функцій у випадкових лісах за допомогою наукової роботи . Для того, щоб покращити прогнозування за допомогою випадкових лісів, як я можу використовувати інформацію про ділянки для видалення функцій? Тобто як визначити, чи є марка марною або навіть гіршою, що зменшує продуктивність випадкових лісів, спираючись на інформацію …

3
Чи є якісні нестандартні мовні моделі для python?
Я прототипую додаток, і мені потрібна мовна модель, щоб обчислити здивування в деяких створених пропозиціях. Чи є якась навчена мовна модель в python, яку я можу легко використовувати? Щось на кшталт простого model = LanguageModel('en') p1 = model.perplexity('This is a well constructed sentence') p2 = model.perplexity('Bunny lamp robert junior pancake') …
11 python  nlp  language-model  r  statistics  linear-regression  machine-learning  classification  random-forest  xgboost  python  sampling  data-mining  orange  predictive-modeling  recommender-system  statistics  dimensionality-reduction  pca  machine-learning  python  deep-learning  keras  reinforcement-learning  neural-network  image-classification  r  dplyr  deep-learning  keras  tensorflow  lstm  dropout  machine-learning  sampling  categorical-data  data-imputation  machine-learning  deep-learning  machine-learning-model  dropout  deep-network  pandas  data-cleaning  data-science-model  aggregation  python  neural-network  reinforcement-learning  policy-gradients  r  dataframe  dataset  statistics  prediction  forecasting  r  k-means  python  scikit-learn  labels  python  orange  cloud-computing  machine-learning  neural-network  deep-learning  rnn  recurrent-neural-net  logistic-regression  missing-data  deep-learning  autoencoder  apache-hadoop  time-series  data  preprocessing  classification  predictive-modeling  time-series  machine-learning  python  feature-selection  autoencoder  deep-learning  keras  tensorflow  lstm  word-embeddings  predictive-modeling  prediction  machine-learning-model  machine-learning  classification  binary  theory  machine-learning  neural-network  time-series  lstm  rnn  neural-network  deep-learning  keras  tensorflow  convnet  computer-vision 

4
Техніка вилучення функцій - узагальнення послідовності даних
Я часто будую модель (класифікацію чи регресію), де у мене є деякі змінні прогнози, що є послідовностями, і я намагаюся знайти рекомендації щодо техніки для їх узагальнення найкращим чином для включення в якості предикторів до моделі. Як конкретний приклад, скажімо, будується модель, яка передбачає, чи клієнт покине компанію протягом наступних …

4
Який перший: алгоритм бенчмаркінгу, вибір функцій, налаштування параметрів?
Коли я намагаюся зробити, наприклад, класифікацію, на даний момент я підхожу спершу спробуйте різні алгоритми та порівняйте їх виконувати вибір функції за найкращим алгоритмом з 1 вище налаштування параметрів за допомогою вибраних функцій та алгоритму Однак я часто не можу переконати себе, що може бути кращий алгоритм, ніж обраний, якщо …


2
Лінійна регресія та масштабування даних
Наступний графік показує коефіцієнти, отримані при лінійній регресії (з mpgцільовою змінною та всі інші як предиктори). Для набору даних mtcars ( тут і тут ) як із масштабуванням даних, так і без них: Як я інтерпретую ці результати? Змінні hpта dispзначущі лише в тому випадку, якщо дані масштабуються. Це amі …

3
Кращі мови для наукових обчислень [закрито]
Закрито . Це питання має бути більш зосередженим . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Оновіть питання, щоб воно зосередило увагу на одній проблемі, лише відредагувавши цю публікацію . Закрито 5 років тому . Здається, що більшість мов мають деяку кількість бібліотек наукових обчислень. Python має Scipy Rust …
10 efficiency  statistics  tools  knowledge-base  machine-learning  neural-network  deep-learning  optimization  hyperparameter  machine-learning  time-series  categorical-data  logistic-regression  python  visualization  bigdata  efficiency  classification  binary  svm  random-forest  logistic-regression  data-mining  sql  experiments  bigdata  efficiency  performance  scalability  distributed  bigdata  nlp  statistics  education  knowledge-base  definitions  machine-learning  recommender-system  evaluation  efficiency  algorithms  parameter  efficiency  scalability  sql  statistics  visualization  knowledge-base  education  machine-learning  r  python  r  text-mining  sentiment-analysis  machine-learning  machine-learning  python  neural-network  statistics  reference-request  machine-learning  data-mining  python  classification  data-mining  bigdata  usecase  apache-hadoop  map-reduce  aws  education  feature-selection  machine-learning  machine-learning  sports  data-formats  hierarchical-data-format  bigdata  apache-hadoop  bigdata  apache-hadoop  python  visualization  knowledge-base  classification  confusion-matrix  accuracy  bigdata  apache-hadoop  bigdata  efficiency  apache-hadoop  distributed  machine-translation  nlp  metadata  data-cleaning  text-mining  python  pandas  machine-learning  python  pandas  scikit-learn  bigdata  machine-learning  databases  clustering  data-mining  recommender-system 

4
Як порівняти ефективність методів вибору функцій?
Є кілька підходів до вибору функцій / змінних (див., Наприклад, Guyon & Elisseeff, 2003 ; Liu et al., 2010 ): методи фільтрування (наприклад, на основі кореляції, на основі ентропії, на основі випадкових лісів), способи обгортки (наприклад, пошук вперед, пошук на сходження на гору) та вбудовані методи, де вибір функції є …

4
Співвідношення вибору та класифікації точності класифікації
Однією з методологій вибору підмножини доступних функцій для вашого класифікатора є класифікація їх за критерієм (наприклад, інформаційним посиленням), а потім обчислення точності за допомогою вашого класифікатора та підмножини ранжированих функцій. Наприклад, якщо ваші функції є A, B, C, D, E, і якщо вони класифіковані як наступні D,B,C,E,A, то ви обчислюєте …


3
Чи можна використовувати координати GPS (широту та довготу) як функції в лінійній моделі?
У мене є набори даних, які містять серед багатьох функцій координати GPS (широта та довгота). Я хотів би використовувати ці набори даних для дослідження таких проблем, як: (1) обчислення ETA для руху між початковою та кінцевою точками; та (2) оцінка кількості злочину для конкретного пункту. Я хотів би використовувати лінійну …

2
Що робити, коли дані тестування мають менше функцій, ніж дані про навчання?
Скажімо, ми прогнозуємо продажі магазину, а мої дані про навчання мають два набори функцій: Один про продаж магазину з датами (поле "Магазин" не унікальне) Один із типів магазину (поле "Магазин" тут унікальне) Отже матриця виглядатиме приблизно так: +-------+-----------+------------+---------+-----------+------+-------+--------------+ | Store | DayOfWeek | Date | Sales | Customers | Open …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.