Запитання з тегом «classification»

Екземпляр контрольованого навчання, який визначає категорію або категорії, до яких належить новий екземпляр набору даних.

2
Дані про почуття Emoji
Для експерименту ми хотіли б використовувати Emoji, вбудований у багато твітів, як основну інформацію правди / навчання для простого кількісного аналізу почуттів. Твіти зазвичай занадто неструктуровані, щоб NLP працював добре. У будь-якому випадку в Unicode 6.0 є 722 Emoji, і, ймовірно, ще 250 буде додано в Unicode 7.0. Чи є …

3
Неструктурована класифікація тексту
Я буду класифікувати неструктуровані текстові документи, а саме веб-сайти невідомої структури. Кількість класів, до яких я класифікую, обмежена (на даний момент я вважаю, що існує не більше трьох). Хтось пропонує, як мені почати? Чи підхід "мішок слів" тут здійсненний? Пізніше я можу додати ще один етап класифікації на основі структури …

3
Вимірювання продуктивності різних класифікаторів з різними розмірами вибірки
В даний час я використовую кілька різних класифікаторів для різних об'єктів, витягнутих з тексту, і використовую точність / згадування як підсумок того, наскільки добре працює кожен окремий класифікатор для певного набору даних. Мені цікаво, чи є змістовний спосіб порівняння продуктивності цих класифікаторів аналогічним чином, але який також враховує загальну кількість …

1
У чому різниця між глобальними та універсальними методами стиснення?
Я розумію, що методи стиснення можуть бути розділені на два основні набори: глобальний місцеві Перший набір працює незалежно від даних, що обробляються, тобто вони не покладаються на будь-які характеристики даних і, таким чином, не потребують жодної попередньої обробки на будь-якій частині набору даних (перед самим стисненням). З іншого боку, місцеві …

1
Скільки клітин LSTM я повинен використовувати?
Чи є якісь правила (чи фактичні правила), що стосуються мінімальної, максимальної та "розумної" кількості комірок LSTM, які я повинен використовувати? Зокрема, я стосуюсь BasicLSTMCell від TensorFlow та num_unitsвласності. Будь ласка, припустіть, що у мене проблема класифікації, визначена: t - number of time steps n - length of input vector in …
12 rnn  machine-learning  r  predictive-modeling  random-forest  python  language-model  sentiment-analysis  encoding  machine-learning  deep-learning  neural-network  dataset  caffe  classification  xgboost  multiclass-classification  unbalanced-classes  time-series  descriptive-statistics  python  r  clustering  machine-learning  python  deep-learning  tensorflow  machine-learning  python  predictive-modeling  probability  scikit-learn  svm  machine-learning  python  classification  gradient-descent  regression  research  python  neural-network  deep-learning  convnet  keras  python  tensorflow  machine-learning  deep-learning  tensorflow  python  r  bigdata  visualization  rstudio  pandas  pyspark  dataset  time-series  multilabel-classification  machine-learning  neural-network  ensemble-modeling  kaggle  machine-learning  linear-regression  cnn  convnet  machine-learning  tensorflow  association-rules  machine-learning  predictive-modeling  training  model-selection  neural-network  keras  deep-learning  deep-learning  convnet  image-classification  predictive-modeling  prediction  machine-learning  python  classification  predictive-modeling  scikit-learn  machine-learning  python  random-forest  sampling  training  recommender-system  books  python  neural-network  nlp  deep-learning  tensorflow  python  matlab  information-retrieval  search  search-engine  deep-learning  convnet  keras  machine-learning  python  cross-validation  sampling  machine-learning 

2
Як обчислити розмір VC?
Я вивчаю машинне навчання, і я хотів би знати, як обчислити розмір VC. Наприклад: h ( x ) = { 10якщо a≤x≤bще h(x)={1if a≤x≤b0else h(x)=\begin{cases} 1 &\mbox{if } a\leq x \leq b \\ 0 & \mbox{else } \end{cases} , з параметрами( a , b ) ∈ R2(a,b)∈R2(a,b) ∈ R^2 . …

4
Як буде працювати принцип Оккама Бритва в машинному навчанні
Наступне питання, відображене на зображенні, було задано під час одного з іспитів. Я не впевнений, правильно я зрозумів принцип бритви Оккама чи ні. Відповідно до меж розподілу та прийняття рішень, наведених у запитанні та після бритви Оккама, відповідь межами B в обох випадках має бути відповіддю. Тому що відповідно до …

3
Чи є якісні нестандартні мовні моделі для python?
Я прототипую додаток, і мені потрібна мовна модель, щоб обчислити здивування в деяких створених пропозиціях. Чи є якась навчена мовна модель в python, яку я можу легко використовувати? Щось на кшталт простого model = LanguageModel('en') p1 = model.perplexity('This is a well constructed sentence') p2 = model.perplexity('Bunny lamp robert junior pancake') …
11 python  nlp  language-model  r  statistics  linear-regression  machine-learning  classification  random-forest  xgboost  python  sampling  data-mining  orange  predictive-modeling  recommender-system  statistics  dimensionality-reduction  pca  machine-learning  python  deep-learning  keras  reinforcement-learning  neural-network  image-classification  r  dplyr  deep-learning  keras  tensorflow  lstm  dropout  machine-learning  sampling  categorical-data  data-imputation  machine-learning  deep-learning  machine-learning-model  dropout  deep-network  pandas  data-cleaning  data-science-model  aggregation  python  neural-network  reinforcement-learning  policy-gradients  r  dataframe  dataset  statistics  prediction  forecasting  r  k-means  python  scikit-learn  labels  python  orange  cloud-computing  machine-learning  neural-network  deep-learning  rnn  recurrent-neural-net  logistic-regression  missing-data  deep-learning  autoencoder  apache-hadoop  time-series  data  preprocessing  classification  predictive-modeling  time-series  machine-learning  python  feature-selection  autoencoder  deep-learning  keras  tensorflow  lstm  word-embeddings  predictive-modeling  prediction  machine-learning-model  machine-learning  classification  binary  theory  machine-learning  neural-network  time-series  lstm  rnn  neural-network  deep-learning  keras  tensorflow  convnet  computer-vision 

1
Використовуючи попередньо підготовлений класифікатор CNN та застосуйте його до іншого набору даних зображення
Як би ви оптимізувати з заздалегідь навчених neural network застосовувати його в окрему проблему? Ви б просто додали більше шарів до попередньо підготовленої моделі та протестували її на своєму наборі даних? Наприклад, якщо завданням було використання CNN для класифікації шпалерних груп , я впевнений, що це не буде працювати безпосередньо …

2
Коли ми говоримо, що набір даних не підлягає класифікації?
Я багато разів аналізував набір даних, на якому я не міг зробити жодної класифікації. Щоб побачити, чи можу я отримати класифікатор, я зазвичай використовую такі кроки: Створіть графіки графіки мітки проти числових значень. Зменшіть розмірність до 2 або 3, щоб побачити, чи розділяються класи, також іноді пробуйте LDA. Намагайтеся налаштувати …

2
Класифікація документів за допомогою згорткової нейронної мережі
Я намагаюся використовувати CNN (звивисту нейронну мережу) для класифікації документів. CNN для короткого тексту / речень вивчався у багатьох працях. Однак, схоже, жоден папір не використовував CNN для довгого тексту чи документа. Моя проблема полягає в тому, що в документі занадто багато функцій. У моєму наборі даних кожен документ містить …

3
Неврівноважені класи - Як мінімізувати помилкові негативи?
У мене є набір даних, який має атрибут бінарного класу. Є 623 випадки з класом +1 (рак позитивний) та 101 671 екземпляр з класом -1 (рак негативний). Я випробував різні алгоритми (Naive Bayes, Random Forest, AODE, C4.5), і всі вони мають неприйнятні помилкові відхилення. Випадковий ліс має найвищу загальну точність …

3
Побудуйте двійковий класифікатор із лише позитивними та немеченими даними
У мене є 2 набори даних, один із позитивними примірниками того, що я хотів би виявити, і один з неозначеними екземплярами. Які методи я можу використовувати? Наприклад, припустимо, що ми хочемо зрозуміти, як виявити спам-електронну пошту на основі кількох структурованих характеристик електронної пошти. У нас є один набір даних 10000 …

4
Алгоритм генерації правил класифікації
Таким чином, у нас є потенціал для програми машинного навчання, яка досить чітко вписується в традиційну проблемну область, яку вирішують класифікатори, тобто у нас є набір атрибутів, що описують предмет та "відро", до якого вони в кінцевому підсумку. Однак, а не створювати моделі імовірностей, як у Naive Bayes або подібних …

3
Яку регресію використовувати для обчислення результату виборів у багатопартійності?
Я хочу зробити прогноз на результат парламентських виборів. Мій результат буде%, який отримує кожна сторона. Є більше двох сторін, тому логістична регресія не є життєздатним варіантом. Я міг би зробити окремий регрес для кожної сторони, але в такому випадку результати будуть якимось чином незалежними один від одного. Це не забезпечило …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.