Запитання з тегом «unsupervised-learning»

Пошук прихованої (статистичної) структури в мітках даних, включаючи кластеризацію та вилучення функцій для зменшення розмірності.

3
Як створити гарний графік результатів кластерного аналізу k-означає?
Я використовую R для кластеризації K-засобів. Я використовую 14 змінних для запуску K-засобів Який досить спосіб побудувати результати K-засобів? Чи існують якісь реалізації? Чи має 14 змінних ускладнення побудови результатів? Я знайшов щось під назвою GGcluster, яке виглядає круто, але воно ще в розробці. Я також читав щось про картографування …

2
Як можна використовувати штучну нейронну мережу ANN для кластеризації без нагляду?
Я розумію, як artificial neural network (ANN)можна тренуватися під наглядом, використовуючи зворотні пропорції для поліпшення пристосування, зменшуючи помилку в прогнозах. Я чув, що ANN може бути використаний для непідвладного навчання, але як це можна зробити без якоїсь функції витрат для керування етапами оптимізації? За допомогою k-засобів або алгоритму ЕМ існує …


4
Які відмінності між розрідженим кодуванням та автокодером?
Рідке кодування визначається як вивчення надмірно повного набору базових векторів для представлення вхідних векторів (<- чому ми цього хочемо). Які відмінності між розрідженим кодуванням та автокодером? Коли ми будемо використовувати розріджене кодування та автокодер?

3
Чому існує різниця між ручним обчисленням логістичної регресії 95% довірчого інтервалу та використанням функції conint () в R?
Дорогі всі - я помітив щось дивне, чого я не можу пояснити, чи не так? Підсумовуючи: ручний підхід до обчислення довірчого інтервалу в моделі логістичної регресії та функції R confint()дають різні результати. Я пережив прикладну логістичну регресію Hosmer & Lemeshow (2-е видання). У 3-й главі є приклад обчислення коефіцієнта шансів …
34 r  regression  logistic  confidence-interval  profile-likelihood  correlation  mcmc  error  mixture  measurement  data-augmentation  r  logistic  goodness-of-fit  r  time-series  exponential  descriptive-statistics  average  expected-value  data-visualization  anova  teaching  hypothesis-testing  multivariate-analysis  r  r  mixed-model  clustering  categorical-data  unsupervised-learning  r  logistic  anova  binomial  estimation  variance  expected-value  r  r  anova  mixed-model  multiple-comparisons  repeated-measures  project-management  r  poisson-distribution  control-chart  project-management  regression  residuals  r  distributions  data-visualization  r  unbiased-estimator  kurtosis  expected-value  regression  spss  meta-analysis  r  censoring  regression  classification  data-mining  mixture 

2
Вибір правильного методу зв'язку для ієрархічної кластеризації
Я здійснюю ієрархічну кластеризацію даних, які я зібрав і обробив з дампу даних Reddit в Google BigQuery. Мій процес такий: Отримайте останні 1000 публікацій в / r / polit Зберіть всі коментарі Обробляти дані та обчислювати n x mматрицю даних (n: користувачі / зразки, m: повідомлення / функції) Обчисліть матрицю …

2
Навчальне навчання, непідконтрольне навчання та посилення навчання: основи робочого процесу
Контрольоване навчання 1) Людина будує класифікатор на основі вхідних та вихідних даних 2) Цей класифікатор навчається з навчальним набором даних 3) Цей класифікатор тестується за допомогою тестового набору даних 4) Розгортання, якщо вихід задовільний Для використання, коли: "Я знаю, як класифікувати ці дані, мені просто потрібно (класифікатор) для їх сортування". …

5
Розмежування двох груп у статистиці та машинному навчанні: тест гіпотез проти класифікації та кластеризації
Припустимо, що у мене є дві групи даних, позначені A і B (кожна містить, наприклад, 200 зразків та 1 ознака), і я хочу знати, чи вони різні. Я міг би: а) провести статистичний тест (наприклад, t-тест), щоб перевірити, чи є вони статистично різними. б) використовувати контрольоване машинне навчання (наприклад, класифікатор …

3
Навчання без нагляду, нагляду та напівконтролю
У контексті машинного навчання, в чому різниця між непідконтрольне навчання контрольоване навчання та напівконтрольне навчання? І які основні алгоритмічні підходи слід переглянути?

3
Щоденний аналіз часових рядів
Я намагаюся зробити аналіз часових рядів і я новачок у цій галузі. Я щодня перераховую подію 2006–2009 рр. І хочу приєднати до неї модель часових рядів. Ось прогрес, який я досяг: timeSeriesObj = ts(x,start=c(2006,1,1),frequency=365.25) plot.ts(timeSeriesObj) Отриманий сюжет я отримую: Щоб перевірити, чи є сезонність і тенденція в даних, чи ні, …

5
Процедура кластеризації, коли кожен кластер має рівну кількість балів?
У мене є кілька точок в R pX={x1,...,xn}X={x1,...,xn}X=\{x_1,...,x_n\}RpRpR^p , і я хочу об'єднати точки так, щоб: Кожен кластер містить рівну кількість елементів . (Припустимо, що кількість кластерів ділить nXXXnnn .) Кожен кластер є «просторово згуртованим» у певному сенсі, як кластери з значень.kkk Легко придумати безліч процедур кластеризації, які задовольняють одну …

3
Керована кластеризація чи класифікація?
Друге питання полягає в тому, що я виявив, що в дискусії десь в Інтернеті говорив про "контрольовану кластеризацію", наскільки я знаю, кластеризація без нагляду, тож який саме сенс стоїть під "контрольованим кластеризацією"? Яка різниця щодо "класифікації"? Про це багато посилань: http://www.cs.uh.edu/docs/cosc/technical-reports/2005/05_10.pdf http://books.nips.cc/papers/files/nips23/NIPS2010_0427.pdf http://engr.case.edu/ray_soumya/mlrg/supervid_clustering_finley_joachims_icml05.pdf http://www.public.asu.edu/~kvanlehn/Stringent/PDF/05CICL_UP_DB_PWJ_KVL.pdf http://www.machinelearning.org/proceedings/icml2007/papers/366.pdf http://www.cs.cornell.edu/~tomf/publications/supervid_kmeans-08.pdf http://jmlr.csail.mit.edu/papers/volume6/daume05a/daume05a.pdf тощо ...

2
Генеративні та дискримінаційні моделі (в баєсівському контексті)
Які відмінності між генеративною та дискримінаційною (дискримінантною) моделлю (в контексті байєсівського навчання та умовиводу)? і що це стосується прогнозування, теорії рішень або непідконтрольного навчання?

3
Як передбачити результат лише з позитивних випадків як навчання?
Для простоти, скажімо, я працюю на класичному прикладі спам / не-спам-листів. У мене є набір 20000 електронних листів. З них я знаю, що 2000 - це спам, але я не маю жодного прикладу не-спам-листів. Я хотів би передбачити, чи залишилися 18000 спамом чи ні. В ідеалі результат, який я шукаю, …

2
Яке багаторазове припущення в навчанні, яке знаходиться під наглядом?
Я намагаюся розібратися, що означає багатозначне припущення в навчанні, яке знаходиться під наглядом. Чи може хтось пояснити простим способом? Я не можу за цим зрозуміти інтуїцію. Це говорить про те, що ваші дані лежать на низькомірному колекторі, вбудованому у простор більш високого розміру. Я не зрозумів, що це означає.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.