Запитання з тегом «similarities»

Заходи близькості між розподілами, кластеризацією, наборами даних або іншими об'єктами.

6
Відсоток областей перекриття двох нормальних розподілів
Мені було цікаво, враховуючи два звичайних розподілу з таσ1, μ1σ1, μ1\sigma_1,\ \mu_1σ2, μ2σ2, μ2\sigma_2, \ \mu_2 як я можу обчислити відсоток перекриваються областей двох розподілів? Я думаю, ця проблема має конкретну назву, чи знаєте ви якесь конкретне ім’я, що описує цю проблему? Чи знаєте ви про будь-яку реалізацію цього (наприклад, …

2
Ієрархічна кластеризація даних змішаного типу - яку відстань / схожість використовувати?
У моєму наборі даних є як безперервні, так і природно дискретні змінні. Я хочу знати, чи можемо ми робити ієрархічну кластеризацію, використовуючи обидва типи змінних. І якщо так, то яка міра відстані підходить?

1
Порівняння ієрархічної кластеризації дендрограм, отриманих різними відстанями та методами
[Початкова назва "Вимірювання подібності для ієрархічних дерев кластеризації" згодом @ttnphns змінила, щоб краще відобразити тему] Я виконую ряд ієрархічних кластерних аналізів у кадрі даних пацієнтів (наприклад, подібний до http://www.biomedcentral.com/1471-2105/5/126/figure/F1?highres=y ) Я експериментую з різними мірами відстані , різною вагою параметрів та різними ієрархічними методами , щоб зрозуміти їх вплив на …

1
Перетворення матриці подібності в матрицю відстані (евклідова)
У алгоритмі випадкових лісів Брейман (автор) будує матрицю подібності таким чином: Надсилайте всі приклади навчання вниз по кожному дереву в лісі Якщо два приклади приземляються в один приріст листя, відповідний елемент у матриці подібності на 1 Нормалізуйте матрицю з кількістю дерев Він каже: Близькість між випадками n і k утворює …

2
Коефіцієнти подібності двійкових даних: Чому вибирають Жакарда над Расселом та Рао?
З Енциклопедії статистичних наук я розумію, що за даними дихотомічних (бінарних: 1 = присутній; 0 = відсутніх) атрибутів (змінних) ми можемо сформувати таблицю непередбачених ситуацій для будь-яких двох об'єктів i та j вибірки:ppp j 1 0 ------- 1 | a | b | i ------- 0 | c | d …

5
Чи є функція R, яка обчислить матрицю невідмінності косинусів? [зачинено]
Зачинено. Це питання поза темою . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Оновіть питання, щоб воно було тематичним для перехресної перевірки. Закритий минулого року . Я хотів би зробити теплову карту з кластеризацією рядків на основі косинусних відстаней. Я використовую R і heatmap.2()для виготовлення фігури. Я бачу, що …

5
Міри подібності між кривими?
Я хотів би обчислити міру схожості між двома впорядкованими наборами точок --- тими, що знаходяться під Користувачем, порівняно з тими, що знаходяться у Вчителя : Точки - це криві в тривимірному просторі, але я думав, що проблема спрощується, якщо будувати їх у двох вимірах, як на малюнку. Якщо точки перетинаються, …

3
Евклідова відстань та схожість
Я просто працюю з книгою «Колективний інтелект» (Тобі Сегаран) і натрапив на евклідову оцінку дистанції. У книзі автор показує, як обчислити схожість між двома рекомендаційними масивами (тобто .людина × фільм ↦ бал )person×movie↦score)\textrm{person} \times \textrm{movie} \mapsto \textrm{score}) Він обчислює евклідову відстань для двох осіб і p 2 по d ( …

4
Яка мета нормалізації рядків
Я розумію міркування щодо нормалізації стовпців, оскільки це призводить до того, що характеристики зважуються однаково, навіть якщо вони не вимірюються в одній шкалі - проте, часто в найближчій сусідній літературі обидва стовпці та рядки нормалізуються. Для чого / для чого нормалізувати рядки? Зокрема, як результат нормалізації рядків впливає на подібність …

3
Кількісне визначення подібності між двома наборами даних
Резюме : Намагаючись знайти найкращий метод, підсумовуйте схожість між двома вирівняними наборами даних, використовуючи одне значення. Деталі : Моє питання найкраще пояснити діаграмою. На графіках, наведених нижче, показано два різних набори даних, на кожному з яких позначено значення nfта nr. Точки вздовж осі x представляють місце проведення вимірювань, а значення …

1
Яка оптимальна функція відстані для індивідів, коли атрибути номінальні?
Я не знаю, яку функцію відстані між особами використовувати у випадку номінальних (не упорядкованих категоричних) атрибутів. Я читав підручник, і вони пропонують функцію простого узгодження, але деякі книги пропонують мені змінити номінальний на двійкові атрибути і використовувати коефіцієнт Жаккарда . Однак що робити, якщо значення номінального атрибута не дорівнюють 2? …

2
Чи працює теорема Мерсера у зворотному напрямку?
Колега має функцію і для наших цілей це чорний ящик. Функція вимірює подібність s ( a , b ) двох об'єктів.сsss ( a , b )s(a,b)s(a,b) Ми точно знаємо, що має такі властивості:сss Оцінки подібності - це реальні числа від 0 до 1, включно. Тільки об'єкти, які є самоідентичними, мають …

2
Техніка машинного навчання для вивчення строкових моделей
У мене є список слів, що належать до різних самовизначених категорій. Кожна категорія має свій рисунок (наприклад, одна має фіксовану довжину зі спеціальними символами, інша існує символами, які зустрічаються лише в цій категорії "слово", ...). Наприклад: "ABC" -> type1 "ACC" -> type1 "a8 219" -> type2 "c 827" -> type2 …

1
Як я можу включити інноваційний зовнішній вигляд під спостереження 48 у свою модель ARIMA?
Я працюю над набором даних. Після використання деяких методів ідентифікації моделі я вийшов із моделлю ARIMA (0,2,1). Я використав detectIOфункцію в пакеті TSAв R, щоб виявити інноваційний зовнішній вигляд (IO) під час 48-го спостереження за моїм оригінальним набором даних. Як я включу цей зовнішній вигляд у свою модель, щоб я …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

3
Як знайти подібність між часовими рядами?
У наступному прикладі я маю кадр даних, який складається з часового ряду вимірювань температури води, записаних на 5 глибинах в океані, де кожне значення Tempвідповідає даті в DateTimeі глибині в Depth. set.seed(1) Temp <- rnorm(43800,sd=20) AirT <- rnorm(8760,sd=20) Depth <- c(1:5) DateTime = seq(from=as.POSIXct("2010-01-01 00:00"), to=as.POSIXct("2010-12-31 23:00"), length=8760) Time <- …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.