Запитання з тегом «data-visualization»

Побудова змістовних та корисних графічних зображень даних. (Якщо ваше питання стосується лише того, як отримати певне програмне забезпечення для створення певного ефекту, то, швидше за все, це не стосується тут.)

3
За яким розподілом слід мої дані?
Скажімо, що у мене є 1000 компонентів, і я збирав дані про те, скільки разів цей помилок записується, і кожен раз, коли вони реєстрували помилку, я також відслідковую, скільки часу моїй команді потрібно було вирішити проблему. Коротше кажучи, я записував час на ремонт (у секундах) для кожного з цих 1000 …

7
Статистичні методи для більш ефективного побудови даних при наявності мільйонів балів?
Я вважаю, що R може зайняти тривалий час для створення сюжетів, коли присутні мільйони балів - не дивно, враховуючи, що бали розміщуються окремо. Крім того, такі сюжети часто занадто захаращені та щільні, щоб бути корисними. Багато пунктів перекриваються і утворюють чорну масу, і багато часу витрачається, будуючи більше точок на …

3
Який хороший спосіб використовувати R, щоб зробити розсіювач, який розділяє дані обробкою?
Я взагалі новачок із R та статистикою взагалі, але мені потрібно зробити розсип, який, на мою думку, може перевищити його власні можливості. У мене є пара векторів спостережень, і я хочу зробити з ними розсип, і кожна пара потрапляє в одну з трьох категорій. Я хотів би зробити розсип, який …

4
Оптимізація кривих точності пригадування при дисбалансі класу
У мене є завдання класифікації, де у мене є ряд предикторів (один з яких є найбільш інформативним), і я використовую модель MARS для побудови свого класифікатора (мене цікавить будь-яка проста модель, і використання glms для ілюстративних цілей було б теж добре). Зараз у мене є величезний класовий дисбаланс у навчальних …

3
Візуалізація перетинів багатьох множин
Чи існує модель візуалізації, яка б добре відображала перетин перетину багатьох наборів? Я думаю про щось на зразок діаграм Венна, але це якось може піддавати себе більшої кількості наборів, таких як 10 і більше. У Вікіпедії є кілька вищих діаграм Венна, але навіть 4-х діаграми є дуже важливими. Думаю, що …

6
Лінійний графік має занадто багато рядків, чи є краще рішення?
Я намагаюсь графікувати кількість дій користувачів (у даному випадку "лайків") протягом часу. Отже, у мене є "Кількість дій" як вісь y, моя вісь x - час (тижні), і кожен рядок представляє одного користувача. Моя проблема полягає в тому, що я хочу переглянути ці дані для набору з приблизно 100 користувачів. …

2
Інтерпретація біплотів в аналізі основних компонентів
Я натрапив на цей чудовий підручник: Посібник зі статистичних аналізів за допомогою Р. Глава 13. Аналіз основних компонентів: Олімпійський шестиборство про те, як робити PCA на мові R. Я не розумію тлумачення рисунка 13.3: Тому я будую перший власний вектор проти другого власного вектора. Що це означає? Припустимо, власне значення, …

2
Інтерпретація сюжету (glm.model)
Чи може хто-небудь сказати мені, як інтерпретувати графіки "залишки та пристосованість", "нормальні q-q", "масштаб-розташування" та "залишки проти важеля"? Я встановлюю двочленний GLM, зберігаю його, а потім малюю його.

3
Який тест можна використати для порівняння укосів двох або більше регресійних моделей?
Я хотів би перевірити різницю у відповіді двох змінних на один предиктор. Ось мінімальний відтворюваний приклад. library(nlme) ## gls is used in the application; lm would suffice for this example m.set <- gls(Sepal.Length ~ Petal.Width, data = iris, subset = Species == "setosa") m.vir <- gls(Sepal.Length ~ Petal.Width, data = …

1
Обчислювальна повторюваність ефектів від lmer-моделі
Я щойно натрапив на цю статтю , в якій описано, як обчислити повторюваність (він же - надійність, також внутрішньокласова кореляція) вимірювання за допомогою моделювання змішаних ефектів. R-код буде: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 

6
Проблеми з круговими діаграмами
Здається, все частіше обговорюється кругова діаграма. Основними аргументами проти цього, здається, є: Площа сприймається з меншою потужністю, ніж довжина. Кругові діаграми мають дуже низьке співвідношення «точка-піксель» Однак я думаю, що вони можуть бути якось корисні при зображенні пропорцій. Я погоджуюся використовувати таблицю в більшості випадків, але коли ви пишете бізнес-звіт, …

6
Які альтернативи зламаним осям?
Користувачі часто спокушаються розбити значення осі, щоб представити дані різних порядків на одному графіку (див. Тут ). Хоча це може бути зручно, це не завжди кращий спосіб відображення даних (може бути в омані в кращому випадку). Які альтернативні способи відображення даних, які відрізняються за кількома порядками? Я можу придумати два …

4
Навіщо використовувати кольорову карту viridis над струменем?
Як було оголошено в https://www.youtube.com/watch?v=xAoljeRJ3lU , Matplotlib змінює кольорову карту за замовчуванням з реактивної на viridis. Однак я це не дуже добре розумію. Можливо тому, що я кольоровий? Оригінальний струмінь кольорової карти виглядає дуже сильним, я відчуваю контраст: У той час як у новій кольоровій карті viridis не вистачає цього …

5
Як додати нелінійну лінію тренду до ділянки розкиду в R? [зачинено]
Зачинено. Це питання поза темою . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Оновіть питання, щоб воно було тематичним для перехресної перевірки. Закритий минулого року . У мене сюжет розкидання. Як я можу додати нелінійну лінію тренду?

4
Створення візуально привабливих теплових карт щільності в R
Хоча я знаю, що існує ряд функцій для генерації теплових карт в R, проблема полягає в тому, що я не в змозі створити візуально привабливі карти. Наприклад, наведені нижче зображення є хорошими прикладами теплових карт, яких я хочу уникати. У першому явно бракує деталей, тоді як другий (на основі тих …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.