Запитання з тегом «data-visualization»

Побудова змістовних та корисних графічних зображень даних. (Якщо ваше питання стосується лише того, як отримати певне програмне забезпечення для створення певного ефекту, то, швидше за все, це не стосується тут.)

4
Як інтерпретувати сюжет QQ
Я працюю з невеликим набором даних (21 спостереження) і маю наступний звичайний QQ графік в R: Бачачи, що сюжет не підтримує нормальність, що я можу зробити висновок про базовий розподіл? Мені здається, що розподіл, перекошений вправо, був би кращим, це правильно? Крім того, які інші висновки можна зробити з даних?

4
Оцінка приблизного розподілу даних на основі гістограми
Припустимо, я хочу перевірити, чи мої дані експоненціальні на основі гістограми (тобто перекошені праворуч). Залежно від того, як я групую або обробляю дані, я можу отримати різко різні гістограми. Один набір гістограм зробить здається, що дані експоненціальні. З іншого набору буде здаватися, що дані не є експоненціальними. Як зробити чітко …

11
"Найкраща" серія кольорів, яка використовується для розмежування серії в сюжетах якості публікацій
Чи було проведено якесь дослідження щодо того, які найкращі кольори використовувати для показу кількох серій на одному сюжеті? Я щойно використовував параметри за замовчуванням matplotlib, і вони виглядають трохи по-дитячому, оскільки вони все яскраві, основні кольори.

1
Інтерпретація plot.lm ()
У мене виникло питання про інтерпретацію графіків, породжених сюжетом (лм) в Р. Мені було цікаво, чи можете ви, хлопці, сказати мені, як інтерпретувати розміщення розміру та залишкові важелі? Будь-які коментарі будуть вдячні. Припустимо базові знання зі статистики, регресії та економетрики.

3
Приклад: регресія LASSO з використанням glmnet для двійкового результату
Я починаю балуватися з використанням glmnetз LASSO регресією , де мій результат становить інтерес дихотомический. Я створив невеликий макетний кадр даних нижче: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 

3
Як створити гарний графік результатів кластерного аналізу k-означає?
Я використовую R для кластеризації K-засобів. Я використовую 14 змінних для запуску K-засобів Який досить спосіб побудувати результати K-засобів? Чи існують якісь реалізації? Чи має 14 змінних ускладнення побудови результатів? Я знайшов щось під назвою GGcluster, яке виглядає круто, але воно ще в розробці. Я також читав щось про картографування …

8
Створити випадкову змінну з визначеною кореляцією до існуючої змінної
Для дослідження моделювання я повинен генерувати випадкові змінні , які показують prefined (населення) кореляцію з існуючою YYY . Я подивився в Rпакети copulaі CDVineякі можуть виробляти випадкові багатовимірні розподілу із заданою структурою залежностей. Однак неможливо зафіксувати одну із отриманих змінних до існуючої змінної. Будь-які ідеї та посилання на існуючі функції …

4
Як уявити, що робить канонічний кореляційний аналіз (порівняно з тим, що робить аналіз основних компонентів)?
Канонічний кореляційний аналіз (CCA) - це техніка, що стосується аналізу основних компонентів (PCA). Хоча легко навчити PCA або лінійну регресію за допомогою діаграми розкидання (див. Кілька тисяч прикладів пошуку зображень google), я не бачив подібного інтуїтивного двовимірного прикладу для CCA. Як наочно пояснити, що робить лінійна CCA?

3
Як насправді побудувати зразкове дерево з randomForest :: getTree ()? [зачинено]
Кожен отримав бібліотечні чи кодові пропозиції щодо того, як насправді побудувати пару зразкових дерев : getTree(rfobj, k, labelVar=TRUE) (Так, я знаю, що ви не повинні цього робити оперативно, РФ - це чорна скринька тощо) як добре працюють кодовані фактори тощо) Попередні запитання без гідної відповіді: Як зробити випадкові ліси більш …


2
Як я можу змінити назву легенди в ggplot2? [зачинено]
У мене є сюжет, який я створюю в ggplot2, щоб узагальнити дані, що складаються з 2-х 4 х 3 даних з ядрами. Мені вдалося зробити панелі для дворівневої змінної за допомогою facet_grid(. ~ Age)та встановити осі x та y за допомогою aes(x=4leveledVariable, y=DV). Я раніше aes(group=3leveledvariable, lty=3leveledvariable)створював сюжет. Це дає …

3
Коли відповідні ваги журналу?
Я читав, що використання шкал журналів під час побудови графіків / графіків є доцільним у певних обставинах, наприклад, вісь y у діаграмі часових рядів. Однак мені не вдалося знайти остаточного пояснення, чому це так, або коли це було б доречно. Будь ласка, майте на увазі, що я не статистик, тому …

12
Програмне забезпечення, необхідне для скребки даних із графіка [закрито]
Хто-небудь має досвід роботи з програмним забезпеченням (бажано, вільним, бажано з відкритим кодом), яке буде робити зображення даних, нанесених на декартових координатах (стандартний, повсякденний сюжет) та витягувати координати точок, нанесених на графік? По суті, це проблема обміну даними та проблема зворотної візуалізації даних.

8
Сучасний наступник дослідницького аналізу даних Tukey?
Я читав книгу Тукі «Дослідницький аналіз даних». Написана в 1977 році, книга наголошує на методах паперу / олівця. Чи є більш «сучасний» наступник, який враховує, що ми можемо миттєво побудувати великі набори даних?

6
Як визначити найкращу точку відсічення та її довірчий інтервал за допомогою кривої ROC у R?
У мене є дані тесту, які можна було б використовувати для розрізнення нормальних і пухлинних клітин. Згідно кривої ROC, для цієї мети добре виглядає (площа під кривою 0,9): Мої запитання: Як визначити точку відсічення для цього тесту та його довірчий інтервал, коли показання слід оцінювати як неоднозначні? Який найкращий спосіб …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.