Запитання з тегом «data-transformation»

Математичне повторне вираження значень даних, часто нелінійне. Дані часто перетворюються або для задоволення припущень статистичної моделі, або для того, щоб зробити результати аналізу більш зрозумілими.

2
Вибір сезонного методу розкладання
Сезонне коригування є важливим кроком попередньої обробки даних для подальшого дослідження. Однак у дослідника є ряд варіантів сезонного розкладання тренд-циклу. Найпоширенішими (судячи з кількості цитат в емпіричній літературі) конкуруючими сезонними методами декомпозиції є X-11 (12) -ARIMA, Tramo / Seats (обидва реалізовані в Demetra + ) та ' stl . Прагнучи …

4
Які правильні значення для точності та відкликання у кращих випадках?
Точність визначається як: p = true positives / (true positives + false positives) Чи правильно, що як true positivesі false positivesпідхід 0, точність наближається до 1? Те саме запитання для відкликання: r = true positives / (true positives + false negatives) Зараз я впроваджую статистичний тест, де мені потрібно обчислити …
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

2
Від рівномірного розподілу до експоненціального розподілу і навпаки
Ймовірно , це тривіальне питання, але мій пошук був безплідному до сих пір, в тому числі цієї статті в Вікіпедії , і «Compendium розподілів» документ . Якщо XXX має рівномірний розподіл, чи означає це, що слідує за експоненціальним розподілом?eXeXe^X Аналогічно, якщо слідує за експоненціальним розподілом, чи означає це, що слідує …

2
Обчислення стандартної помилки після log-перетворення
Розглянемо випадковий набір чисел, які зазвичай розподіляються: x <- rnorm(n=1000, mean=10) Ми хотіли б знати середню та стандартну помилки середньої величини, тому робимо наступне: se <- function(x) { sd(x)/sqrt(length(x)) } mean(x) # something near 10.0 units se(x) # something near 0.03 units Чудово! Однак припустимо, що ми не обов'язково знаємо, …

2
Чи перетворення журналу є дійсною технікою для тестування ненормальних даних?
Рецензуючи документ, автори констатують: "Змінні безперервного результату, що виявляють косий розподіл, були перетворені, використовуючи природні логарифми, до того, як були проведені t випробування для задоволення необхідних припущень щодо нормальності". Чи прийнятний це спосіб аналізу ненормативних даних, особливо якщо базовий розподіл не обов'язково є нормальним? Це може бути дуже дурним питанням, …

3
Як виконати ізометричне перетворення коефіцієнта журналу
У мене є дані про поведінку в русі (час, пробудений спати, сидячий та займаючись фізичними навантаженнями), який становить приблизно 24 (як у години на день). Я хочу створити змінну, яка фіксує відносний час, проведений у кожній з цих форм поведінки - мені сказали, що це може досягти ізометричне перетворення відношення …

5
У чому причина трансформації журналу використовується при розподілених праворуч розподілах?
Я колись це чув Перетворення журналу є найпопулярнішим для прямокосових розподілів у лінійній регресії чи квантильній регресії Хотілося б знати, чи є якась причина, що лежить в основі цього твердження? Чому перетворення журналу придатне для прямокутного розподілу? Як щодо розповсюдження лівої косою?

3
Що означає "нормалізація" та як переконатися, що зразок чи розподіл нормалізуються?
У мене є запитання, в якому він просить перевірити, чи нормалізується Уніфікований розподіл ( Uniform(a,b)Uniform(a,b){\rm Uniform}(a,b) ). Для одного, що означає нормалізація будь-якого розподілу? І два, як ми можемо перевірити, нормалізується чи ні розподіл? Я розумію, обчислюючи ми отримуємо нормалізовані дані , але тут він просить перевірити , нормалізується чи …

2
Порівняння AIC моделі та її перетвореної на журнал версії
Суть мого питання полягає в наступному: Нехай - багатоваріантна нормальна випадкова величина із середнім та матрицею коваріації . Нехай , тобто . Як я порівняю AIC моделі, придатної до спостережуваних реалізацій порівняно з моделлю, придатною до спостережуваних реалізацій ?Y∈RnY∈RnY \in \mathbb{R}^nμμ\muΣΣ\SigmaZ:=log(Y)Z:=log⁡(Y)Z := \log(Y)Zi=log(Yi),i∈{1,…,n}Zi=log⁡(Yi),i∈{1,…,n}Z_i = \log(Y_i), i \in \{1,\ldots,n\}YYYZZZ Моє початкове …

4
"Нормалізація" змінних для SVD / PCA
Припустимо , що ми маємо NNN вимірних величин, (a1,a2,…,aN)(a1,a2,…,aN)(a_1, a_2, \ldots, a_N) , ми робимо ряд M>NM>NM > N вимірювань, а потім хочете виконати сингулярне розкладання за результатами , щоб знайти осі самої високої дисперсії для MMM точок у NNN -вимірному просторі. ( Примітка: припустить , що кошти я вже …

2
Зворотна трансформація коефіцієнтів регресії
Я роблю лінійну регресію з перетвореною залежною змінною. Наступне перетворення було зроблено для того, щоб було допущено нормальність залишків. Нетрансформована залежна змінна була негативно перекошена, і наступне перетворення зробило її близькою до нормальної: Y=50−Yorig−−−−−−−−√Y=50−YorigY=\sqrt{50-Y_{orig}} де є залежною змінною у вихідній шкалі.YorigYorigY_{orig} Я думаю, що є сенс використовувати деяке перетворення на …

2
Чому перетворення даних в журнал перед проведенням аналізу основних компонентів?
Я слідую підручник тут: http://www.r-bloggers.com/computing-and-visualizing-pca-in-r/, щоб краще зрозуміти PCA. У посібнику використовується набір даних Iris і застосовується перетворення журналу до PCA: Зауважте, що у наведеному нижче коді ми застосовуємо перетворення журналу до безперервних змінних, як це запропоновано [1] та встановлених centerта scaleрівним TRUEу виклику prcompдля стандартизації змінних перед застосуванням PCA. …

2
Чому GLM відрізняється, ніж LM з перетвореною змінною
Як пояснено у цьому розкладі курсу (стор. 1) , лінійну модель можна записати у вигляді: y=β1x1+⋯+βpxp+εi,y=β1x1+⋯+βpxp+εi, y = \beta_1 x_{1} + \cdots + \beta_p x_{p} + \varepsilon_i, де - змінна відповіді, а - пояснювальна змінна .yyyxixix_{i}ithithi^{th} Часто з метою задоволення тестових припущень можна перетворити змінну відповіді. Наприклад, ми застосовуємо функцію …

2
Виведення нормалізуючого перетворення для ГЛМ
\newcommand{\E}{\mathbb{E}} Як A(⋅)=∫duV1/3(μ)A(⋅)=∫duV1/3(μ)A(\cdot) = \displaystyle\int\frac{du}{V^{1/3}(\mu)} нормалізує перетворення для експонентної сім'ї похідне? Більш конкретно : я спробував виконати ескіз розширення Тейлора на сторінці 3, слайд 1 тут, але у мене є кілька питань. З XXX з експоненціальної родини, перетворення h(X)h(X)h(X) та κiκi\kappa _i що позначає купілятор ithithi^{th} , слайди стверджують, що: …

4
Підводні камені, яких слід уникати при перетворенні даних?
Я домігся сильної лінійної залежності між моєю змінною XXX та YYY після подвійного перетворення відповіді. Модель була Y∼XY∼XY\sim X але я перетворив її на YX−−√∼X−−√YX∼X\sqrt{\frac{Y}{X}}\sim \sqrt{X} покращуючиR2R2R^2від .19 до .76. Зрозуміло, що я зробив деякі пристойні операції з цього приводу. Чи може хтось обговорити дефекти цього, наприклад, небезпеки надмірних перетворень …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.