Статистика та великі дані data-transformation

4

Я боровся з наступною проблемою, сподіваюсь, це легка проблема для статистиків (я програміст із деяким впливом на статистику). Мені потрібно узагальнити відповіді на опитування (для управління). В опитуванні є 100+ питань, згрупованих у різних областях (з приблизно 5 до 10 питань на область). Усі відповіді є категоричними (у порядковому масштабі …

13 categorical-data data-transformation descriptive-statistics

3

Висловіть відповіді у вигляді оригінальних одиниць у трансформованих даних Box-Cox

Для деяких вимірювань результати аналізу належним чином представлені в трансформованій шкалі. У більшості випадків, однак, бажано представити результати в оригінальній шкалі вимірювання (інакше ваша робота більш-менш нікчемна). Наприклад, у випадку даних, що перетворюються в журнал, виникає проблема з інтерпретацією у вихідній шкалі, оскільки середнє значення зареєстрованих значень не є журналом …

13 data-transformation confidence-interval t-test interpretation

5

Зменшення розмірності SVD для часових рядів різної довжини

Я використовую сингулярне значення декомпозиції як метод зменшення розмірності. З огляду на Nвектори розмірності D, ідея полягає у представленні ознак у перетвореному просторі некоррельованих розмірів, що конденсує більшу частину інформації даних у власних векторах цього простору у зменшуваному порядку важливості. Зараз я намагаюся застосувати цю процедуру до даних часових рядів. …

13 time-series machine-learning pca data-transformation multivariate-analysis

4

Регресійна модель, змінною реакції якої є день року, коли відбувається щорічна подія (як правило)

У цьому конкретному випадку я маю на увазі день, коли озеро замерзає. Ця "крижана" дата трапляється лише раз на рік, але іноді вона взагалі не відбувається (якщо зима тепла). Так що одного року озеро може замерзнути 20-го дня (20 січня), а іншого року воно може взагалі не замерзнути. Мета - …

13 regression time-series survival data-transformation recurrent-events

2

Чи достатньо обґрунтування візуалізації для трансформації даних?

Проблема Я б хотів побудувати дисперсію, пояснювану кожним із 30 параметрів, наприклад, як барплот з різною смугою для кожного параметра та дисперсією по осі y: Однак відхилення сильно перекошені до малих значень, включаючи 0, як видно з гістограми нижче: Якщо я перетворять їх за допомогою , буде легше побачити відмінності …

13 data-visualization data-transformation histogram

1

Чи є

Мій колега хоче проаналізувати деякі дані після перетворення змінної відповіді, піднявши її до потужності (тобтоу0,125).1818\frac18у0,125у0,125y^{0.125} Мені це незручно, але я намагаюся сформулювати чому. Я не можу придумати жодного механістичного обгрунтування цієї трансформації. Також я ніколи не бачив цього раніше, і я переживаю, що, можливо, це завищує коефіцієнти помилок типу I …

12 regression data-transformation aic

1

Який найбільш підходящий спосіб перетворення пропорцій, коли вони є незалежною змінною?

Я думав, що розумію це питання, але зараз я не такий впевнений і хотів би поговорити з іншими, перш ніж продовжувати. У мене є дві змінні, Xі Y. Yє співвідношенням, і воно не обмежене 0 і 1 і, як правило, нормально розподілене. Xє пропорцією, і вона обмежена 0 і 1 …

12 r regression data-transformation nonlinear-regression proportion

4

Зрозуміло, що проблема добре підходить для лінійної регресії

Я вивчаю лінійну регресію, використовуючи Вступ до лінійного регресійного аналізу Монтгомері, Пека та Вінінга . Я хотів би вибрати проект аналізу даних. Я наївно вважаю, що лінійна регресія підходить лише тоді, коли можна підозрювати, що між пояснювальними змінними та змінною відповіді існують лінійні функціональні зв'язки. Але, здається, не багато додатків …

12 regression data-transformation model linear regression-strategies

2

Чи більш імовірно, що зазвичай розподілені X і Y призводять до нормально розподілених залишків?

Тут обговорюється неправильне трактування припущення про нормальність в лінійній регресії (що "нормальність" позначає X та / або Y, а не залишки), і плакат запитує, чи можливо не нормально розподілені X і Y і все ще мають нормально розподілені залишки. Моє запитання: як правило, розподілені X і Y мають більше шансів …

12 regression normal-distribution data-transformation residuals assumptions

3

Як перетворити лептокуртичний розподіл у нормальність?

Припустимо, у мене лептокуртична змінна, яку я хотів би перетворити на нормальність. Які перетворення можуть виконати це завдання? Я добре усвідомлюю, що перетворення даних може бути не завжди бажаним, але, мабуть, як академічне прагнення, я хочу "забити" дані в нормальність. Крім того, як ви можете зрозуміти з сюжету, всі значення …

12 normal-distribution data-transformation kurtosis qq-plot

1

Критерії вибору "найкращої" моделі в моделі прихованої Маркова

У мене є набір даних часових рядів, до яких я намагаюся встановити модель прихованої Маркова (HMM), щоб оцінити кількість прихованих станів у даних. Мій псевдо-код для цього: for( i in 2 : max_number_of_states ){ ... calculate HMM with i states ... optimal_number_of_states = "model with smallest BIC" ... } Тепер, …

12 r aic hidden-markov-model bic spss manova time-series r lme4-nlme regression modeling negative-binomial bayesian bugs state-space-models hypothesis-testing data-transformation factor-analysis sem

2

Коваріація перетворених випадкових величин

У мене є дві випадкові величини і .X>0X>0X > 0Y>0Y>0Y > 0 З огляду на те, що я можу оцінити як я можу оцінитиCov(X,Y),Cov(X,Y),\text{Cov}(X, Y),Cov(log(X),log(Y))?Cov(log⁡(X),log⁡(Y))?\text{Cov}(\log(X), \log(Y))?

12 data-transformation covariance random-variable

1

Навіщо використовувати зареєстровані змінні?

Напевно, це дуже основне питання, але я, здається, не зможу знайти на нього твердої відповіді. Я тут сподіваюся, можу. Зараз я читаю документи як підготовку до власної магістерської роботи. Наразі я читаю документ, який досліджує взаємозв’язок між твітами та особливостями фондового ринку. В одній зі своїх гіпотез вони припускають, що …

12 correlation data-transformation logarithm

2

Що робити, коли деякі моменти часу сильно перекосили відповіді, а деякі - у повторному дослідженні заходів?

Як правило, коли стикаються з безперервними, але перекошеними заходами результатів у поздовжньому дизайні (скажімо, з одним ефектом між суб'єктами), загальним підходом є перетворення результату на нормальність. Якщо ситуація екстремальна, наприклад, із усіченими спостереженнями, можна пофантазувати і скористатися моделлю кривої зростання Тобіта чи якоюсь такою. Але я в збитку, коли бачу …

12 repeated-measures data-transformation skewness

2

Чи кращі моделі часових рядів журналу кращі за темпи зростання?

Часто я бачу, як автори оцінюють модель "різниці в журналі", наприклад журнал( ут) - журнал( уt - 1) = журнал( ут/ уt - 1) = α + βхтжурнал⁡(ут)-журнал⁡(ут-1)=журнал⁡(ут/ут-1)=α+βхт\log (y_t)-\log(y_{t-1}) = \log(y_t/y_{t-1}) = \alpha + \beta x_t Я погоджуюся, що це доречно співвідносити із зміною відсотків у тоді як - .y …

12 time-series forecasting data-transformation econometrics logarithm

Запитання з тегом «data-transformation»