Запитання з тегом «data-transformation»

Математичне повторне вираження значень даних, часто нелінійне. Дані часто перетворюються або для задоволення припущень статистичної моделі, або для того, щоб зробити результати аналізу більш зрозумілими.

4
Як узагальнити категоричні дані?
Я боровся з наступною проблемою, сподіваюсь, це легка проблема для статистиків (я програміст із деяким впливом на статистику). Мені потрібно узагальнити відповіді на опитування (для управління). В опитуванні є 100+ питань, згрупованих у різних областях (з приблизно 5 до 10 питань на область). Усі відповіді є категоричними (у порядковому масштабі …

3
Висловіть відповіді у вигляді оригінальних одиниць у трансформованих даних Box-Cox
Для деяких вимірювань результати аналізу належним чином представлені в трансформованій шкалі. У більшості випадків, однак, бажано представити результати в оригінальній шкалі вимірювання (інакше ваша робота більш-менш нікчемна). Наприклад, у випадку даних, що перетворюються в журнал, виникає проблема з інтерпретацією у вихідній шкалі, оскільки середнє значення зареєстрованих значень не є журналом …

5
Зменшення розмірності SVD для часових рядів різної довжини
Я використовую сингулярне значення декомпозиції як метод зменшення розмірності. З огляду на Nвектори розмірності D, ідея полягає у представленні ознак у перетвореному просторі некоррельованих розмірів, що конденсує більшу частину інформації даних у власних векторах цього простору у зменшуваному порядку важливості. Зараз я намагаюся застосувати цю процедуру до даних часових рядів. …

4
Регресійна модель, змінною реакції якої є день року, коли відбувається щорічна подія (як правило)
У цьому конкретному випадку я маю на увазі день, коли озеро замерзає. Ця "крижана" дата трапляється лише раз на рік, але іноді вона взагалі не відбувається (якщо зима тепла). Так що одного року озеро може замерзнути 20-го дня (20 січня), а іншого року воно може взагалі не замерзнути. Мета - …

2
Чи достатньо обґрунтування візуалізації для трансформації даних?
Проблема Я б хотів побудувати дисперсію, пояснювану кожним із 30 параметрів, наприклад, як барплот з різною смугою для кожного параметра та дисперсією по осі y: Однак відхилення сильно перекошені до малих значень, включаючи 0, як видно з гістограми нижче: Якщо я перетворять їх за допомогою , буде легше побачити відмінності …

1
Чи є
Мій колега хоче проаналізувати деякі дані після перетворення змінної відповіді, піднявши її до потужності (тобтоу0,125).1818\frac18у0,125у0,125y^{0.125} Мені це незручно, але я намагаюся сформулювати чому. Я не можу придумати жодного механістичного обгрунтування цієї трансформації. Також я ніколи не бачив цього раніше, і я переживаю, що, можливо, це завищує коефіцієнти помилок типу I …

1
Який найбільш підходящий спосіб перетворення пропорцій, коли вони є незалежною змінною?
Я думав, що розумію це питання, але зараз я не такий впевнений і хотів би поговорити з іншими, перш ніж продовжувати. У мене є дві змінні, Xі Y. Yє співвідношенням, і воно не обмежене 0 і 1 і, як правило, нормально розподілене. Xє пропорцією, і вона обмежена 0 і 1 …

4
Зрозуміло, що проблема добре підходить для лінійної регресії
Я вивчаю лінійну регресію, використовуючи Вступ до лінійного регресійного аналізу Монтгомері, Пека та Вінінга . Я хотів би вибрати проект аналізу даних. Я наївно вважаю, що лінійна регресія підходить лише тоді, коли можна підозрювати, що між пояснювальними змінними та змінною відповіді існують лінійні функціональні зв'язки. Але, здається, не багато додатків …

2
Чи більш імовірно, що зазвичай розподілені X і Y призводять до нормально розподілених залишків?
Тут обговорюється неправильне трактування припущення про нормальність в лінійній регресії (що "нормальність" позначає X та / або Y, а не залишки), і плакат запитує, чи можливо не нормально розподілені X і Y і все ще мають нормально розподілені залишки. Моє запитання: як правило, розподілені X і Y мають більше шансів …

3
Як перетворити лептокуртичний розподіл у нормальність?
Припустимо, у мене лептокуртична змінна, яку я хотів би перетворити на нормальність. Які перетворення можуть виконати це завдання? Я добре усвідомлюю, що перетворення даних може бути не завжди бажаним, але, мабуть, як академічне прагнення, я хочу "забити" дані в нормальність. Крім того, як ви можете зрозуміти з сюжету, всі значення …

1
Критерії вибору "найкращої" моделі в моделі прихованої Маркова
У мене є набір даних часових рядів, до яких я намагаюся встановити модель прихованої Маркова (HMM), щоб оцінити кількість прихованих станів у даних. Мій псевдо-код для цього: for( i in 2 : max_number_of_states ){ ... calculate HMM with i states ... optimal_number_of_states = "model with smallest BIC" ... } Тепер, …


1
Навіщо використовувати зареєстровані змінні?
Напевно, це дуже основне питання, але я, здається, не зможу знайти на нього твердої відповіді. Я тут сподіваюся, можу. Зараз я читаю документи як підготовку до власної магістерської роботи. Наразі я читаю документ, який досліджує взаємозв’язок між твітами та особливостями фондового ринку. В одній зі своїх гіпотез вони припускають, що …

2
Що робити, коли деякі моменти часу сильно перекосили відповіді, а деякі - у повторному дослідженні заходів?
Як правило, коли стикаються з безперервними, але перекошеними заходами результатів у поздовжньому дизайні (скажімо, з одним ефектом між суб'єктами), загальним підходом є перетворення результату на нормальність. Якщо ситуація екстремальна, наприклад, із усіченими спостереженнями, можна пофантазувати і скористатися моделлю кривої зростання Тобіта чи якоюсь такою. Але я в збитку, коли бачу …

2
Чи кращі моделі часових рядів журналу кращі за темпи зростання?
Часто я бачу, як автори оцінюють модель "різниці в журналі", наприклад журнал( ут) - журнал( уt - 1) = журнал( ут/ уt - 1) = α + βхтжурнал⁡(ут)-журнал⁡(ут-1)=журнал⁡(ут/ут-1)=α+βхт\log (y_t)-\log(y_{t-1}) = \log(y_t/y_{t-1}) = \alpha + \beta x_t Я погоджуюся, що це доречно співвідносити із зміною відсотків у тоді як - .y …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.