Запитання з тегом «data-transformation»

Математичне повторне вираження значень даних, часто нелінійне. Дані часто перетворюються або для задоволення припущень статистичної моделі, або для того, щоб зробити результати аналізу більш зрозумілими.

5
Як змінити дані між широкими та довгими форматами в R? [зачинено]
Ви можете мати дані у широкому або довгому форматі. Це досить важлива річ, оскільки корисні методи різні, залежно від формату. Я знаю, що вам потрібно працювати melt()і зcast() з пакетом переформатування, але, здається, деякі речі я не розумію. Чи може хтось дати мені короткий огляд, як ви це робите?

4
Аналіз зі складними даними, що-небудь інше?
Скажімо, наприклад, ви робите лінійну модель, але дані є складними.yуy y=xβ+ϵу=хβ+ϵ y = x \beta + \epsilon Мій набір даних є складним, оскільки всі числа у мають вигляд . Чи є щось процедурно інше при роботі з такими даними?( a + b i )yуy(a+bi)(а+бi)(a + bi) Я прошу, бо ви …

2
Які припущення щодо негативної біноміальної регресії?
Я працюю з великим набором даних (конфіденційним, тому я не можу надто багато поділитися), і прийшов до висновку, що необхідна негативна біноміальна регресія. Я ніколи раніше не робив регрес glm, і не можу знайти чіткої інформації про те, що таке припущення. Вони однакові для MLR? Чи можу я перетворити змінні …

3
Чи завжди відбілювання добре?
Поширений крок попередньої обробки алгоритмів машинного навчання - відбілювання даних. Здається, що завжди добре робити відбілювання, оскільки це де-корелює дані, спрощуючи моделювання. Коли відбілювання не рекомендується? Примітка: я маю на увазі декореляцію даних.

2
Перетворення змінних для множинної регресії в R
Я намагаюся виконати кратну регресію в R. Однак моя залежна змінна має такий сюжет: Ось матриця розсіювання з усіма моїми змінними ( WARє залежною змінною): Я знаю, що мені потрібно виконати перетворення на цій змінній (а можливо, і незалежних змінних?), Але я не впевнений у необхідній точній трансформації. Чи може …

3
Нормалізація матриці на стовпчик в R [закрито]
Зачинено. Це питання поза темою . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Оновіть питання, щоб воно було тематичним для Cross Valified. Закрито 6 років тому . Я хотів би виконати стовпчикову нормалізацію матриці в Р. З огляду на матрицю m, я хочу нормалізувати кожен стовпчик, поділяючи кожен елемент …

4
Коли потрібно увійти, перетворіть часовий ряд, перш ніж підходити до моделі ARIMA
Раніше я використовував прогноз про для прогнозування одномірного часового ряду, але перемикаю свій робочий процес на Р. Пакет прогнозування для R містить безліч корисних функцій, але одне, що він не робить, - це будь-яке перетворення даних перед запуском автоматичного .arima (). У деяких випадках прогноз про вирішує записати дані перетворення, …

3
Як моделювати цей непарний розподіл (майже зворотний J)
Моя залежна змінна, показана нижче, не відповідає жодному мені відомості про розподіл запасів. Лінійна регресія створює дещо ненормальні залишки з правою косою, які відносяться до передбачуваного Y незвичайним чином (2-й графік). Будь-які пропозиції щодо перетворень чи інші способи отримання найбільш вагомих результатів та найкращої точності прогнозування? Якщо можливо, я хотів …

7
Чому, наприклад, стать зазвичай кодується 0/1, а не 1/2?
Я розумію логіку кодування для аналізу даних. Моє запитання нижче стосується використання певного коду. Чи є причина, чому стать часто кодується як 0 для жіночої та 1 для чоловічої? Чому це кодування вважається "стандартним"? Порівняйте це з Жіноча = 1 та Чоловіча = 2. Чи є проблема з цим кодуванням?

3
Чому силові або журнальні перетворення мало навчаються в машинному навчанні?
Машинне навчання (МЛ) активно використовує лінійні та логістичні методи регресії. Він також спирається на особливість інженерних методів ( feature transform, kernel, і т.д.). Чому нічого не згадується про variable transformation(наприклад power transformation) в ML? (Наприклад, я ніколи не чую про те, щоб увімкнути або ввійти до функцій; вони, як правило, …

6
Розширені приклади регресійного моделювання
Я шукаю розширений випадок лінійної регресії, що ілюструє кроки, необхідні для моделювання складних, декількох нелінійних зв’язків за допомогою GLM або OLS. Напрочуд складно знайти ресурси, що виходять за рамки базових шкільних прикладів: більшість прочитаних книг не піде далі, ніж перетворення журналу відповіді, поєднане з BoxCox одного прогноктора, або природний сплайн …

4
Трансформація для збільшення куртозу та косості нормальних об
Я працюю над алгоритмом, який спирається на те, що спостереження YYY s зазвичай розподіляються, і я хотів би перевірити стійкість алгоритму до цього припущення емпірично. Щоб зробити це, я шукав послідовність перетворень T1(),…,Tn()T1(),…,Tn()T_1(), \dots, T_n() , яка буде поступово руйнувати нормальності YYY . Наприклад, якщо YYY s нормальні, вони мають …

3
Як інтерпретувати коефіцієнти регресії, коли реакція трансформувалася 4-м коренем?
Я використовую четверту кореневу ( 1/4) потужність перетворення на моїй змінній реакції, як результат гетероскедастичності. Але зараз я не впевнений, як інтерпретувати свої коефіцієнти регресії. Я припускаю, що мені потрібно взяти коефіцієнти до четвертої потужності при зворотній трансформації (див. Нижче вихід регресії). Усі змінні є в одиницях долара в мільйонах, …

6
Зміна шкали змінної до 0-100
Я побудував індекс соціального капіталу, використовуючи техніку PCA. Цей показник містить значення як позитивні, так і негативні. Я хочу перетворити / перетворити цей індекс в масштаб 0-100, щоб його було легко інтерпретувати. Скажіть, будь ласка, найпростіший спосіб зробити це.

2
Перетворення даних про пропорції: коли квадратного кореня арцина недостатньо
Чи існує (сильніша?) Альтернатива трансформації кореня квадратного дугу для даних про відсотки / пропорції? У наборі даних, над яким я працюю на даний момент, позначена гетеросцедастичність залишається після того, як я застосую цю трансформацію, тобто графік залишків та встановлених значень все ще є дуже ромбоїдним. Відредаговано для відповіді на коментарі: …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.