Запитання з тегом «data-transformation»

Математичне повторне вираження значень даних, часто нелінійне. Дані часто перетворюються або для задоволення припущень статистичної моделі, або для того, щоб зробити результати аналізу більш зрозумілими.

2
Витяг точки даних із ковзної середньої?
Чи можливо витягнути точки даних із ковзних середніх даних? Іншими словами, якщо набір даних має лише прості ковзні середні показники попередніх 30 балів, чи можливо витягнути вихідні точки даних? Якщо так, то як?

2
Канонічний кореляційний аналіз із ранговою кореляцією
Канонічний кореляційний аналіз (CCA) має на меті максимізувати звичайну кореляцію Пірсона між продуктом і моментом (тобто коефіцієнт лінійної кореляції) лінійних комбінацій двох наборів даних. Тепер розглянемо той факт , що цей коефіцієнт кореляції тільки вимірює лінійні асоціацій - це причина того, чому ми використовуємо, наприклад, Spearman- ρρ\rho або Кендал з'єднання …

5
Що може бути причиною використання перетворення квадратних коренів на даних?
Чи є якась причина того, що я можу придумати, щоб перетворити дані квадратним коренем? Я маю на увазі те, що я завжди спостерігаю, це те, що R ^ 2 збільшується. Але це, мабуть, лише через центрування даних! Будь-яка думка цінується!

3
CDF підняли до влади?
Якщо - це CDF, схоже, що ( ) також є CDF.FZFZF_ZFZ(z)αFZ(z)αF_Z(z)^\alphaα>0α>0\alpha \gt 0 Питання: Це стандартний результат? З: Чи є хороший спосіб знайти функцію допомогою st , де x \ equiv g (z)gggX≡g(Z)X≡g(Z)X \equiv g(Z)FX(x)=FZ(z)αFX(x)=FZ(z)αF_X(x) = F_Z(z)^\alphax≡g(z)x≡g(z) x \equiv g(z) В основному, у мене є ще один CDF, FZ(z)αFZ(z)αF_Z(z)^\alpha . …

1
Перетворення даних на бажане середнє та стандартне відхилення
Я шукаю метод перетворення мого набору даних із його поточного середнього та стандартного відхилень до цільового середнього та цільового стандартного відхилення. В основному, я хочу зменшити / розширити дисперсію і масштабувати всі числа до середнього. Не працює два окремі лінійні перетворення, одне для стандартного відхилення, а потім середнє. Який метод …

2
Трансформація даних: Усі змінні чи лише ненормальні?
У статистиці відкриття Енді Філда за допомогою SPSS він заявляє, що всі змінні повинні бути перетворені. Однак у публікації: "Вивчення просторово залежних взаємозв'язків між землекористуванням та якістю води за допомогою географічно зваженої регресії I: Розробка та оцінка моделі" вони конкретно констатують, що трансформувались лише ненормальні змінні. Цей аналіз специфічний? Наприклад, …

1
Як боротися із поєднанням бінарних та безперервних входів у нейронні мережі?
Я використовую пакет nnet в R, щоб спробувати створити ANN для прогнозування ціни на нерухомість на кондо (особистий проект). Я новачок у цьому і не маю досвіду математики, тому, будь ласка, голі зі мною. У мене є вхідні змінні, які є бінарними та безперервними. Наприклад, деякі бінарні змінні, які спочатку …


3
Як моделювати поздовжні великі дані?
Традиційно ми використовуємо змішану модель для моделювання поздовжніх даних, тобто таких даних, як: id obs age treatment_lvl yield 1 0 11 M 0.2 1 1 11.5 M 0.5 1 2 12 L 0.6 2 0 17 H 1.2 2 1 18 M 0.9 ми можемо припустити випадковий перехоплення або нахил …

1
Як ентропія залежить від місця розташування та масштабу?
Ентропії безперервного розподілу з функцією щільності визначається як негативне в очікуванні і , отже , дорівнюєffflog(f),log⁡(f),\log(f), Hf=−∫∞−∞log(f(x))f(x)dx.Hf=−∫−∞∞log⁡(f(x))f(x)dx.H_f = -\int_{-\infty}^{\infty} \log(f(x)) f(x)\mathrm{d}x. Ми також говоримо, що будь-яка випадкова величина , розподіл якої має щільність має ентропію (Цей інтеграл добре визначений, навіть якщо має нулі, тому що може бути прийнято рівним нулю …

3
центрування та масштабування фіктивних змінних
У мене є набір даних, який містить як категоричні, так і безперервні змінні. Мені порадили перетворювати категоріальні змінні у бінарні змінні для кожного рівня (тобто A_level1: {0,1}, A_level2: {0,1}) - я думаю, що деякі називають це "фіктивними змінними". З огляду на це, чи не введено в оману центр і масштабувати …

3
Трансформація надзвичайно перекошених розподілів
Припустимо, що у мене є змінна, розподіл якої перекоситься позитивно на дуже високий ступінь, така що взяття журналу буде недостатньо для того, щоб привести його в діапазон косості для нормального розподілу. Які мої варіанти на даний момент? Що я можу зробити, щоб перетворити змінну в нормальний розподіл?

4
Boxplot еквівалент для важкохвостих розподілів?
Для приблизно нормально розповсюджених даних, боксплоти - це прекрасний спосіб швидкої візуалізації медіани та розповсюдження даних, а також наявності будь-яких залишків. Однак для більш важкохвостих розподілів, багато очок відображаються як екслієри, оскільки люди, що визначають перешкоди, визначаються як такі, що не мають фіксованого коефіцієнта IQR, і це, звичайно, відбувається набагато …

2
Var (X) відомо, як обчислити Var (1 / X)?
Якщо у мене є лише , як я можу обчислити ?V a r ( 1Var(X)Var(X)\mathrm{Var}(X)Var(1X)Var(1X)\mathrm{Var}(\frac{1}{X}) У мене немає ніякої інформації про розподіл , тому я не можу використовувати перетворення, або будь-які інші методи , які використовують розподіл ймовірностей .XXXXXX

3
Як обчислити шкалу оцінювання шкали Руссо і Крю (1993) для великих зразків?
Нехай тому для дуже короткого зразка типу його можна обчислити від знаходження го порядку статичного парних відмінностей: { 1 , 3 , 6 , 2 , 7 , 5 } kQн= Сн. { | Хi- Xj| ; i&lt;j }( k )Qn=Cn.{|Xi−Xj|;i&lt;j}(k)Q_n = C_n.\{|X_i-X_j|;i < j\}_{(k)}{ 1 , 3 , 6 …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.