Функція Трансформація у вхідних даних


22

Я читав про рішення цього виклику OTTO Kaggle, і на першому місці рішення, здається, використовує кілька перетворень для вхідних даних X, наприклад Log (X + 1), sqrt (X + 3/8) тощо. Чи є загальне керівництво щодо того, коли слід застосовувати перетворення якого типу до різних класифікаторів?

Я розумію поняття середньої вар та мінімальної нормування. Однак, для перерахованих вище перетворень, я гадаю, що Log та Sqrt використовуються для стиснення динамічного діапазону даних. Зсув осі x - це лише перегляд даних. Однак автор вирішує використовувати різні методи нормалізації для одного і того ж входу X при подачі в різні класифікатори. Будь-які ідеї?


1
Не маю ідеї, що могло б запропонувати такий формул, але ви можете подивитися на трансформації box-cox, які пропонують показники змінних.
anymous.asker

Відповіді:


19

Ми любимо нормальну форму

У більшості випадків ми намагаємось змусити їх діяти як нормально. Це не точка зору класифікаторів, але його вигляд вилучення!

Яка трансформація ?

Основним критерієм при виборі трансформації є: що працює з даними? Як свідчать вище приклади, важливо також розглянути два питання.

Що має фізичний (біологічний, економічний, будь-який) сенс, наприклад, з точки зору обмеження поведінки, оскільки значення набувають дуже малих чи дуже великих розмірів? Це питання часто призводить до використання логарифмів.

Чи можемо ми зберегти розміри та одиниці простими та зручними? Якщо можливо, ми віддаємо перевагу вимірювальним шкалам, про які легко думати.

Корінь куба об'єму і квадратний корінь площі мають обидва розміри довжини, тому далеко не ускладнюючи їх, такі перетворення можуть спростити їх. Як правило, зворотні запити мають прості одиниці. Однак часто дещо складні одиниці - це жертва, яку треба зробити.

Коли використовувати що ?

Найбільш корисними перетвореннями в аналізі вступних даних є зворотна, логарифм, кубічний корінь, квадратний корінь і квадрат. Далі, навіть коли це не підкреслюється, передбачається, що перетворення використовуються лише в діапазонах, на яких вони дають (кінцеві) реальні числа як результати.

  • Зворотна : Взаємна , x до 1 / x, з побратимом від'ємного зворотного, x до -1 / x, є дуже сильним перетворенням з різким впливом на форму розподілу. Його не можна застосувати до нульових значень. Хоча це може бути застосовано до негативних значень, воно не є корисним, якщо всі значення не є позитивними. Зворотний коефіцієнт часто може трактуватися так само легко, як і саме співвідношення: Приклад:
    • щільність населення (людей на одиницю площі) стає площею на людину
    • особи на одного лікаря стають лікарями на людину
    • темпи ерозії стають часом для стирання одиничної глибини

(На практиці ми можемо захотіти помножити або розділити результати прийняття зворотного на якусь константу, наприклад, 1000 або 10000, щоб отримати числа, які легко управляти, але це само по собі не впливає на скасованість або лінійність.)

Зворотний зворотний порядок серед значень одного знака: найбільше стає найменшим і т. Д. Від’ємний зворотний зберігає порядок серед значень одного знака.


  • Логарифм : логарифм, x log 10 x, або x log ex або ln x, або x log 2 x, є сильним перетворенням, що має великий вплив на форму розподілу. Він зазвичай використовується для зменшення косості вправо і часто підходить для вимірюваних змінних. Його не можна застосовувати до нульових або негативних значень. Одна одиниця в логарифмічній шкалі означає множення на основу використовуваних логарифмів. Експонентний ріст чи спад.

    • у=аехp(бх)

робиться лінійним на - так що змінна відповіді y повинна реєструватися. (Тут exp () означає підняття до потужності e, приблизно 2.71828, що є основою природних логарифмів). Відхилення від цього експоненціального рівняння зростання чи спаду: , так що a - сума або підрахунок, коли x = 0. Якщо a і b> 0, то y росте швидше і швидша швидкість (наприклад, складений відсоток або неконтрольований приріст населення), тоді як якщо a> 0 і b <0, y зменшується повільніше і повільніше (наприклад, радіоактивне розпад).лну=лна+бхх=0у=аехp(0)=а


  • Функції живлення :
  • у=ахб робиться лінійним шляхом так що обидва змінні y та x повинні бути записані. Осторонь таких функцій живлення : поставте , а для ,логу=лога+блогх
    х=0б>0

  • у=ахб=0 тому функція сили для позитивного b проходить через початок, що часто має фізичний чи біологічний чи економічний сенс. Подумайте: чи означає нуль для х значення нуля для у? Така
    функція живлення - це форма, яка
    досить добре відповідає багатьом наборам даних .

    • Розглянемо співвідношення y = p / q, де p і q на практиці позитивні.
  • Приклади:

    • Самці / жінки
    • Утриманці / працівники
    • Нижня довжина / довжина Downvalley
  • Тоді y десь між 0 і нескінченністю, або в останньому випадку, між 1 і нескінченністю. Якщо p = q, то y = 1. Такі визначення часто призводять до перекошених даних, оскільки є чітка нижня межа і немає чіткої верхньої межі. Логарифм, однак, а саме

  • log y = log p / q = log p - log q, знаходиться десь між-нескінченністю та нескінченністю, а p = q означає, що log y = 0. Отже, логарифм такого відношення, швидше за все, буде симетричнішим.


  • Корінь куба : Корінь куба, х 1/3 . Це досить сильна трансформація, яка суттєво впливає на форму розподілу: вона слабша, ніж логарифм. Він також використовується для зменшення прямої косості і має ту перевагу, що його можна застосувати до нульових та негативних значень. Зауважимо, що кубик кореня об'єму має одиниці довжини. Він зазвичай застосовується для даних про кількість опадів.

    • Застосування до негативних значень вимагає особливої ​​примітки. Розглянемо
      (2) (2) (2) = 8 і (-2) (- 2) (- 2) = -8. Ці приклади показують, що
      корінь куба від’ємного числа має негативний знак і таке ж
      абсолютне значення, як і корінь куба еквівалентного додатного числа. Подібною властивістю володіє будь-який інший корінь, сила якого є
      зворотним непарним натуральним числом (повноти 1/3, 1/5, 1/7 тощо)

    • Ця властивість трохи делікатна. Наприклад, змінимо потужність просто на smidgen з 1/3, і ми більше не можемо визначати результат як добуток з точно трьох термінів. Однак майно може бути використане, якщо корисно.


  • Квадратний корінь : квадратний корінь, від x до = sqrt (x), - це перетворення з помірним впливом на форму розподілу: він слабший, ніж логарифм і корінь куба. Він також застосовується для зменшення прямої косості, а також має ту перевагу, що його можна застосувати до нульових значень. Зауважте, що квадратний корінь площі має одиниці довжини. Він зазвичай застосовується до підрахованих даних, особливо якщо значення здебільшого досить малі.х(1/2)

  • Квадрат : Квадрат, від x до , має помірний вплив на форму розподілу, і він може бути використаний для зменшення косого зліва. На практиці основною причиною його використання є підгонка відповіді квадратичною функцією . Квадратика має точку повороту - максимум чи мінімум, хоча точка повороту функції, пристосованої до даних, може бути далеко за межі спостережень. Відстань тіла від початку є квадратичною, якщо тіло рухається при постійному прискоренні, що дає дуже чітке фізичне обґрунтування для використання квадратичного. Інакше квадратика зазвичай використовується виключно тому, що вони можуть імітувати aх2

    у=а+бх+cх2




    взаємозв'язок у регіоні даних. Поза межами цього регіону вони можуть
    вести себе дуже погано, оскільки вони приймають довільно великі значення для екстремальних значень x, і якщо тільки перехоплення a не обмежене 0, вони можуть поводитись нереально близькими до початку.
    • Шкіряння зазвичай має сенс лише в тому випадку, якщо відповідна змінна дорівнює нулю або додатній, враховуючи, що і однакові.(-х)2х2


дякую за пост. дуже корисно. Ви можете, можливо, доповнити його деякими прикладами та малюнками, що зображають, як вони перетворюють вихідні дані в відокремлювані дані?
Mvkt

1
@svk: Я просто відформатував таким чином, щоб це було зрозуміло, я думаю, що Хаді була людиною, яка написала відповідь. Якщо я здогадуюсь правильно, він, можливо, скопіював із якоїсь книги. Подивимось, чи відповість він щось назад / пропонує. Ще б написати відповідь
Toros91

2
як @ Toros91 сказав: Це поєднання різних джерел, я настійно рекомендую подивитися, як виграти змагання з наукових даних: Вчіться у найкращих каглерів, а також документи з статистикою
Хаді Гарібі

алрит. хоча може хтось із вас, будь ласка, опублікувати якийсь приклад коду в python чи matlab про те, як перетворити осі x на масштаб кореня sq.root або куб matlab має графік журналу для масштабу журналу. але для інших масштабів буде корисно скласти сюжет із перетвореними осями
Mvkt,

1

Ці конкретні можуть бути чисто евристичними. Для зображень, хоча це досить стандартно: змініть RGB на BGR і відніміть середнє значення з кожного пікселя. Це використовується у всіх конкурсах / наборах даних, таких як Imagenet, Pascal VOC, MS COCO. Причина полягає в тому, що мережа представлена ​​стандартизованим набором даних, оскільки всі зображення можуть бути дуже різними.


0

Те саме тут - не маю уявлення, цього раніше не бачили. Я здогадуюсь, вони спробували різні перетворення і вибрали ту, яка найкраще працювала. Оскільки у звіті йдеться про те, що деякі інші перетворення також були б чудовими.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.