Як називається оператор, який приймає категоричний вектор і перетворює його у двійкове представлення за допомогою однокольорового кодування? Мені цікаво, оскільки я пишу науковий документ і мені потрібна відповідна назва.
Як називається оператор, який приймає категоричний вектор і перетворює його у двійкове представлення за допомогою однокольорового кодування? Мені цікаво, оскільки я пишу науковий документ і мені потрібна відповідна назва.
Відповіді:
Статистики називають одноразове кодування як фіктивне кодування . Як запропонували інші (включаючи Scortchi в коментарях), це не точний синонім, але це термін, який зазвичай використовувався для кодованих категорійних змінних 0-1.
Див. Також: "Змінна манекена" проти "змінної індикатора" для номінальних / категоричних даних
Це залежить від вашої цільової аудиторії.
Як сказав Тім , статистики називають це фіктивним кодуванням, і саме це я б очікував побачити, описуючи щось на зразок регресійної моделі. "Змінені фіксованими змінні були включені для налаштування місця розташування магазину." Я думаю, що називати це гарячим кодуванням, здавалося б, трохи дивно.
Однак, як також сказав інший Тім , кодування в режимі «гарячого» є досить поширеним явищем у машинній навчальній літературі. Це слабко припускає наявність вузлів (як у нейронній мережі), фізичних проводів (у пристрої) чи чогось подібного, щонайменше, для мене.
Формально я думаю, ви застосовуєте набір функцій індикаторів , але це, мабуть, занадто формально поза доказом.
Термін походить від інженерії електроніки. Подумайте лише, хто назвав би 1 "гарячим"? Тільки ті, хто працює з електрикою, де "гаряче" або "живе" означає, що на дроті є електричний потенціал . "Один гарячий" стосується конструкції схеми, де дискретний рівень електричного сигналу на одному проводі буде декодуватися в гарячий / холодний набір проводів. Я думаю, що деякі люди з машинного навчання з фоном EE знайшли аналогію переконливою.
У економетрії та статистиці ви можете зустріти dummy
або indicator
змінні, які є досить схожими, оскільки вони використовуються для представлення окремих категорій з їх різними показниками. Однак є незначна різниця. Наприклад, ви робите манекени K-1 для K категорій, тому що базова категорія відповідає всім манекенам, встановленим на 0. На відміну від цього, я думаю, що в одному гарячому кодуванні ви маєте K проводів, де базова категорія матиме власний провід ( змінна).
Я статистично підготовлений, і останнім часом чую про «гаряче кодування» в машинному навчанні / comp sci lit. Я, як правило, просто називав однонагріту матрицю як матрицю дизайну / матрицю даних / рамку дизайну.
У фізичних науках та техніці його називають (узагальненою) дельтою Кронекера .
У найпростішому вигляді дельта Kroneker визначається як хоча це тривіально узагальнено до
Отже, " ", як правило, читатиметься як що найбільше автори прагнуть усікати до " ", якщо категорія очевидна з контексту.
Дельта Kronecker справді корисна в Sigma / Pi / Einstein / тощо. позначення, оскільки він дозволяє умовно визначати терміни.
Просто, щоб пов'язати це із загальними структурами програмування, дельтою Кронекера condition?1:0
, де ?:
є умовний оператор .
Як дотична нота, я б закликав авторів відмовитися від старої моди на користь узагальненого еквівалента, . Немає переваги старомодним позначенням, тоді як узагальнені позначення є більш явними та розширюваними.
Розпізнавання образів та машинне навчання Крістофера Бішопа використовує схему терміна -of- .К
Ось цитата з книги,
Бінарні змінні можуть бути використані для опису величин, які можуть приймати одне з двох можливих значень. Однак часто ми зустрічаємо дискретні змінні, які можуть приймати один з можливих взаємовиключних станів. Хоча існують різні альтернативні способи вираження таких змінних, ми незабаром побачимо, що особливо зручним поданням є схема -of- , в якій змінна представлена -вимірним вектором у якому один із елементи дорівнюють , а всі інші елементи рівні . Так, наприклад, якщо у нас є змінна, яка може приймати1 K K x x k 1 0 K = 6 x 3 = 1 xстани, і певне спостереження змінної, можливо, відповідає стану, де , тоді буде представлений символом,