Запитання з тегом «categorical-data»

Категоричні (також їх називають номінальними) дані можуть приймати обмежену кількість можливих значень, званих категоріями. Категоричні значення "мітка", вони не "вимірюють". Будь ласка, використовуйте тег [ordinal-data] для дискретних, але упорядкованих типів даних.

5
Який найкращий спосіб візуалізувати зв’язок між дискретними та безперервними змінними?
Який найкращий спосіб виявити зв’язок між: безперервна і дискретна змінна, дві дискретні змінні? Поки я використовував схеми розкидання, щоб переглянути зв'язок між безперервними змінними. Однак у випадку дискретних змінних бали даних накопичуються через певні інтервали. Таким чином, лінія найкращого пристосування може бути упередженою.


5
Як перекодувати категоричну змінну в числову змінну при використанні SVM або нейронної мережі
Для використання SVM або нейронної мережі йому потрібно перетворити (кодувати) категоричні змінні в числові змінні, нормальним методом у цьому випадку є використання 0-1 двійкових значень з k-м категоричним значенням, перетвореним у (0,0, .. ., 1,0, ... 0) (1 знаходиться на k-й позиції). Чи є інші методи для цього, особливо коли …

4
Чи можна із категоричними даними існувати кластери без змінних?
Намагаючись пояснити кластерні аналізи, люди звичайно неправильно розуміють процес як пов'язаний із тим, чи співвідносяться змінні. Один із способів позбавити людей від цієї плутанини - це такий сюжет: Це чітко відображає різницю між питанням, чи існують кластери, і питанням, чи пов'язані між собою змінні. Однак це лише ілюструє відмінність суцільних …

2
Інтерпретація бета-версій, коли є кілька категоричних змінних
Я розумію поняття, що - це середнє значення, коли категоріальна змінна дорівнює 0 (або є еталонною групою), даючи кінцевій інтерпретації, що коефіцієнт регресії - це різниця середнього значення для двох категорій. Навіть із> 2 категоріями я вважаю, що кожна пояснює різницю між середньою категорією та посиланням.β^0β^0\hat\beta_0β^β^\hat\beta Але що робити, якщо …

4
Неперехідність кореляції: кореляція між статтю та розміром мозку та розміром мозку та IQ, але немає кореляції між статтю та IQ
У блозі я знайшов таке пояснення, і хотів би отримати більше інформації про неперехідність кореляції: У нас є такі незаперечні факти: В середньому різниця в обсязі мозку між чоловіками і жінками Існує кореляція між IQ та розміром мозку; кореляція становить 0,33 і, таким чином, відповідає 10% варіабельності IQ З цих …

1
Як поводитися з SVM з категоричними атрибутами
У мене простір у 35 вимірів (атрибутів). Моя аналітична проблема - це проста класифікація. З 35 вимірів понад 25 є категоричними, і кожен атрибут приймає більше 50+ типів значень. У такому сценарії введення фіксованої змінної також не допоможе мені. Як я можу запустити SVM на просторі, який має безліч категоричних …

5
Яку підсумкову статистику використовувати для категоричних чи якісних змінних?
Просто для уточнення, коли я маю на увазі підсумкову статистику, я маю на увазі середній, середній квартільний діапазон, дисперсія, стандартне відхилення. Підсумовуючи однозначний, який є категоричним або якісним , враховуючи і номінальний, і ординарний випадки, чи є сенс знаходити його середній, медіанний, четвертичний діапазони, дисперсію та стандартне відхилення? Якщо так, …

2
Виявлення аномалії за допомогою манекенів (та інших дискретних / категоричних особливостей)
тл; д-р Який рекомендований спосіб поводження з discreteданими при виявленні аномалії? Який рекомендований спосіб поводження з categoricalданими при виявленні аномалії? Ця відповідь пропонує використовувати дискретні дані для простого фільтрування результатів. Можливо, замініть значення категорії на шанс спостереження? Вступ Це моя перша публікація тут, тому, будь ласка, якщо щось не здається …

1
Як перевірити статистичну значимість категоріальної змінної в лінійній регресії?
Якщо в лінійній регресії у мене є категоріальна змінна ... як я можу знати статичну значимість категоріальної змінної? Скажімо , фактор X1X1X_1 має 10 рівнів ... буде 10 різних результуючі значення т-під парасольки змінної один фактор ...X1X1X_1 Мені здається, що статистичне значення перевіряється для кожного рівня факторної змінної? Ні? @Macro: …

3
Чи краще побудувати класифікатор багатокласового рівня, ніж кілька двійкових?
Мені потрібно класифікувати URL-адреси на категорії. Скажімо, у мене є 15 категорій, на які я планую занулювати кожну URL-адресу. Чи краще 15-ти класичний класифікатор? Де я маю 15 міток і генерую функції для кожної точки даних. Або створити 15 двійкових класифікаторів, скажімо: Movie чи Non-Movie, і використати цифри, які я …

2
Важливе значення має фіктивні змінні
Я намагаюся зрозуміти, як я можу отримати важливість функції категоричної змінної, яка була розбита на фіктивні змінні. Я використовую scikit-learn, який не обробляє для вас категоричні змінні, як це роблять R або h2o. Якщо я розбиваю категоричну змінну вниз на манекенні змінні, я отримую окремі імпорти функцій для класу в …

1
Як ставитись до категоричних прогнозів у LASSO
Я запускаю LASSO, який має деякі категоричні прогнози змінних і деякі безперервні. У мене питання щодо категоричних змінних. Перший крок, який я розумію, - це розбити кожного з них на манекени, стандартизувати їх для справедливої ​​штрафу, а потім регресувати. Існує кілька варіантів для обробки фіктивних змінних: Включіть усі, крім однієї, …

2
Якісне кодування змінної в регресії призводить до "особливості"
У мене є незалежна змінна назва "якість"; ця змінна має 3 способи реагування (погана якість; середня якість; висока якість). Я хочу ввести цю незалежну змінну в свою багаторазову лінійну регресію. Коли у мене є двійкова незалежна змінна (фіктивна змінна, я можу кодувати 0/1 ), її легко ввести в модель множинної …

2
Альтернатива ситам / мозаїчним ділянкам для таблиць на випадок надзвичайних ситуацій
Я одного разу наткнувся на тип сюжету щодо категоричних даних (тобто таблиць на випадок надзвичайних ситуацій) в Інтернеті, який мені дуже сподобався, але я його ніколи не знайшов, і навіть не знаю, як це називається. Це було по суті як ситовий сюжет, в тому, що висота рядків і ширина стовпців …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.