У чому різниця між генерацією та вилученням функцій?


13

Хтось може мені сказати, яка мета генерування функцій? і навіщо потрібне збагачення простору функцій перед класифікацією зображення? Це необхідний крок?

Чи є який-небудь спосіб збагатити простір функцій?

Відповіді:


13

Генерація функцій - це процес отримання необроблених, неструктурованих даних та визначення ознак (тобто змінних) для потенційного використання у вашому статистичному аналізі. Наприклад, у випадку видобутку тексту ви можете почати з необробленого журналу тисяч текстових повідомлень (наприклад, SMS, електронна пошта, повідомлення в соціальній мережі тощо) та створювати функції, видаляючи слова низької цінності (тобто стоп-слова) з використанням певного розміру блоки слів (тобто n-грам) або застосування інших правил.

Витяг функцій - Після створення функцій часто потрібно перевірити трансформації вихідних функцій та вибрати підмножину цього пулу потенційних оригінальних та похідних функцій для використання у вашій моделі (тобто вилучення та вибір функцій). Тестування отриманих значень - це звичайний крок, оскільки дані можуть містити важливу інформацію, яка має нелінійну закономірність або взаємозв'язок з вашим результатом, тому значення елемента даних може бути очевидним лише у його перетвореному стані (наприклад, похідні вищого порядку). Використання занадто великої кількості функцій може призвести до збільшення множинності узгодженості чи пом'якшення статистичних моделей, тоді як вилучення мінімальної кількості ознак відповідно до мети вашого аналізу слід за принципом посидючості.

Таким чином, покращення простору зображень часто є необхідним кроком у класифікації зображень чи інших об'єктів даних, оскільки необроблений простір функцій зазвичай заповнений величезною кількістю неструктурованих та нерелевантних даних, які містять у парадигмі «шум». "сигналу" та "шуму" (що означає, що деякі дані мають прогнозну цінність, а інші - не мають). Вдосконалюючи простір функцій, ви зможете краще визначити важливі дані, які мають прогнозне чи інше значення у вашому аналізі (тобто "сигнал"), видаляючи при цьому заплутану інформацію (тобто "шум").


2
Гарна відповідь! (+1)
Олександр Блех

1
Це моє задоволення!
Олександр Блех

Дякую .. Чи є які-небудь методи для збагачення простору функцій?
Саратха Прия

Звичайно. Таких методів існує багато. Наприклад, фільтр Gabor - це алгоритм виявлення краю фільтра смугового фільтра, який зазвичай використовується для створення функцій для розпізнавання обличчя та класифікації текстур. Це може використовуватися в поєднанні з алгоритмами класифікації, такими як підтримуючі векторні машини.
Hack-R

Чи можу я використовувати це для збагачення функцій у класифікації зображень?
Сарата Прия
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.