Хтось може мені сказати, яка мета генерування функцій? і навіщо потрібне збагачення простору функцій перед класифікацією зображення? Це необхідний крок?
Чи є який-небудь спосіб збагатити простір функцій?
Хтось може мені сказати, яка мета генерування функцій? і навіщо потрібне збагачення простору функцій перед класифікацією зображення? Це необхідний крок?
Чи є який-небудь спосіб збагатити простір функцій?
Відповіді:
Генерація функцій - це процес отримання необроблених, неструктурованих даних та визначення ознак (тобто змінних) для потенційного використання у вашому статистичному аналізі. Наприклад, у випадку видобутку тексту ви можете почати з необробленого журналу тисяч текстових повідомлень (наприклад, SMS, електронна пошта, повідомлення в соціальній мережі тощо) та створювати функції, видаляючи слова низької цінності (тобто стоп-слова) з використанням певного розміру блоки слів (тобто n-грам) або застосування інших правил.
Витяг функцій - Після створення функцій часто потрібно перевірити трансформації вихідних функцій та вибрати підмножину цього пулу потенційних оригінальних та похідних функцій для використання у вашій моделі (тобто вилучення та вибір функцій). Тестування отриманих значень - це звичайний крок, оскільки дані можуть містити важливу інформацію, яка має нелінійну закономірність або взаємозв'язок з вашим результатом, тому значення елемента даних може бути очевидним лише у його перетвореному стані (наприклад, похідні вищого порядку). Використання занадто великої кількості функцій може призвести до збільшення множинності узгодженості чи пом'якшення статистичних моделей, тоді як вилучення мінімальної кількості ознак відповідно до мети вашого аналізу слід за принципом посидючості.
Таким чином, покращення простору зображень часто є необхідним кроком у класифікації зображень чи інших об'єктів даних, оскільки необроблений простір функцій зазвичай заповнений величезною кількістю неструктурованих та нерелевантних даних, які містять у парадигмі «шум». "сигналу" та "шуму" (що означає, що деякі дані мають прогнозну цінність, а інші - не мають). Вдосконалюючи простір функцій, ви зможете краще визначити важливі дані, які мають прогнозне чи інше значення у вашому аналізі (тобто "сигнал"), видаляючи при цьому заплутану інформацію (тобто "шум").