Ідентифікація сарказму вважається однією з найскладніших проблем відкритого типу в галузі ML та NLP.
Отже, чи було проведено якісь значні дослідження на тому фронті? Якщо так, то яка точність? Будь ласка, поясніть також коротко модель NLP.
Ідентифікація сарказму вважається однією з найскладніших проблем відкритого типу в галузі ML та NLP.
Отже, чи було проведено якісь значні дослідження на тому фронті? Якщо так, то яка точність? Будь ласка, поясніть також коротко модель NLP.
Відповіді:
Наступна стаття опитування дослідників IIT Bombay підсумовує останні досягнення в галузі виявлення сарказму: Arxiv link .
Стосовно вашого запитання, я не думаю, що це вважається надзвичайно складним чи відкритим. Хоча це вводить неоднозначність, з якою комп’ютери ще не можуть впоратися, люди легко здатні зрозуміти сарказм і, таким чином, здатні позначити набори даних для виявлення сарказму.
Нещодавно була проведена робота в тому ж домені, де нейронні мережі (точні CNN) використовуються з тією ж метою. Деяка інформація. про дослідження це:
Щоб вивчити цей контекст, у статті описаний метод, за допомогою якого нейронна мережа знаходить "вбудовування" користувача - тобто контекстні підказки, такі як вміст попередніх твітів, пов'язані інтереси та акаунти тощо. Він використовує ці різні фактори для побудови користувача з іншими, і (в ідеалі) виявляє, що вони утворюють відносно чітко визначені групи.
Отже, у статті використовуються CNN, вкладення слів та користувачів для виявлення сарказму в тексті. Про це також є стаття Techcrunch .
У статті використовується почуття твіту та порівнюється з почуттям інших подібних твітів:
Якщо почуття твіту, здається, не погоджуються з основною частиною того, що висловлюють подібні користувачі, є велика ймовірність використання сарказму.