Для експерименту ми хотіли б використовувати Emoji, вбудований у багато твітів, як основну інформацію правди / навчання для простого кількісного аналізу почуттів. Твіти зазвичай занадто неструктуровані, щоб NLP працював добре.
У будь-якому випадку в Unicode 6.0 є 722 Emoji, і, ймовірно, ще 250 буде додано в Unicode 7.0.
Чи є база даних (наприклад, SentiWordNet), яка містить анотації настроїв для них?
(Зверніть увагу, що SentiWordNet також дозволяє отримати неоднозначні значення. Вважайте, наприклад, смішно , що не є просто позитивним: "це смішно смачно", мабуть, не є позитивним ... те ж саме стосуватиметься, ;-)
наприклад. Але я не думаю, що це складніше для Emoji, ніж це для звичайних слів ...)
Крім того, якщо у вас є досвід їх використання для аналізу настроїв, мені було б цікаво почути.