У мене таке враження, що велика частина того, що робиться тут, надзвичайно евристична. Насправді, здається, більшість людей застосовують це до <120 символів заяв щебетання. Ймовірно, результати (хоча не обчислюються таким чином) не набагато кращі, ніж підрахунок "позитивних" та "негативних" слів з інформацією про позицію ("кращий, ніж В" = позитивний для A, негативний для B)
Коли ви бачите компанії, які купують повну стрічку Twitter (це скільки мбіт в секунду?) І заявляють, що робити аналіз настроїв на це, це серйозно змушує мене замислитися, чи є тут якась статистична обгрунтованість . Недарма, наприклад, Yahoo не вдається погано передбачити передвибори для Південної Кароліни: http://www.technologyreview.com/web/39487/
Люди спосіб горда і захоплені тільки будучи взагалі здатний обробляти обсяг даних, вони повністю , здається, бездоглядності правильно перевірки їх роботи.
Вибачте, що песимістично ставитеся до сучасного рівня.