Ви можете використовувати такий метод, як eigenface, http://en.wikipedia.org/wiki/Eigenface . Далі наведено хороші відомості про процедуру, а також посилання на різні реалізації.
http://www.pages.drexel.edu/~sis26/Eigenface%20Tutorial.htm
Звідси прийнято використовувати це в класифікаційному підході, тренувати модель, а потім прогнозувати випадки. Ви можете це зробити, тренуючись на купі відомих знаменитостей, і якщо ви передбачите обличчя з твіттера як таке у вашій тренованій моделі знаменитостей, видаліть його. Подібно до цього http://blog.cordiner.net/2010/12/02/eigenfaces-face-recognition-matlab/
Це страждає від постійних поправок. Незабаром з'явиться новий Джастін Бібер, який не буде у вашій навчальній моделі, тому ви не можете передбачити це. Також є такий випадок, як Уітні Х'юстон, ви, можливо, ніколи не думали додати її раніше, але вона може бути загальним зображенням з поваги та захоплення протягом декількох тижнів. У вас не буде недоліків малюнків малюка, як було сказано вище. Щоб вирішити ці проблеми, ви можете скористатись більше підходом до ієрархічної кластеризації. Видаляючи перші кілька наборів кластерів, які дуже близькі, якщо вони досягають певного рівня підтримки, ваш перший кластер містить 15 елементів до того, як буде побудований другий. Тепер вам не доведеться турбуватися про те, хто в вашій моделі тренувань, але ви потрапите до питання малюнків малюка.