Відповіді:
Був створений великий індекс сторінок facebook і доступний у вигляді торрента (Це ~ 2,8 Гбіт) http://btjunkie.org/torrent/Facebook-directory-personal-details-for-100-million-users/3979e54c73099d291605e7579b90838c2cd86a8e9575
Набори даних Twitter позначені на Infochimps: http://infochimps.com/tags/twitter
Набір даних lastfm доступний на веб- сайті http://mtg.upf.edu/node/1671
Щойно знайшли це: 476 мільйонів твітів у Twitter (через @yarapavan ).
Ми створили набір даних Twitter для друзів користувачів у 2009 році, а потім у 2009 році. Додаткову інформацію можна знайти тут: http://strict.dista.uninsubria.it/?p=364
Соціальний графік Facebook, інсталяції додатків та користувачі Last.fm, події, групи за адресою http://odysseas.calit2.uci.edu/research/
Два набори даних (зібрані у квітні-травні 2009 р.), Що містять репрезентативні вибірки приблизно 1 мільйона користувачів у масштабах Facebook, з кількома анотованими властивостями: для кожного вибіркового користувача включено список друзів, налаштування конфіденційності та членство в мережі. Третій набір даних (зібраний в лютому 2008 р.) Включає двосторонній графік, який представляє інсталяції додатків користувачами Facebook. Четвертий набір даних із щоденними активними користувачами та установками додатків протягом 6 місяців (зібрано вересень 2007-лют 2008). П'ятий набір даних, що включає репрезентативну вибірку користувачів Last.fm, отриману за допомогою мультиграфського вибірки (зібраний липня 2010 року).
Хороший ресурс для пошуку наборів даних:
/ r / набори даних на Reddit.
Швидкий погляд на цю сторінку розкриває це джерело , яке може містити щось корисне для вас.
У цьому документі використовується набір даних у Facebook, який доступний тут. Ось опис авторів:
Дані включають повний набір вузлів та посилань (та деяку демографічну інформацію) зі 100 коледжів та університетів США за одноразовим знімком у вересні 2005 року.