Існує кілька класичних наборів даних для завдань машинного навчання класифікації / регресії. Найпопулярніші:
Але хтось знає подібні набори даних для аналізу мереж / теорії графіків? Більш конкретно - я шукаю стандартні набори даних Gold для порівняння / оцінки / навчання:
- заходи централізації;
- алгоритми мережевого кластеризації.
Мені не потрібен величезний перелік загальнодоступних мереж / графіків, але пара насправді повинна знати набори даних.
Редагувати:
Надати точні функції для "золотого стандартного набору даних" досить складно, але ось деякі думки. Я думаю, справжній класичний набір даних повинен відповідати цим критеріям:
- Кілька посилань у статтях та підручниках;
- Включення до відомих програмних пакетів мережевого аналізу;
- Достатній час існування;
- Використання в ряді курсів з аналізу графіка.
Що стосується моєї сфери інтересів, мені також потрібні марковані класи для вершин та / або попередньо обчислені (або заздалегідь визначені) "бали авторитету" (тобто оцінки центральності). Задавши це питання, я продовжив пошук, і ось кілька придатних прикладів:
- Карате-клуб Закарі : запроваджений у 1977 році, цитований більше 1,5 тис. Разів (за даними Google Scholar), вершини мають атрибут Faction (який можна використовувати для кластеризації).
- Мережа співпраці Ердоса : на жаль, я не знайшов цю мережу у вигляді файлу даних, але він досить відомий, і якщо хтось збагатить мережу даними спеціалізацій математиків, він також може бути використаний для тестування алгоритмів кластеризації.