Я працював над новим методом аналізу та аналізу наборів даних для ідентифікації та ізоляції підгруп населення без попереднього усвідомлення особливостей будь-якої підгрупи. Хоча метод досить добре працює зі штучними зразками даних (тобто наборами даних, створеними спеціально для ідентифікації та сегрегації підмножини населення), я хотів би спробувати протестувати його з живими даними.
Що я шукаю - це вільно доступне (тобто неконфіденційне, невласне) джерело даних. Переважно такий, який містить бімодальні або мультимодальні розподіли або, очевидно, складається з декількох підмножин, які не можуть бути легко роз'єднані традиційними способами. Куди мені піти, щоб знайти таку інформацію?