У мене виникають труднощі вибрати правильний спосіб візуалізації даних. Скажімо, у нас є книгарні, які продають книги , і кожна книга має принаймні одну категорію .
Для книгарні, якщо порахувати всі категорії книг, ми отримуємо гістограму, яка показує кількість книг, які потрапляють у певну категорію для цієї книгарні.
Я хочу візуалізувати поведінку книгарні, хочу перевірити, чи вони надають перевагу категорії перед іншими категоріями. Я не хочу бачити, чи вони віддають перевагу науковій фантастиці всі разом, але хочу побачити, чи ставляться вони до кожної категорії однаково чи ні.
Маю ~ 1М книгарні.
Я продумав 4 методи:
Відібрати дані, показати лише 500 гістограм книгарні. Покажіть їх на 5 окремих сторінках за допомогою сітки 10х10. Приклад сітки 4x4:
Те саме, що №1. Але цього разу сортуйте значення осі x відповідно до їх рахунку, тому, якщо є користь, це буде видно легко.
Уявіть, як скласти гістограми №2 разом, як колоду, і показати їх у 3D. Щось на зразок цього:
Замість використання кольору третьої осі для подання кольорів, тому використовуючи теплову карту (2D гістограма):
Якщо книгарні, як правило, віддають перевагу одним категоріям перед іншими, вони відображатимуться як гарний градієнт зліва направо.
Чи є у вас інші ідеї / засоби візуалізації для представлення декількох гістограм?