Я погоджуюся, що "найкращий" сюжет не існує незалежно від набору даних, читацької інформації та мети. Для двох виміряних змінних ділянки ділянок розкиду, можливо, є конструкцією, яка залишає всі інші на своєму шляху, за винятком конкретних цілей, але жодного такого лідера ринку не очевидно для категоричних даних.
Моя мета тут лише згадати простий метод, який часто переосмислюють або заново вигадують, але, однак, також часто не помічають навіть у монографіях чи підручниках, що охоплюють статистичну графіку.
Приклад спочатку, що охоплює ті самі дані, що і опубліковані xan:
Якщо потрібне ім'я, як це часто буває, це двостороння діаграма (в даному випадку). Я не буду каталогізувати тут інших термінів, за винятком того, що декілька бархартів - одна поширена альтернатива з подібним смаком. (Моє невелике заперечення проти "декількох діаграм" полягає в тому, що "множина" не виключає дуже поширених штабельних або бічних смужкових діаграм, тоді як "двостороння" для мене більш чітко передбачає компонування рядків і стовпців, хоча, у свою чергу, це може взяти приклади, щоб зробити це зрозумілим.)
Плюси і мінуси для подібного роду сюжетів теж прості, але я детально розкажу. Оскільки я захоплююсь цим дизайном (який приходить щонайменше до 1930-х років), інші, можливо, хочуть додати більш гострої критики.
+1. Ідею легко зрозуміти навіть нетехнічним групам. Висота смуги або довжина смуги кодують частоти в цьому прикладі. В інших прикладах вони можуть кодувати відсотки, обчислені будь-яким способом, залишки тощо.
+2. Структура рядків і стовпців відповідає структурі таблиці . Ви також можете додавати числові значення. Дуже невеликі кількості і навіть неявні нулі добре видно, що не завжди трапляється з іншими конструкціями (наприклад, складеними штрих-діаграмами, мозаїчними сюжетами). Маркування рядків і стовпців зазвичай ефективніше, ніж додавання ключа або легенди, з ментальним «назад і вперед», яке вимагає. Таким чином, ця конструкція гібридизує ідеї графіків та таблиць, що, здавалося б, непокоїть деяких читачів; навпаки, я б заперечував, що сильні відмінності між Фігурами та Таблицями є лише історичними перекриттями, застарілими тепер, коли дослідники можуть готувати власні документи і не повинні покладатися на дизайнерів, композиторів та принтерів.
+3. Розширення на тристоронні та більш високі конструкції в принципі прості . Покладіть дві чи більше змінних у вигляді складених змінних на одну або обидві осі, або наведіть масив таких графіків. Природно, чим складніша конструкція, тим складніша інтерпретація.
+4. Конструкція чітко допускає порядкові змінні на будь-якій осі. Порядок може бути виражений (наприклад) відповідним відтінком, а також порядком категорій на цій осі. Порядок категорій по осях можна визначити за їх значенням, а краще визначити за частотами; алфавітний порядок відповідно до текстових міток може бути за замовчуванням, але ніколи не повинен вважатися єдиним вибором.
-1. Будучи загальним у дизайні, сюжет може бути менш ефективним у виявленні певних видів відносин . Зокрема, мозаїчний сюжет може зробити відхилення від незалежності дуже чіткими. І навпаки, коли зв'язки між категоріальними змінними є складними або незрозумілими, то, як правило, жоден графік не гарний для показу більше, ніж слабкий факт.
-2. Деяким чином дизайн неефективний у використанні простору , залишаючи місце для кожної перехресної комбінації, незалежно від того, чи часто це відбувається. Це порока того ж принципу, що розглядається як чеснота. Конкретний дизайн вище пробілів категоріями однаково незалежно від їх частоти; жертвуючи, що часто жертвує читабельні граничні ярлики, що я дуже високо ціную. У цьому прикладі всі текстові мітки бувають дуже короткими, але це далеко не типово.
Примітка: дані Xan видаються просто вигаданими, тому я більше не спробую тлумачення, ніж намагаються в інших відповідях. Але деяка домашня мудрість заслуговує на останнє слово тут: найкращий дизайн для вас - це той, який найкраще передає вам та вашим читачам структуру реальних даних, які вас цікавлять.
Інші приклади включають
Як можна уявити взаємозв'язок між 3 категоричними змінними?
Графік залежності двох порядкових змінних