Я б сказав, що з такими даними вам дійсно потрібно показувати результати в трансформованому масштабі. Це перший імператив і важливіше питання, ніж саме те, як намалювати сюжет коробки.
Але я повторюю Френку Харреллу, закликаючи щось більш інформативне, ніж мінімальний сюжетний сюжет, навіть із визначеними крайніми моментами. У вас є достатньо місця, щоб показати набагато більше інформації. Ось один із багатьох прикладів, гібридна коробка та квантильний сюжет. Як і у ваших даних, дві групи порівнюються.
Я візьму ці два пункти по одному і скажу більше.
Трансформована шкала
У найпростішому випадку всі ваші значення можуть бути позитивними, і вам слід спочатку спробувати скористатися логарифмічною шкалою.
Якщо у вас є точні нулі, квадратна коренева або кубикова коренева шкала все одно покращить надзвичайну косисть. Деякі люди задоволені журналом (значення + константа), де константа найчастіше 1, як спосіб подолання нулів.
Наслідки для графічних графіків використання трансформованої шкали є тонкими.
Якщо ви використовуєте загальну умову Тукі про показ індивідуально всіх точок, що перевищують верхній квартал + 1,5 IQR або нижній квартіль - 1,5 IQR, то, певно, ці межі слід розраховувати за перетвореною шкалою. Це не те саме, що обчислювати ці межі за початковою шкалою, а потім перетворювати.
Натомість я б підтримав те, що, як видається, залишається умовою меншості щодо вибору квантилів для кінців вусів. Однією з декількох переваг цього є те, що перетворення квантиля = квантил перетворення, принаймні досить близько для графічних цілей у більшості випадків. (Дрібний шрифт - це кожен раз, коли квантили обчислюються лінійною інтерполяцією між суміжними статистичними даними.)
Цей кількісний конвент був досить чітко запропонований Клівлендом (1985). Для запису, в географії та кліматології використовувались (наприклад) Меттьюс (1936) та Гроув (1956), в розділі "напівзруйновані" Меттьюс (1936) та Гроув (1956). назва "дисперсійні діаграми".
Більше, ніж коробкові сюжети
Сюжети коробки були винайдені Тукі близько 1970 року і найбільш помітно пропагувалися в його книзі 1977 року. Значна його мета полягала у просуванні графіків, які можна було швидко намалювати за допомогою ручки (циліндра) та паперу для неформальної розвідки. Він також пропонував способи ідентифікації можливих людей, що пережили люди. Це було чудово, але зараз у нас є доступ до комп'ютерів, не боляче малювати графіки, що показують, якщо не всі дані, то принаймні набагато детальніше. Підсумкова роль сюжетних графіків є цінною, але графік може відображати і тонку структуру, лише на випадок, якщо це цікаво чи важливо. (А те, що вважають дослідники нецікавим чи неважливим, може бути більш вражаючим для їхніх читачів.)
Є багато місця для ввічливої незгоди щодо того, що саме працює найкраще, але, на мій погляд, голі сюжети були досить перепроданими.
Користувачі статистики можуть дізнатися більше про програму, яка намалювала фігуру в цій публікації Statalist . Користувачі іншого програмного забезпечення не повинні мати труднощів зробити щось гарне чи краще (інакше навіщо використовувати це програмне забезпечення?).
Клівленд, WS 1985. Елементи графічних даних. Монтерей, Каліфорнія: Уедсворт.
Grove, AT 1956. Ерозія ґрунту в Нігерії. Географічні нариси британських тропічних земель у справі Steel, RW and Fisher, CA (Eds)
. Лондон: Джордж Філіп, 79-111.
Matthews, HA 1936. Новий погляд на деякі знайомі індійські опади. Шотландський географічний журнал 52: 84-97.
Tukey, JW 1977. Дослідницький аналіз даних. Редінг, MA: Аддісон-Веслі.