Роблячи деякий EDA, я вирішив використати графік коробки, щоб проілюструвати різницю між двома рівнями фактора.
Те, як ggplot надав графік коробки, було задовільним, але трохи спрощеним (перший сюжет нижче). Під час дослідження особливостей коробкових сюжетів я почав експериментувати з виїмками.
Я розумію, що на виїмці відображається показник ІК навколо медіани, і якщо два виїмки на ящиках не перетинаються, є "вагомі докази" - на рівні 95% впевненості - що медіани відрізняються.
У моєму випадку (другий сюжет), виїмки значимо не перетинаються. Але чому дно коробки праворуч набуває такої дивної форми?
Нанесення одних і тих же даних на скрипковому сюжеті не вказувало нічого незвичного щодо щільності ймовірності відповідної скрипки.
ggplot2
. Мені подобається ідея побудувати окремі точки даних, але це засмутило те, що точки в темному полі робляться невидимими.