Wilk, MB та Gnanadesikan, R. 1968. Методи побудови графіку ймовірностей для аналізу даних.
Біометріка 55: 1-17. Jstor посилання, якщо у вас є доступ
Цей документ на момент мого написання майже 50 років, але все ще відчуває себе свіжим та новаторським. Використовуючи багату різноманітність цікавих та змістовних прикладів, автори уніфікують та розширюють різноманітні ідеї для побудови та порівняння розподілів, використовуючи рамки QQ (quantile-quantile) та PP (ймовірність-ймовірність). Поширення тут означають загалом будь-які набори даних або чисел (залишки, контрасти тощо), що виникають при їх аналізі.
Конкретні версії цих сюжетів налічують кілька десятиліть, найбільш очевидно нормальна ймовірність або нормальна кількість сюжетів. які є в цих термінах квантильно-квантовими сюжетами, а саме ділянками спостережуваних квантів проти очікуваних або теоретичних квантилів з вибірки однакового розміру від нормального (гауссового) розподілу. Але автори демонструють, скромно, але впевнено, що одні й ті самі ідеї можна легко поширити - і практично за допомогою сучасних обчислень - для вивчення інших видів квантилів та складання результатів автоматично.
Автори, тоді обидва в лабораторії Bell Telephone Laboratories, користувалися сучасними обчислювальними технологіями, і навіть багатьом університетам та науково-дослідним установам знадобилося десятиліття або близько того, щоб наздогнати. Навіть зараз ідеї в цьому документі заслуговують більш широкого застосування, ніж вони отримують. Це рідкісний вступний текст або курс, що включає будь-яку з цих ідей, крім звичайного сюжету QQ. Гістограми та графіки коробки (кожен часто дуже корисний, але, тим не менш, кожен незручний і обмежений декількома способами) продовжують залишатися основними скобами при введенні сюжетів розподілу.
На особистому рівні, хоча основні ідеї цього документу були знайомі більшу частину моєї кар’єри, мені подобається перечитувати його кожні пару років. Однією з вагомих причин є задоволення від того, як автори втілюють прості, але потужні ідеї для успішного використання серйозних прикладів. Ще однією вагомою причиною є те, що папір, написаний лаконічно, без найменшого сліду, натякає на розширення основних ідей. Не раз я переосмислював повороти основних ідей, які явно висвітлювались у бічних підказках та подальших коментарях.
Це не просто документ для тих, хто особливо цікавиться статистичною графікою, хоча, на мій погляд, він повинен включати всіх, хто цікавиться статистикою будь-якого типу. Він просуває способи роздумів про розподіли, які практично допомагають розвивати чиїсь статистичні навички та уявлення.