Я одного разу наткнувся на тип сюжету щодо категоричних даних (тобто таблиць на випадок надзвичайних ситуацій) в Інтернеті, який мені дуже сподобався, але я його ніколи не знайшов, і навіть не знаю, як це називається. Це було по суті як ситовий сюжет, в тому, що висота рядків і ширина стовпців масштабувались відносно граничних ймовірностей. Таким чином, кожний ящик масштабувався до відносної частоти, очікуваної при незалежності. Однак вона відрізнялася від ситової ділянки тим, що замість того, щоб будувати перехресні штрихування всередині кожної коробки, вона накреслювала крапку (як у розкиданому майданчику) у місці, випадково вибраному з двовимірної форми для кожного спостереження. Таким чином, щільність точок відображає, наскільки добре спостережувані підрахунки відповідають очікуваним підрахункам. Тобто, якщо щільність була однаковою в кожному ящику, нульова модель розумна, ) може бути не дуже ймовірним за нульовою моделлю. Оскільки точки побудовані замість перехресного штрихування, між графічним елементом та спостережуваним підрахунком існує проста та інтуїтивна відповідність, що не обов'язково стосується ситових сюжетів (див. Нижче). Більше того, випадкове розміщення точок дає сюжету «органічне» відчуття. Крім того, колір може бути використаний для виділення коробок / комірок, які сильно розходяться з нульовою моделлю, а матриця сюжету може бути використана для вивчення парних зв’язків між багатьма різними змінними, тому вона може включати переваги подібних графіків.
- Хтось знає, як називається цей сюжет?
- Чи є пакет / функція, яка легко зробить це в R або іншому програмному забезпеченні (скажімо, Mondrian)? Я не можу знайти щось подібне у vcd . Звичайно, це може бути важко закодовано з нуля, але це буде біль.
Ось простий приклад ситового сюжету, зауважте, що легко зрозуміти, як очікувані підрахунки для різних категорій повинні грати за нульовою моделлю, але важко узгодити перехресне штрихування з фактичними числами, одержавши сюжет, який не є настільки ж просто читається та естетично прикро:
B ~B
A 38 4
~A 3 19
Для того, що варто, мозаїчний сюжет має щось протилежне: хоча легше зрозуміти, які клітини мають "занадто багато" чи "занадто мало" (відносно нульової моделі), важче розпізнати, які зв'язки між очікувані підрахунки були б. Зокрема, ширину стовпців масштабують відносно граничної ймовірності, але висоти рядків немає, що робить цю частину інформації майже неможливою.
а тепер для чогось зовсім іншого ...
- Хтось знає, звідки береться умова про використання синього для "занадто багато" та червоного для "занадто мало"? Це для мене завжди було протизаконним. Мені здається, що винятково висока щільність (або занадто багато спостережень) йде з гарячим , а низька щільність йде з холодом , і що (принаймні при сценічному освітленні) червоні гріють, а блюз - це охолодження .
Оновлення: Якщо я добре пам’ятаю, сюжет, який я бачив, містився у pdf главі (вступ чи ch1) із книги, яка була доступна у вільному доступі в Інтернеті як маркетинговий тизер. Ось приблизна версія ідеї, яку я кодував з нуля:
Навіть із цією сирою версією я вважаю, що її легше читати, ніж сюжет для сита, а в чомусь простіше, ніж мозаїчний сюжет (наприклад, легше розпізнати, які стосунки між частотами клітинок опинився б під незалежністю). Було б непогано мати функцію, яка: a. зробить це автоматично з будь-якою таблицею на випадок надзвичайних ситуацій, b. може використовуватися як будівельний блок матриці сюжету, c. матиме приємні риси, які поставляються з вищезазначеними сюжетами (як, наприклад, стандартизована легенда про залишки на мозаїчній ділянці).
shading.points()
робити те, що ви хочете, в рамках strucplot, який був цитований вище і доступний як віньєтка в vcd
упаковці.
R
функціяassocplot
до того, що ви маєте на увазі? Якщо ні, то я думаю, щоR
програміст може змінити це абоmosaicplot
зробити те, що ви хочете.