Сучасний наступник дослідницького аналізу даних Tukey?


52

Я читав книгу Тукі «Дослідницький аналіз даних». Написана в 1977 році, книга наголошує на методах паперу / олівця. Чи є більш «сучасний» наступник, який враховує, що ми можемо миттєво побудувати великі набори даних?


це має бути вікі спільноти?
richiemorrisroe

Мені незрозуміло, чи повинен це бути CW. Не може бути хороших відповідей; може бути одна чітка непересічна відповідь; ми можемо створити довгий список ефективних відповідей. Подивимося, що станеться.
whuber

4
Це гарне запитання, біофризер. Я просто хотів зауважити, що існують близькі аналогії з іншими методами роботи. Моя улюблена ручка та папір EDA - це сучасна статистика, як ручний інструмент для сучасної деревообробки. ("Сучасна" деревообробка використовує багато електроінструментів, таких як настільні пилки та маршрутизатори, які дозволяють навіть початківцям виявити прийнятні результати за набагато менший час. Однак, ці інструменти щорічно припадають на тисячі відсутніх цифр і кінцівок. Люди, які навчаються користуватися ручним інструментом як правило, вчаться працювати краще та ефективніше, навіть коли використовують електроінструменти.)
whuber

4
Так, деревообробка - це приємна аналогія (відсутні цифри, відсутні цифри). Дивіться також software-carpentry.org .
denis

Відповіді:


19

Найближче - Візуалізація даних Клівленда . Йдеться про дослідницький аналіз даних, це про комп'ютерні візуалізації, це глибоко, це класика.


2
Те саме стосується і книги Елементи графічних даних того ж автора. Купуйте їх обох; вони обоє відмінні.
Karl Ove Hufthammer


7

Інтерактивна графіка для аналізу даних: принципи та приклади - це одне мені подобається; В описі книги сказано, що в ньому "обговорюється дослідницький аналіз даних (EDA) та як інтерактивні графічні методи можуть допомогти отримати уявлення, а також генерувати нові запитання та гіпотези з наборів даних".



4

Тут варто згадати дані про дослідження Рональда Пірсона в галузі техніки, наук та медицини . Основна цільова читацька аудиторія, схоже, вчені, які не бояться трохи математики, бажаючи, щоб вони знали більше статистики. Це досить велика група, і одна добре представлена ​​тут. Це трохи химерно і неперевершено, але воно охоплює багато ґрунту, і воно включає в себе багато розумних порад. Це не переглянуто Тукі в тому сенсі, що він пропонує багато нових ідей, але це може бути корисним для вивчення, навіть якщо ти думаєш, що це трохи неправильно.

Ця книга, схоже, привернула дуже мало уваги, цілком можливо, тому що вона дуже дорога, очевидно не підходить як текст курсу, а поки доступна лише у твердій обкладинці. Але це розумно, читабельно і без сміття сучасних вступних підручників (сторінки та сторінки елементарних вправ, нерозумні іконки, безкоштовні фотографії щасливих молодих людей, метушливе планування з ящиками, що завгодно тощо).



0

Ще одна пара хороших книг для читання - Красива візуалізація та Прекрасні дані. Це відредаговані книги, є напрочуд гарні приклади вивчення даних за допомогою сюжетів та деякі абсолютно жахливі глави.

Ще одна книга, в якій є кілька хороших прикладів використання ggplot2 - нова книга Вінстона Чанга


1
Я просто хочу ще раз перевірити, Ді, на випадок витонченого друку: ти, можливо, мав на увазі написати "привабливий" замість "жахливий"? Хоча обидва мають сенс у цьому контексті, поява останнього - без жодних додаткових пояснень - це швидше сюрприз!
whuber

2
жахливий був правильним - це мішана сумка - часто редагуються томи
Діанна Кук

Я здивований цим рекомендаціям. Обидві книги я вважав здебільшого невтішними (довгі на гуффі, короткі на графіці). На жаль, O'Reilly, з яким я вперше зіткнувся як видавець надзвичайно хороших книг Unix, здається, має дуже нерівномірний контроль якості книг на чомусь навіть віддаленому статистичному рівні.
Нік Кокс

Мені подобаються обидві книги, і я справді відчуваю, що вони є вагомим внеском. У Вінстона Чанга є багато основних деталей щодо побудови графіку з ggplot2. Це хороша орієнтир для початківців. Це не дуже розказує вам про те, чому ви робили б ці сюжети, але більшість має сенс для цілей, із тих творів, які я прочитав. У прекрасній візуалізації є дуже вражаючі глави, вирішуючи складні проблеми, такі як візуалізація вікіпедії, масивні дані, багато складності, і вона проходить через процес мислення / рішення, прийняті для створення сюжетів.
Діанна Кук

На всякий випадок мій коментар неоднозначний: я мав на увазі книги "Красиві". Книга Вінстона Чанга є приємною і корисною.
Нік Кокс

0

Я думаю, що Розуміння надійного та дослідницького аналізу Хоагліна, Мостеллера і Тукі є супутником обсягу в Дослідженні таблиць даних та форм як технічне продовження ЗНО. Я також бачу аналіз даних і регрес, другий курс статистики Mosteller та Tukey як подальший результат до EDA. Різні книги Клівленда, згадані вище, - скарби.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.