Я читав книгу Тукі «Дослідницький аналіз даних». Написана в 1977 році, книга наголошує на методах паперу / олівця. Чи є більш «сучасний» наступник, який враховує, що ми можемо миттєво побудувати великі набори даних?
Я читав книгу Тукі «Дослідницький аналіз даних». Написана в 1977 році, книга наголошує на методах паперу / олівця. Чи є більш «сучасний» наступник, який враховує, що ми можемо миттєво побудувати великі набори даних?
Відповіді:
Найближче - Візуалізація даних Клівленда . Йдеться про дослідницький аналіз даних, це про комп'ютерні візуалізації, це глибоко, це класика.
Ну, це не точна репліка, але я знайшов багато корисних порад щодо побудови графіків (і коду R) в аналізі даних Гельмана і Хілла за допомогою регресії та багаторівневої / ієрархічної моделі
Крім того, його блог часто сповнений корисних графічних порад.
Інтерактивна графіка для аналізу даних: принципи та приклади - це одне мені подобається; В описі книги сказано, що в ньому "обговорюється дослідницький аналіз даних (EDA) та як інтерактивні графічні методи можуть допомогти отримати уявлення, а також генерувати нові запитання та гіпотези з наборів даних".
Книга ggplot2 Хедлі Вікхема цікава тим, що вона вчить як Граматику графіки, так і як використовувати програмне забезпечення ggplot2.
Тут варто згадати дані про дослідження Рональда Пірсона в галузі техніки, наук та медицини . Основна цільова читацька аудиторія, схоже, вчені, які не бояться трохи математики, бажаючи, щоб вони знали більше статистики. Це досить велика група, і одна добре представлена тут. Це трохи химерно і неперевершено, але воно охоплює багато ґрунту, і воно включає в себе багато розумних порад. Це не переглянуто Тукі в тому сенсі, що він пропонує багато нових ідей, але це може бути корисним для вивчення, навіть якщо ти думаєш, що це трохи неправильно.
Ця книга, схоже, привернула дуже мало уваги, цілком можливо, тому що вона дуже дорога, очевидно не підходить як текст курсу, а поки доступна лише у твердій обкладинці. Але це розумно, читабельно і без сміття сучасних вступних підручників (сторінки та сторінки елементарних вправ, нерозумні іконки, безкоштовні фотографії щасливих молодих людей, метушливе планування з ящиками, що завгодно тощо).
Це два розділи, доступні в Інтернеті, які описують процес аналізу даних та обробку відсутніх значень. Скоро вийде нова книга Ентоні Унвіна.
Ще одна пара хороших книг для читання - Красива візуалізація та Прекрасні дані. Це відредаговані книги, є напрочуд гарні приклади вивчення даних за допомогою сюжетів та деякі абсолютно жахливі глави.
Ще одна книга, в якій є кілька хороших прикладів використання ggplot2 - нова книга Вінстона Чанга
Я думаю, що Розуміння надійного та дослідницького аналізу Хоагліна, Мостеллера і Тукі є супутником обсягу в Дослідженні таблиць даних та форм як технічне продовження ЗНО. Я також бачу аналіз даних і регрес, другий курс статистики Mosteller та Tukey як подальший результат до EDA. Різні книги Клівленда, згадані вище, - скарби.