Книги про «Наука» в науці даних? [зачинено]


26

Які книги про науку та математику стоять за наукою даних? Складається враження, що так багато книг з наукових даних програмують навчальні посібники і не торкаються таких речей, як процеси генерування даних та статистичні умовиводи. Я вже можу кодувати, що я слабкий - це математика / статистика / теорія, що лежить в основі того, що я роблю.

Якщо я готовий записати 1000 доларів на книги (тобто близько 10 книг ... зітхну), що я можу придбати?

Приклади: категоричний аналіз даних Agresti , лінійні змішані моделі для поздовжніх даних тощо, тощо ... тощо.


Запитання про "хороші" книги приверне відповіді, засновані на думці, і це не є темою. Позначено прапором.
Спайдермен

3
Я це змінив, тому просто шукаю книги. Нічого не ґрунтується на думці.
Антон

Це написана статистика :) Дотримуйтесь чогось прагматичного, що орієнтується на передбачення, а не на умовиводи. Обидва елементи статистичного навчання та вступ до статистичного навчання є у списках більшості людей.
Дірк Еддельбюттель

Я поки не можу додати коментар, але просто FYI ESL доступний безкоштовно в Інтернеті як pdf
idclark

1
Я думаю, що це питання слід позначити як вікі спільноти.
Шагун Содхані

Відповіді:


21

2
+1 для бонусного паперу. Прекрасне читання
Сантьяго Кепас

13

Якби я міг вам запропонувати лише одну, це були б: Елементи статистичного навчання та прогнозування Хасті, Тібширані та Фрідмана. Він надає математику / статистику, що стоїть за багатьма часто використовуваними методами в науці даних.

Для Bayesian Techniques відмінно підходить Bayesian аналіз даних Гельмана, Карліна, Стерна, Дансона, Трансарі та Рубіна.

Статистичні висновки Казелла та Бергера - це хороший підручник на рівні випускників про теоретичну основу статистики. Ця книга вимагає досить високого рівня комфорту з математикою (теорія ймовірностей базується на теорії мір, що не тривіально для розуміння).

Щодо процесів генерування даних, я не маю рекомендацій щодо книги. Що я можу сказати, це те, що добре розуміння припущень використовуваних методів та забезпечення того, що дані були зібрані чи створені таким чином, що не порушує цих припущень, проходить довгий шлях до хорошого аналізу.


7

Інші відповіді рекомендували гарний набір книг про математику, що стоїть за наукою даних. Але, як ви вже згадували, у його математиці та таких діях, як збір даних і висновок з даних, є свої правила і теорії, навіть якщо вони не такі суворі, як математичний фон (поки що).

Для частин тез я пропоную книгу « Прекрасні дані: історії за елегантними рішеннями даних», яка містить двадцять випадків на зразок розділів, написаних людьми, які справді займаються проблемами аналізу даних у реальному світі. Він не містить жодної математики, але досліджує такі сфери, як збір даних, знаходить практичні способи використання даних для аналізу, масштабування та вибору найкращих рішень.

Ще одна справді цікава книга - Думка з даними: Як перетворити інформацію в статистику , яка також не є технічною (= навчальний посібник з програмування), але охоплює важливі теми щодо того, як реально використовувати силу науки в галузі прийняття рішень та проблеми реального світу.


7

Мені подобаються пропозиції Аміра Акбарі, і я додам кілька своїх власних, зосередившись на темах та навичках, які недостатньо висвітлені у більшості книг машинного навчання та аналізу даних, орієнтованих на математику та / або програмування.

Очищення даних:

Байєсівський аналіз даних (альтернатива тестуванню значущості гіпотези в стилі Фішера):

Висновок перед невизначеністю, незавершеністю, суперечливістю, неоднозначністю, неточністю, незнанням тощо:

Експерименти:

Моделювання:

Експертиза, імовірнісна оцінка:

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.