Які книги надають огляд обчислювальної статистики, як це стосується інформатики?


15

Як інженер програмного забезпечення мене цікавлять такі теми, як статистичні алгоритми, обмін даними, машинне навчання, байєсівські мережі, алгоритми класифікації, нейронні мережі, ланцюги Маркова, методи Монте-Карло та генерація випадкових чисел.

Мені особисто не було приємно працювати з будь-якою з цих методик, але мені довелося працювати з програмним забезпеченням, яке під кришкою використовувало їх і хотіло б дізнатися про них на високому рівні. Я шукаю книги, які охоплюють велику широту - велика глибина в цьому моменті не потрібна. Я думаю, що я можу багато чого навчитися розробці програмного забезпечення, якщо зможу зрозуміти математичні основи алгоритмів та методик, які використовуються.

Чи може спільнота статистичного аналізу рекомендувати книги, які я можу використовувати, щоб дізнатися більше про впровадження різних статистичних елементів у програмне забезпечення?

Відповіді:



3

Можливо, ви хочете прочитати надзвичайно популярне запитання на темі Stack Overflow про те, яку статистику повинен знати програміст або комп'ютер .


Гарний дзвінок. Я використовую ТА, і я не знав, що питання навіть існувало. Добре мати зшивання, коли питання можуть з’являтися на кількох біржах.
Томас Оуенс

3

Ось дуже приємна книга Джеймса Е. Джентлі, обчислювальна статистика (Springer, 2009), яка охоплює як обчислювальні, так і статистичні аспекти аналізу даних. Ніжний також автор інших чудових книг, перевірити його публікації.

Ще одна чудова книга - « Довідник обчислювальної статистики» від Gentle et al. (Спрингер, 2004); він поширюється як PDF десь в Інтернеті, тому просто спробуйте подивитися його в Google.


2

Ви згадали про деякі методи ML, тому дві досить приємні книги (зовсім тому, що, на жаль, моя улюблена польською мовою):
http://www.amazon.com/Machine-Learning-Algorithmic-Perspective-Recognition/dp/1420067184
http: / /ai.stanford.edu/~nilsson/mlbook.html

Для таких чисельних речей, як генерація випадкових чисел:
http://www.nr.com/


+1 Книга Marsland є досить хорошою і заповнила велику прогалину в існуючому підборі книг ML.
АРС

1

Я взяв копію ймовірностей та статистики для вчених-комп’ютерів - Майкл Барон у продажу з іншою книжкою статистики (я чесно купив її через назву - мені хотілося книги, яка б поглянула на статистику з точки зору інформатики, навіть якщо це не було ідеально). У мене ще не було можливості прочитати його чи попрацювати в ньому будь-які проблеми, але це здається суцільною книгою.

У передмові книги сказано, що це стосується студентів вищої ланки та студентів, які починають аспірантуру, і я погодився б із цим. Для розуміння змісту цієї книги необхідно деяке розуміння ймовірності та статистики.

Теми включають ймовірність, дискретні випадкові величини, постійні розподіли, методи Монте-Карло, стохастичні процеси, системи черги, статистичні умовиводи та регресію.


1

Хоча це не спеціально обчислювальна статистика, Підручник зі статистичними аналізами з використанням R - Брайана С. Еверітта і Торстена Хотхорна охоплює багато тем, які я бачив, висвітлюваних у основних та проміжних статистичних книгах - умовивід, ANOVA, лінійна регресія, логістична регресія, оцінка щільності, рекурсивний розподіл, аналіз основних компонентів та кластерний аналіз - з використанням мови R. Це може зацікавити тих, хто зацікавлений у програмуванні.

Однак, на відміну від інших книг, акцент робиться на використанні мови R для виконання цих статистичних функцій. Інші книги, які я бачив, використовували комбінації алгебри та обчислення для демонстрації статистики. Ця книга фактично фокусується на тому, як аналізувати дані за допомогою мови R. А щоб зробити це ще корисніше, набори даних, які використовують автори, знаходяться в CRAN - сховищі R.


1

Статистичні обчислення з R - Марія Л. Ріццо охоплює багато тем з "Імовірності" та "Статистика для комп'ютерних вчених" - основна ймовірність та статистика, випадкові змінні, байєсська статистика, ланцюги Маркова, візуалізація багатофакторних даних, методи Монте-Карло, тести перестановки, ймовірність оцінка щільності та чисельні методи.

Використовувані рівняння та формули представлені як математичними формулами, так і в коді R. Я б сказав, що базове знання про ймовірність, статистику, обчислення та, можливо, дискретну математику було б доцільним для всіх, хто хоче прочитати цю книгу. Фон програмування також буде корисним, але є деякі посилання на мову R, оператори та синтаксис.


1

Як інженер-комп’ютер, який сам підходить до аналізу даних, справді читабельна книга, яка охоплює речі з досить непереборливої ​​та читабельної точки зору (ціною не охоплення стільки, скільки запропоновані тут інші книги), була програмуванням колективної розвідки Тобі Сегараном. Я вважав це набагато більш доступним, ніж, наприклад, книга Єпископа, яка є чудовим посиланням, але заглиблюється в більшу глибину, яку ви, мабуть, хочете з першого проходу. На Amazon: http://www.amazon.com/Programming-Collective-Intelligence-Building-Applications/dp/0596529325


1

CRAN має кілька хороших прикладів книг, що стосуються статистичного програмування. Деякі з них не стосуватимуться машинного навчання та MCMC, але кожен запис анотований, тому ви повинні мати приблизне уявлення про те, що містить кожна книга, щоб трохи пірнути далі. http://www.r-project.org/doc/bib/R-books.html

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.