Книга для широкого та концептуального огляду статистичних методів


12

Мене дуже цікавить потенціал статистичного аналізу для моделювання / прогнозування / оцінки функцій тощо.

Однак я мало що про це знаю, і мої математичні знання все ще досить обмежені - я молодший студент з програмної інженерії.

Я шукаю книгу, яка б почала мене починати з певних речей, про які я постійно читаю: лінійна регресія та інші види регресії, байєсові методи, методи Монте-Карло, машинне навчання тощо. Я також хочу розпочати роботу з R, якщо, якщо була книга, яка поєднала обидві, що було б дивним.

Переважно, я хотів би, щоб книга пояснювала речі концептуально і не надто багато технічних деталей - я хотів би, щоб статистика була дуже інтуїтивно зрозумілою для мене, оскільки я розумію, що в статистиці дуже багато ризикованих підводних каменів.

Я поза курсом бажаю прочитати більше книг, щоб поліпшити своє розуміння тем, які я вважаю цінними.

Відповіді:


11
  • Можливо, вам сподобається щось на кшталт аналізу даних та графіки, використовуючи R: приклад, заснований на прикладі Джона Маіндональда та В. Джона Брауна

    • Веб-сайт для книги
    • Амазонка з різними відгуками
    • Я рекомендую це, оскільки книга тикує кілька ваших коробок; це вчить трохи R; він дає огляд цілого ряду різних методик моделювання (наприклад, множинна регресія, часовий ряд, графіка, узагальнена лінійна модель тощо), не заглиблюючись у занадто багато математичних деталей; це справедливо застосовується.
  • Я погоджуюся з @Greg Snow, що вам може бути краще думати з точки зору прочитання кількох різних книг. Для кожної згаданих вами тем (наприклад, байєсівська статистика, часовий ряд, моделювання, R, машинне навчання) є хороші книги, присвячені цій конкретній темі. Ви можете задати окремі запитання про те, що було б хорошою книгою, враховуючи ваші конкретні інтереси до цієї теми.

  • Хороші вільно доступні онлайн варіанти

    • Елементи статистичного навчання - відмінна книга і навіть доступна в Інтернеті безкоштовно. З вашого допису я розумію, що це може бути трохи більш технічно, ніж ви хочете спочатку, але перевірити це і побачити, що ви думаєте. Можливо, ви будете готові до цього зараз; можливо пізніше.
    • Екологічні моделі та дані Бенджаміна Болкера - ще одна хороша. Це з точки зору екології, але чітко пояснює моделювання та пристосування моделі з відносно нетехнічної точки зору; і все це реалізовано в Р. Ви можете побачити весь його код R на веб-сайті. Ви навіть можете побачити підмітати документи, які використовуються для створення книги!
    • Існує хороший список безкоштовної R документації на CRAN, а деякі документи також містять більш широкі вказівки щодо статистики.

5

Єдина книга, яка включала всі ці теми, була б дуже вражаючою і, ймовірно, важила б більше, ніж ви. Це як би просити одну книгу, яка навчає основного програмування, C, Java, Perl та вдосконаленого дизайну баз даних - все це в одній книзі (насправді, мабуть, більше, але я не знаю достатнього рівня програмного забезпечення, яке б додало деякі більш вдосконалені) .

Сама регресія - це, як мінімум, повний курс коледжу, для байесівської статистики потрібен курс або 2 теорії, перш ніж взяти курс байесів, щоб повністю зрозуміти і т.д.

Немає швидкої та легкої дороги до того, що ти намагаєшся зробити. Я б запропонував пройти кілька хороших курсів у вашому університеті та працювати там.

Були й інші обговорення хороших книг, які ви можете переглянути деякі ідеї.


Спасибі за вашу відповідь. Однак я не намагаюся зрозуміти все, що стосується однієї книги, але, читаючи, скажімо, 50 сторінок про регресію, безумовно, мені дуже допоможуть отримати хоч трохи розумне розуміння цього питання ...
Jérôme Le Chatelier

5

Для поєднання R з багатьма описаними вами методами, крім тексту Маіндональда та Брауна, згаданого @ Джером Енглімом, я б запропонував вам поглянути на ці дві книги Джуліана Фаравея:

Обидва мають досить прості ознайомлення з різними темами, остання охоплює широкий спектр більш сучасних підходів до регресії, включаючи багато методів машинного навчання, але це робить у більш швидкому темпі з меншим описом, і обидва приклади методики за допомогою R коду.

Ви можете отримати код із розділу " Книги" на веб-сайті R, щоб отримати 20% знижки від RRP, якщо купувати безпосередньо у компанії Chapman & Hall / CRC Press, але перевіряйте ціну Amazon або подібну для вашого регіону, оскільки часто зниження на Amazon є конкурентоспроможним з ціною видавця після знижки.

Однією з хороших речей цієї пари книг є те, що вони надають вам гарний смак сучасних методів з достатньою деталізацією, щоб потім вивчити сфери, які ви хочете детальніше детальніше з більш спеціалізованими текстами.

Частина вмісту, що потрапила до цих книг, доступна в онлайн-документі Джуліана через розділ « Додані документи» на веб-сайті R. Я рекомендую переглядати цей розділ, щоб дізнатися, чи є інші документи, які можуть почати роботу, без того, щоб вам потрібно було викладати гроші. Ранній варіант тексту, який перетворився на перше видання тексту Мендональда та Брауна, також можна знайти в цьому розділі.


3

Ну, якщо ви хочете огляд більшості статистичних методів, і R для них код, ви можете не помилитеся з Вінейблесом і Ріплі сучасної прикладної статистики в S .

Її стислий, зрозумілий і достатньо R-коду, щоб ви почали працювати з будь-якої статистичної теми, яку ви хочете назвати.

Я купив цю книгу і з обережністю ставився до ціни в порівнянні з кількістю сторінок, але це варте інвестицій. Вони припускають обчислення та лінійну алгебру, але враховуючи, що ви інженер, це не повинно бути великою проблемою.

Їх програмування на S теж чудово, але, мабуть, не те, що ви шукаєте зараз.


2

Елементи статистичного навчання можуть бути мало страшними для початківців. Я рекомендую прочитати " Вступ до статистичного навчання з додатками на R ", який можна безкоштовно завантажити звідси -> http://www-bcf.usc.edu/~gareth/ISL/ Також він опрацював приклади в R в кінці кожного розділу.

" Машинне навчання: алгоритмічна перспектива " Стівена Марсленда також охоплює більш широкий спектр тем, не надто заглиблюючись у математику.


1

Попередні відповіді багато стосуються речей. Що стосується концептуального матеріалу та хорошого статистичного мислення, я рекомендував би Теорію ймовірностей: Логіка науки Едвіна Джейнеса. Перші три розділи доступні безкоштовно тут

Хоча це не так сильно впливає на комп'ютерні програми, тому прикладна частина речей стоїть на більш стилізованих проблемах. Має блискучу главу про парадокси теорії ймовірностей, з одним винятком, в «маргіналізація парадокс», який правильно вирішене тут (хоча Джейнс по суті «отримує урок» в тому , що неправильне до повинно бути межею послідовності власних апріорних) .


2
Я сама полюбила цю книгу, але не впевнена, що це місце, щоб почати намагатися створити інтуїцію для статистики. Це досить полемічний та ідіосинкратичний текст.
Бен Лодердейл

1

Наразі зроблені пропозиції є чудовими, але зосереджені на найсучасніших та найскладніших методах використання програмного забезпечення R. Для чудового та інтуїтивного огляду класичних багатоваріантних методів, основою для найсучасніших підходів, включаючи регресію, ANOVA, факторний аналіз, кластерний аналіз, дискримінаційний аналіз, аналіз таблиць на випадок та аналіз структурного рівняння, багатоваріантність Діллона та Гольдштейна Статистика, опублікована Вілі в 80-х роках, залишається класичною. Це чітко і застосовується у своїх прикладах, не надто теоретично чи вповноважене на програмне забезпечення.

Діллон і Гольдштейн - це книга, яку я рекомендував би всім, хто хоче зрозуміти, звідки походять сучасні методи машинного навчання.



0

Кулінарна книга R - це чудовий спосіб стрибнути в R та почати вчитися ним користуватися. Це дуже практично, тому він чудово підходить для вивчення мови, але ви також повинні шукати хорошу книгу з теорії.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.