Здійснення сенсу із теорії та застосувань статистики


13

Нещодавно я закінчила ступінь магістра з медичного та біологічного моделювання, супроводжуючи інженерну математику як основу. Навіть незважаючи на те, що моя навчальна програма включала значну кількість курсів з математичної статистики (див. Список нижче), які я вів із досить високими оцінками, я часто закінчуюсь повністю втраченою, дивлячись як на теорію, так і на застосування статистики. Маю сказати, порівняно з «чистою» математикою статистика дійсно мало сенсу для мене. Особливо нотації та мова, якими користуються більшість статистиків (включаючи моїх минулих викладачів), дратують звивистість, і майже в жодному з ресурсів, які я бачив до цього часу (включаючи вікіпедію), не було простих прикладів, до яких можна було б легко звернутися і пов'язати з даною теорією. ..

Це передумови; Я також усвідомлюю гірку реальність, що я не можу зробити кар’єру дослідника / інженера без чіткого зчеплення зі статистикою, особливо в галузі біоінформатики.

Я сподівався, що зможу отримати поради від більш досвідчених статистиків / математиків. Як я можу подолати цю проблему, про яку я згадав вище? Чи знаєте ви про якісь хороші ресурси; наприклад, книги, електронні книги, відкриті курси (через iTunes або OpenCourseware for ex) тощо.

EDIT: Як я вже згадував, я досить упереджено (негативно) ставляться до більшості літератури під загальним назвою статистики, і оскільки я не можу придбати ряд великих (і дорогих) навчальних посібників на галузь статистики, що мені знадобиться з точки зору книги - це щось подібне до того, що Tipler & Mosca є для фізики, але натомість для статистики.

Для тих, хто не знає про Тіплер; це великий підручник, який охоплює значну більшість предметів, з якими можна зіткнутися під час вищих навчальних занять, і подає їх кожен від основного вступу до трохи глибших деталей. По суті, досконалий довідник, куплений під час мого першого курсу в університеті, все одно користується ним раз у раз.


Курси, які я брав із статистики:

  • великий курс введення,
  • стаціонарні стохастичні процеси,
  • Марковські процеси,
  • Методи Монте-Карло
  • Аналіз виживання

Відповіді:


4

Я можу повністю зрозуміти вашу ситуацію. Незважаючи на те, що я аспірант, мені часом важко пов'язані з теорією та застосуванням. Якщо ви готові зануритися в розуміння теорії, це, безумовно, корисно, коли ви думаєте про проблеми реального світу. Але процес може бути неприємним.

Одне з багатьох посилань, які мені подобаються, - це аналіз даних Гельмана та Хілла за допомогою ієрархічних / багаторівневих моделей . Вони уникають теорії, де вони можуть висловити основну концепцію за допомогою симуляцій. Це, безумовно , на користь вам , як у вас є досвід в MCMC і т.д. Як ви говорите, ви працюєте в біоінформатики, ймовірно , Харрелл в регресійному моделюванні стратегія є хорошим довідником теж.

Я зроблю це вікі спільноти, і дозволити іншим додати його.


Дякую за увагу до цього питання. Приємно бачити, що я не єдиний, хто плутається через речі. Якщо говорити, я думаю, ви переоцінили мою ситуацію; поки я пройшов ряд курсів і знайомий з наявністю низки різних способів статистичного аналізу; вони ніколи не тримаються зі мною після курсів. Через пару місяців після іспитів я постійно замислююся; "Я десь бачив / чув це, але як це було насправді?" Це для мене говорить про те, що мені потрібно все це зруйнувати і почати будувати його з більш міцним фундаментом.
posdef

Я додав би звукозапису "погодитися" для тексту Гаррелла (відмітка правопису). Це чудово, як і поєднання двох пакетів коду R, який його супроводжує. Я також думаю, що "Сучасна прикладна статистика з S" від Venables та Ріплі була б хорошим придбанням. Перш ніж використовувати MASS, щоб вивчити Р., я мав рівень магістрів (маючи ступінь фізичного рівня). У цьому тексті є безліч мудрості застосування.
DWin

Регресна книга Гельмана чудова, він все це дуже добре пояснює і надає код R, який дуже корисний, щоб перевірити ваше розуміння матеріалу.
richiemorrisroe

2

Чи знайомі ви з Бейсіанським аналізом даних (Гельман, Карлін, Стерн та Рубін)? Можливо, для цього вам потрібна доза.


2

Усі проблеми зі статистикою істотно зводиться до наступних 4 кроків (які я запозичив у відповіді @whuber на інше питання ):

  1. Оцініть параметр.

  2. Оцініть якість цієї оцінки.

  3. Вивчіть дані.

  4. Оцініть придатність.

Ви можете обміняти параметр слова на модель слова .

У статистичних книгах зазвичай представлені перші два моменти для різних ситуацій. Проблема в тому, що кожне реальне застосування вимагає різного підходу, а отже, і іншої моделі, тому значна частина книг закінчується каталогізацією цих різних моделей. Це надає небажаний ефект, що легко втратити себе в деталях і пропустити велику картину.

Велика книжка з малюнками, яку я щиро рекомендую, - це асимптотична статистика . Це дає сувору обробку теми і є математично "чистою". Хоча його назва згадує асимптотичну статистику, великим непереказаним секретом є те, що більшість методів класичної статистики по суті засновані на асимптотичних результатах.


2

Я думаю, що найважливіше тут - розвинути інтуїцію щодо статистики та деяких загальних статистичних концепцій. Мабуть, найкращий спосіб зробити це - мати якийсь домен, яким ви можете "володіти". Це може забезпечити позитивний цикл зворотного зв’язку, коли розуміння домену допомагає зрозуміти детальніше про основні статистичні дані, що допоможе вам зрозуміти більше про домен тощо.

Для мене цей домен був статистикою бейсболу. Я зрозумів, що тісто, яке в грі йде 3 на 4, не є "справжнім" .750 нападником. Це допомагає зрозуміти більш загальний момент, що вибіркові дані не збігаються з базовим розподілом. Я також знаю, що він, ймовірно, ближче до середнього гравця, ніж до 0,750 нападника, тому це допомагає зрозуміти такі поняття, як регресія в середньому. Звідти я можу дістатись до повномасштабного байєсівського висновку, коли мій попередній розподіл ймовірностей мав середнє значення середнього рівня бейсболіста, і тепер у мене є 4 нові зразки, з якими можна оновити мій задній розподіл.

Я не знаю, що для вас цей домен, але я б припустив, що це буде корисніше, ніж просто підручник. Приклади допомагають зрозуміти теорію, яка допомагає зрозуміти приклади. Підручник із прикладами є приємним, але якщо ви не зможете зробити ці приклади "своїми", то мені цікаво, чи отримаєте ви достатньо від них.



1

Усі вчаться по-різному, але я думаю, що сміливо можна сказати, що приклади, приклади, приклади дуже допомагають у статистиці. Моя пропозиція полягала б у тому, щоб вивчити R (достатньо лише основ, щоб допомогти багато), а потім ви можете спробувати будь-який приклад, поки очі не кровоточать. Ви можете його сортувати, підходити, накреслювати, називати. І оскільки R орієнтований на статистику, як ви вивчаєте R, ви будете вивчати статистику. На ті книги, які ви перераховували, потім можна напасти з точки зору "покажіть мені".

Оскільки R безкоштовна, а багато вихідного матеріалу безкоштовно, все, що вам потрібно вкласти, - це ваш час.

http://www.mayin.org/ajayshah/KB/R/index.html

http://math.illinoisstate.edu/dhkim/rstuff/rtutor.html

http://www.cyclismo.org/tutorial/R/

http://www.stat.pitt.edu/stoffer/tsa2/R_time_series_quick_fix.htm

http://www.statmethods.net/about/books.html

Є багато хороших книг про R, які ви можете придбати, ось яку я використав:

http://www.amazon.com/Introductory-Statistics-R-Peter-Dalgaard/dp/0387954759

Редагувати =============

Я забув додати пару посилань. Якщо ви використовуєте Windows, гарним редактором для подачі R є Tinn-R (хтось інший може додавати посилання для редакторів на Mac або Linux).

http://www.sciviews.org/Tinn-R/

http://cran.r-project.org/web/packages/TinnR/


дякую за посилання, я спробую пройти через них якомога більше протягом найближчих тижнів ... Мені вже одного разу піддавались дії R, в курсі аналізу виживання, в якому ми зробили багато багатоваріантної регресії (Кокс та Елен моделей) та купу інших речей, яких я справді не можу пригадати. Моє враження про R, як людину, яка дуже звикла до MATLAB, було досить негативним, але я це зробив дуже багато, що стосується того, що нас більш-менш кинули до глибокого кінця басейну, а потім очікували навчитися плавати самостійно, що, звичайно, призвело до того, що я з цього часу
ненавиджу

1

Мені особисто подобалося це, що мав справді хороший поєднання теорії та застосування (з великою кількістю прикладів). Це було гарним поєднанням з казеллою та Бергером для більш теоретично орієнтованого підходу. І для широкого огляду пензля це .


Обидві книги, схоже, мають хороші відгуки про Amazon, чи може хто-небудь додати якісь думки (можливо, трохи детальніше) щодо них? btw; "casella & berger" Ви маєте на увазі "Статистичний висновок"?
posdef

Так «статистичний висновок». Для мене великим кроком стало розуміння імовірнісних моделей до розуміння того, як використовувати дані для тестування моделей та оцінювати параметри моделей. Тим більше, що книга Дейвісона дійсно зосереджена на цьому.
alwaysean
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.