Перехід від використання статистичного програмного забезпечення до розуміння математичних рівнянь?


12

Контекст:

Я докторант психології. Як і у багатьох аспірантів з психології, я знаю, як проводити різні статистичні аналізи за допомогою статистичного програмного забезпечення, аж до таких методів, як PCA, класифікаційні дерева та кластерний аналіз. Але це насправді не задовольняє, оскільки, хоча я можу пояснити, чому я робив аналіз та що означають показники, я не можу пояснити, як працює методика.

Справжня проблема полягає в тому, що оволодіти статистичним програмним забезпеченням легко, але це обмежено. Для вивчення нових прийомів у статтях потрібно, щоб я розумів, як читати математичні рівняння. В даний час я не міг обчислити власні значення або K-засоби. Рівняння для мене як іноземна мова.

Питання:

  • Чи є вичерпний посібник, який допомагає зрозуміти рівняння в статтях журналу?

Редагувати:

Я думав, що питання буде більш зрозумілим: вище певної складності статистичне позначення стає для мене химерним; скажімо, я хотів би кодувати власні функції в R або C ++, щоб зрозуміти техніку, але є бар'єр. Я не можу перетворити рівняння в програму. І справді: я не знаю ситуації в докторських школах США, але в моїй (Франція) єдиний курс, який я можу пройти, - це якийсь рух літератури 16 століття ...


@Coronier Вибачте, я сумніваюся, є вичерпний посібник для розуміння статей психології, які використовують статистичне моделювання. Але необхідний досвід повинен бути на рівні ступеня магістра статистики. Якщо ваша програма заплатить за це, подумайте про отримання магістра в статистиці. Наступним найкращим варіантом для ваших цілей може стати повторне прийняття версії багатоваріантної статистики відділу статистики - зазвичай вони надають примітки з математичним фоном для PCA, кластеризації, дерев тощо. Вам знадобиться фон у лінійній алгебрі та базовій математичній статистика незалежно.
заблоковано

Будь ласка, задайте більш конкретні запитання.

4
Я також докторант психології, і я вирішив взяти значну кількість математики в мої студентські роки, оскільки було так багато докторів психології, які не мають уявлення про те, як розраховувались PCA (наприклад). Перше, що вам потрібно зробити, - це пройти свій шлях через будь-який пристойний підручник з лінійної алгебри. Що таке гідний підручник з лінійної алгебри? Гілберт Странг - це бомба, і він має відео лекції з курсу лінійної алгебри на веб-сайті MIT для завантаження. Ви навіть можете отримати їх на iTunes.
Філліп Хмара

1
Питання настільки широке, що в декількох абзацах він не отримає задоволеної відповіді. Статистика нагадує питання: це стає простіше, якщо розбити його на кілька керованих компонентів.
о.

Я можу погодитися лише з вищезазначеними коментарями. Або вам доведеться зосередитись на певній проблемі, або вам потрібно просто спочатку опрацювати деякі підручники чи онлайн-роздатковий матеріал. Гідним підручником, який охоплює основні поняття багатоваріантної статистики з ілюстраціями, є Математичні засоби для прикладного багатофакторного аналізу , від Керролла та Гріна (AP, 1997, Rev. Ed.). Інший - " Прикладна багатоваріантна статистика та математичне моделювання " Тінслі та Брауна (AP, 2000).
chl

Відповіді:


9

Огляд:

  • Моє враження, що ваш досвід спільний з багатьма студентами соціальних наук.
  • Вихідним моментом є мотивація до навчання.
  • Ви можете спуститися або на самонавчанні, або на формальні маршрути навчання .

Офіційна інструкція:

Є багато варіантів у цьому плані. Ви можете розглянути магістрів зі статистики або просто взяти кілька предметів у відділі статистики. Однак, напевно, ви хочете перевірити, чи є у вас необхідний математичний досвід. Залежно від курсу, ви можете виявити, що вам потрібно переглянути математику до обчислення і, можливо, деякі матеріали, такі як обчислення та лінійна алгебра, перш ніж вирішувати університетський рівень математично суворих предметів статистики.

Самоучка

Як варіант, ви можете піти маршрутом самоучки. В Інтернеті є купа хороших ресурсів. Зокрема, читання та виконання вправ з підручників з математики є важливим, але, ймовірно, недостатнім. Важливо слухати інструкторів, які говорять про математику, і спостерігати, як вони вирішують проблеми.

Також важливо подумати про свої математичні цілі та математичні передумови, необхідні для досягнення цих цілей. Якщо рівняння вам подібні до іноземної мови, то, можливо, ви виявите, що вам потрібно спочатку вивчити елементарну математику.

Я підготував кілька ресурсів, спрямованих на допомогу людям, які здійснюють перехід від використання статистичного програмного забезпечення до розуміння основної математики.


Спасибі, надані вами ресурси є чудовими. До речі, ваш блог повністю поглинає (я студент I / OP та useR, для мене це як одкровення).
Короньє

@Coronier Чудово познайомитися з іншою людиною, яка поєднує R із P / I Psych.
Джеромі Англім

3

У мене складається враження, що ви думаєте, що ви можете отримати уявлення про статистичне рівняння, запрограмувавши його або на R, або на C ++; ти не можеш. Щоб зрозуміти статистичне рівняння, знайдіть підручник з "студентами" з великою кількістю домашніх завдань в кінці кожної глави, що містить рівняння, а потім виконайте домашнє завдання в кінці глави, що містить рівняння.

Наприклад, для розуміння PCA вам потрібно добре розуміти лінійну алгебру і, зокрема, розклад сингулярного значення. Під час вивчення квантових обчислень за книгою Майкла Нільсена мені стало очевидно, що мені потрібно переглянути лінійну алгебру. Я натрапив на відео Гілберта Странга, вони були надзвичайно корисними для встановлення фундаментального розуміння понять. Однак нюанс матеріалу не вдався, поки я не знайшов книгу лінійної алгебри, що містить багато домашніх завдань, і тоді мені потрібно було їх виконувати.


4
@ schenectady, хоча я співчуваю вашій точці зору, для мене, принаймні, код R забезпечує міст, який я можу використати для більшого розуміння відповідних рівнянь та математики. Попри це, я від усієї думки погоджуюся з необхідністю проблем, статистики та математики взагалі - це те, чого можна дізнатися лише завдяки цьому.
richiemorrisroe

2

Я розумію ваші труднощі, оскільки у мене є аналогічна проблема, коли я намагаюся зробити щось нове у статистиці (я також студент випускника, але в іншій галузі). Я вважаю, що вивчення коду R є досить корисним, щоб зрозуміти, як щось обчислюється. Наприклад, я нещодавно вчився користуватися kmeansкластеризацією і маю багато основних питань, як концептуальних, так і як це реалізується. Використовуючи Rустановку (рекомендую R Studio, http://www.rstudio.org/ , але будь-яка установка працює), просто введіть kmeansу командний рядок. Ось приклад частини результату:

x <- as.matrix(x)
    m <- nrow(x)
    if (missing(centers)) 
        stop("'centers' must be a number or a matrix")
    nmeth <- switch(match.arg(algorithm), `Hartigan-Wong` = 1, 
        Lloyd = 2, Forgy = 2, MacQueen = 3)
    if (length(centers) == 1L) {
        if (centers == 1) 
            nmeth <- 3
        k <- centers
        if (nstart == 1) 
            centers <- x[sample.int(m, k), , drop = FALSE]
        if (nstart >= 2 || any(duplicated(centers))) {
            cn <- unique(x)
            mm <- nrow(cn)
            if (mm < k) 
                stop("more cluster centers than distinct data points.")
            centers <- cn[sample.int(mm, k), , drop = FALSE]
        }
    } 

Я не впевнений, наскільки практичним є щоразу вивчати джерело, але це дійсно допомагає мені зрозуміти, що відбувається, якщо припустити, що ти знайомий із синтаксисом.

Попереднє запитання, яке я задав на stackoverflow, вказувало мені в цьому напрямку, але також корисно сказало мені, що коментарі щодо коду іноді сюди включаються .


Більш загально, Журнал статистичного програмного забезпечення ілюструє цей зв’язок між теорією та впровадженням, але часто йдеться про актуальні теми (що в мене особисто важко зрозуміти), але корисний як приклад.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.