Запитання з тегом «count-data»

Дані підрахунку - це негативні цілі числа, що представляють цілі суми.

1
Чому для підрахунку даних рекомендується перетворення квадратного кореня?
Часто рекомендується взяти квадратний корінь, коли у вас є дані про підрахунок. (Для деяких прикладів з резюме див. Відповідь @ HarveyMotulsky тут або відповідь @ wuber тут .) З іншого боку, при встановленні узагальненої лінійної моделі зі змінною відповіді, розподіленою як Пуассон, журнал є канонічним посиланням . Це щось на …

5
Чому регресія Пуассона використовується для обліку даних?
Я розумію, що для певних наборів даних, таких як голосування, вона працює краще. Чому регресія Пуассона застосовується над звичайною лінійною регресією чи логістичною регресією? Яка математична мотивація для цього?

1
Показники помилок для перехресних перевірок моделей Пуассона
Я схрещую валідацію моделі, яка намагається передбачити кількість. Якби це була проблема бінарної класифікації, я б обчислював AUC, що перевершується, і якщо це проблема з регресією, я б обчислював RMSE або MAE, що не перевищується. Для моделі Пуассона, які показники помилок можна використовувати для оцінки "точності" позапробних прогнозів? Чи є …

3
Чи є "модель перешкод" справді однією моделлю? Або просто дві окремі послідовні моделі?
Розглянемо модель перешкод, яка передбачає підрахунок даних yвід звичайного прогноктора x: set.seed(1839) # simulate poisson with many zeros x <- rnorm(100) e <- rnorm(100) y <- rpois(100, exp(-1.5 + x + e)) # how many zeroes? table(y == 0) FALSE TRUE 31 69 У цьому випадку я маю дані підрахунку …

2
Діагностика для узагальнених лінійних (змішаних) моделей (конкретно залишків)
В даний час я борюся з пошуком правильної моделі для складних підрахунків даних (залежна змінна). Я спробував різні моделі (для моїх даних потрібні моделі змішаних ефектів), таких як lmerі lme4(з перетворенням журналу), а також узагальнені лінійні змішані ефекти з різними сімействами, такими як гауссова або негативна двочлен. Однак я зовсім …

2
Безперервне узагальнення негативного біноміального розподілу
Негативний двочленний (NB) розподіл визначається на невід'ємні цілі числа і має функцію масової ймовірностіЧи має сенс розглянути безперервний розподіл на негативних реалах, визначених тією ж формулою (замінивши на x \ in \ mathbb R _ {\ ge 0} )? Біноміальний коефіцієнт можна переписати як добуток (k + 1) \ cdot …

4
Це відповідний метод для перевірки сезонних наслідків даних про кількість самогубств?
У мене 17 років (з 1995 по 2011 рік) даних свідоцтва про смерть, пов’язаних із смертю від самогубства для штату в США. Існує багато міфологій про самогубства та місяці / пори року, багато чого суперечливе, а також про літературу, яку я ' Подивившись, я не розумію використаних методів або впевненості …

9
Часовий ряд для даних лічильників, підрахунок <20
Нещодавно я почав працювати в клініці з туберкульозу. Періодично ми зустрічаємось, щоб обговорити кількість випадків захворювання на туберкульоз, які ми зараз лікуємо, кількість проведених тестів тощо. Я хотів би почати моделювати ці показники, щоб ми не просто здогадувались, чи є щось незвичне чи ні. На жаль, я мало навчався у …

1
Коли використовувати дані Пуассона проти геометричних та негативних біноміальних GLM для даних підрахунку?
Я намагаюся розмістити для себе, коли доречно використовувати тип регресії (геометричний, пуассонський, негативний двочлен) з даними підрахунку, в рамках GLM (лише 3 з 8 розподілів GLM використовуються для підрахунку даних, хоча більшість з них Я читав центри навколо негативних біноміальних та пуассонових розподілів). Коли використовувати дані Пуассона проти геометричних та …

1
Виявлення залишків у даних підрахунку
У мене є те, що я наївно вважав проблемою досить прямої, яка передбачає виявлення зовнішньої кількості для багатьох різних наборів даних про підрахунок. Зокрема, я хочу визначити, чи одне або більше значень у ряді даних підрахунку є вищими чи нижчими, ніж очікувалося, щодо решти підрахунків у розподілі. Помилковий фактор полягає …

3
Нульово-завищена модель негативних біноміальних змішаних ефектів в R
Чи існує такий пакет, який передбачає оцінку моделі нульових надутих негативних біноміальних змішаних ефектів у R? Під цим я маю на увазі: Нульова інфляція, де можна вказати біноміальну модель нульової інфляції, як у функції zeroinfl в пакеті pscl: zeroinfl (y ~ X | Z, dist = "негбін") де Z - …

2
Пуассон або квазі-пуассон в регресії з даними підрахунку і перевищенням?
У мене є дані про підрахунок (аналіз попиту / пропозиції з підрахунком кількості клієнтів, залежно від - можливо - багатьох факторів). Я спробував лінійну регресію з нормальними помилками, але мій QQ-графік не дуже хороший. Я спробував перетворення журналу відповіді: ще раз, поганий QQ-графік. Тому зараз я намагаюся регресувати з помилками …

1
значення різниці між двома підрахунками
Чи є спосіб визначити, чи різниця між кількістю дорожньо-транспортних пригод за часом 1 значно відрізняється від підрахунку часу 2? Я знайшов різні методи визначення різниці між групами спостережень у різний час (наприклад, порівняння засобів Пуассона), але не для порівняння лише двох показників. Або невірно навіть намагатися? Будь-яка порада чи вказівка …

2
Чи використання даних підрахунку як незалежної змінної порушує будь-які припущення GLM?
Я хотів би використовувати дані підрахунку як коваріати під час встановлення логістичної регресійної моделі. Моє запитання: Чи я порушую будь-яке припущення про логістичні (і, загалом, загальні, лінійні) моделі, використовуючи підрахунок невід'ємних цілих змінних як незалежних змінних? Я знайшов у літературі багато посилань на гарячі для використання дані підрахунку як результати, …

2
Стандартна помилка підрахунку
У мене є набір даних про випадки випадків за сезоном рідкісної хвороби. Наприклад, скажімо, було 180 випадків навесні, 90 влітку, 45 восени і 210 взимку. Я борюся з тим, чи доречно приєднувати до цих цифр стандартні помилки. Цілі дослідження є інфекційними в тому сенсі, що ми шукаємо сезонну картину захворюваності, …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.