Вибачте, будь ласка, мою розсилку статистичного лінгва :) Я знайшов тут декілька питань, які стосуються реклами та ціни на кліки. Але жодна з них мені не дуже допомогла в розумінні моєї ієрархічної ситуації.
Існує пов'язане питання Чи є ці еквівалентні уявлення тієї ж ієрархічної байєсівської моделі? , але я не впевнений, чи є у них насправді подібна проблема. Ще одне питання Пріори для ієрархіальної бієміальної моделі Баєса детально розглядає питання про гіперпріори, але я не в змозі відобразити їх рішення моєї проблеми
У мене є кілька оголошень в Інтернеті для нового продукту. Я пускав рекламу протягом кількох днів. У цей момент достатньо людей натискали на рекламу, щоб побачити, який із них отримує найбільше кліків. Після того, як я вигнав усіх, окрім тих, у яких найбільше кліків, я дав йому працювати ще пару днів, щоб побачити, скільки людей насправді купують після натискання на оголошення. У той момент я знаю, чи було б гарною ідеєю запускати рекламу в першу чергу.
Моя статистика дуже галаслива, тому що я не маю багато даних, оскільки щодня продаю лише пару предметів. Тому дійсно важко підрахувати, скільки людей купує щось після того, як побачили рекламу. Лише кожен кожні 150 кліків призводить до покупки.
Взагалі кажучи, я повинен знати, чи втрачаю гроші на кожне оголошення якомога швидше, якось згладжуючи статистику групи оголошень із глобальною статистикою для всіх оголошень.
- Якщо я зачекаю, поки кожна реклама не побачить достатню кількість покупок, я розберусь, бо це забирає занадто багато часу: на тестування 10 оголошень мені потрібно витратити в 10 разів більше грошей, щоб статистика для кожного оголошення була достатньо надійною. На той час я, можливо, втратив гроші.
- Якщо я середній рівень покупок за всі оголошення, я не зможу випустити рекламу, яка також не працює.
Чи можу я використовувати глобальний курс закупівлі ( N $ підрозподілів? Це означає, що чим більше я маю даних про кожне оголошення, тим більш незалежною є статистика цього оголошення. Якщо ще ніхто не натиснув оголошення, я вважаю, що середній показник у світі є відповідним.
Який розподіл я вибрав би для цього?
Якщо у мене було 20 клацань на A і 4 клацання на B, як я можу це моделювати? Поки я зрозумів, що розподіл бінома або Пуассона тут може мати сенс:
purchase_rate ~ poisson
(?)(purchase_rate | group A) ~ poisson
(оцінюйте курс покупки лише для групи А?)
Але що я роблю далі, щоб насправді обчислити purchase_rate | group A
. Як підключити два дистрибутиви разом, щоб мати сенс для групи А (або будь-якої іншої групи).
Чи потрібно спочатку підходити до моделі? У мене є дані, які я міг би використати для "тренування" моделі:
- Оголошення A: 352 кліки, 5 покупок
- Оголошення В: 15 кліків, 0 покупок
- Оголошення C: 3519 кліків, 130 покупок
Я шукаю спосіб оцінити ймовірність будь-якої з груп. Якщо група має лише пару точок даних, я, по суті, хочу повернутися до середнього показника в світі. Я знаю трохи про байєсівські статистичні дані і прочитав багато PDF-файлів людей, що описують, як вони моделюють, використовуючи байєсівські умовиводи і кон'юговані пріори тощо. Я думаю, що є спосіб зробити це правильно, але я не можу зрозуміти, як правильно його моделювати.
Я був би дуже радий натякам, які допомагають мені сформулювати свою проблему байєсівським способом. Це дуже допомогло б знайти приклади в Інтернеті, які я міг би використати, щоб реально реалізувати це.
Оновлення:
Дуже дякую за відгук. Я починаю розуміти все більше і більше дрібниць про свою проблему. Дякую! Дозвольте мені задати кілька питань, щоб побачити, чи я зараз трохи краще зрозумів проблему:
Потім я помножую на попередній, який є P (конверсія), що в моєму випадку є лише попереднім Джеффрі, що є неінформативним. Чи буде попереднє перебування таким самим, як я отримаю більше даних?
Використовуючи попереднє значення Джеффріса, я припускаю, що я починаю з нуля і нічого не знаю про мої дані. Це попереднє називається "неінформативним". Як я продовжую дізнаватися про свої дані, чи оновлюю попереднє?
Коли кліки та конверсії надходять, я прочитав, що мені потрібно "оновити" свій дистрибутив. Чи означає це, що параметри мого розподілу змінюються, або що попередні зміни? Коли я отримую клік за оголошення X, чи оновлюю більш ніж один дистрибутив? Більше одного попереднього?