Ієрархічна баєсова модель (?)


12

Вибачте, будь ласка, мою розсилку статистичного лінгва :) Я знайшов тут декілька питань, які стосуються реклами та ціни на кліки. Але жодна з них мені не дуже допомогла в розумінні моєї ієрархічної ситуації.

Існує пов'язане питання Чи є ці еквівалентні уявлення тієї ж ієрархічної байєсівської моделі? , але я не впевнений, чи є у них насправді подібна проблема. Ще одне питання Пріори для ієрархіальної бієміальної моделі Баєса детально розглядає питання про гіперпріори, але я не в змозі відобразити їх рішення моєї проблеми

У мене є кілька оголошень в Інтернеті для нового продукту. Я пускав рекламу протягом кількох днів. У цей момент достатньо людей натискали на рекламу, щоб побачити, який із них отримує найбільше кліків. Після того, як я вигнав усіх, окрім тих, у яких найбільше кліків, я дав йому працювати ще пару днів, щоб побачити, скільки людей насправді купують після натискання на оголошення. У той момент я знаю, чи було б гарною ідеєю запускати рекламу в першу чергу.

Моя статистика дуже галаслива, тому що я не маю багато даних, оскільки щодня продаю лише пару предметів. Тому дійсно важко підрахувати, скільки людей купує щось після того, як побачили рекламу. Лише кожен кожні 150 кліків призводить до покупки.

Взагалі кажучи, я повинен знати, чи втрачаю гроші на кожне оголошення якомога швидше, якось згладжуючи статистику групи оголошень із глобальною статистикою для всіх оголошень.

  • Якщо я зачекаю, поки кожна реклама не побачить достатню кількість покупок, я розберусь, бо це забирає занадто багато часу: на тестування 10 оголошень мені потрібно витратити в 10 разів більше грошей, щоб статистика для кожного оголошення була достатньо надійною. На той час я, можливо, втратив гроші.
  • Якщо я середній рівень покупок за всі оголошення, я не зможу випустити рекламу, яка також не працює.

Чи можу я використовувати глобальний курс закупівлі ( N $ підрозподілів? Це означає, що чим більше я маю даних про кожне оголошення, тим більш незалежною є статистика цього оголошення. Якщо ще ніхто не натиснув оголошення, я вважаю, що середній показник у світі є відповідним.perclick)anduseitasapriorfor

Який розподіл я вибрав би для цього?

Якщо у мене було 20 клацань на A і 4 клацання на B, як я можу це моделювати? Поки я зрозумів, що розподіл бінома або Пуассона тут може мати сенс:

  • purchase_rate ~ poisson (?)
  • (purchase_rate | group A) ~ poisson (оцінюйте курс покупки лише для групи А?)

Але що я роблю далі, щоб насправді обчислити purchase_rate | group A. Як підключити два дистрибутиви разом, щоб мати сенс для групи А (або будь-якої іншої групи).

Чи потрібно спочатку підходити до моделі? У мене є дані, які я міг би використати для "тренування" моделі:

  • Оголошення A: 352 кліки, 5 покупок
  • Оголошення В: 15 кліків, 0 покупок
  • Оголошення C: 3519 кліків, 130 покупок

Я шукаю спосіб оцінити ймовірність будь-якої з груп. Якщо група має лише пару точок даних, я, по суті, хочу повернутися до середнього показника в світі. Я знаю трохи про байєсівські статистичні дані і прочитав багато PDF-файлів людей, що описують, як вони моделюють, використовуючи байєсівські умовиводи і кон'юговані пріори тощо. Я думаю, що є спосіб зробити це правильно, але я не можу зрозуміти, як правильно його моделювати.

Я був би дуже радий натякам, які допомагають мені сформулювати свою проблему байєсівським способом. Це дуже допомогло б знайти приклади в Інтернеті, які я міг би використати, щоб реально реалізувати це.

Оновлення:

Дуже дякую за відгук. Я починаю розуміти все більше і більше дрібниць про свою проблему. Дякую! Дозвольте мені задати кілька питань, щоб побачити, чи я зараз трохи краще зрозумів проблему:

ab

12 12

P(conversion|ad=X)=P(ad=X|conversion)P(conversion)P(ad=X)

  • P(ad=X|conversion)α1α+β2αβαβX

  • Потім я помножую на попередній, який є P (конверсія), що в моєму випадку є лише попереднім Джеффрі, що є неінформативним. Чи буде попереднє перебування таким самим, як я отримаю більше даних?

  • P(ad)

Використовуючи попереднє значення Джеффріса, я припускаю, що я починаю з нуля і нічого не знаю про мої дані. Це попереднє називається "неінформативним". Як я продовжую дізнаватися про свої дані, чи оновлюю попереднє?

Коли кліки та конверсії надходять, я прочитав, що мені потрібно "оновити" свій дистрибутив. Чи означає це, що параметри мого розподілу змінюються, або що попередні зміни? Коли я отримую клік за оголошення X, чи оновлюю більш ніж один дистрибутив? Більше одного попереднього?

Відповіді:


9

Як ви зрозуміли, дуже загальним способом вирішення вашого питання є побудова ієрархічної (багаторівневої) баєсової моделі. Модель має три частини, як показано нижче.

Модель

Ієрархічна байєсівська модель для коефіцієнтів конверсії оголошень

  1. N(μμ0,η0)μGa(λa0,b0)μ0=0,η0=0.1,a0=1,b0=1

  2. πjjjρj:=logit(πj)N(ρjμ,λ)

  3. kjjBin(kjσ(ρj),nj)σ(ρj)njj

Дані

Як приклад, візьмемо дані, які ви опублікували в оригінальному запитанні,

Оголошення A: 352 кліки, 5 покупок

Оголошення В: 15 кліків, 0 покупок

Оголошення C: 3519 кліків, 130 покупок

n1=352,k1=5,n2=15,k2=0,

Висновок

Інвертування цієї моделі означає отримання заднього розподілу для параметрів нашої моделі. Тут я застосував варіаційний підхід Байєса до інверсії моделі, який обчислювально більш ефективний, ніж стохастичні схеми вибірки, такі як MCMC. Я накреслив результати нижче.

Дані та отримані афіші

На малюнку зображено три панелі. (a) Проста візуалізація наведених вами прикладних даних. Сірі смуги відображають кількість кліків, чорні смуги - кількість перетворень. (b) Отриманий задній розподіл серед середнього коефіцієнта конверсії. Коли ми спостерігаємо більше даних, це стане все більш точним. (c) Центральні 95% інтервалів задньої вірогідності (або достовірних інтервалів) швидкості конверсії, характерної для реклами.

Остання панель ілюструє дві ключові особливості байєсівського підходу до ієрархічного моделювання. По-перше, точність плакатів відображає кількість базових точок даних. Наприклад, у нас є відносно багато точок даних для оголошення C; таким чином, його задня частина набагато точніша, ніж афіші інших оголошень.

По-друге, умовиводи, специфічні для реклами, повідомляються знаннями про населення. Іншими словами, рекламні плакати базуються на даних усієї групи, ефект, відомий як скорочення для населення . Наприклад, задній режим (чорне коло) оголошення A значно перевищує його емпіричний коефіцієнт перетворення (синій). Це пов’язано з тим, що всі інші оголошення мають більш високі задні режими, і, таким чином, ми можемо отримати кращу оцінку основної істинності, інформуючи наші оцінки, характерні для реклами, середньою групою. Чим менше даних ми матимемо про конкретну рекламу, тим більше на її задній вплив впливатимуть дані інших оголошень.

Усі ідеї, які ви описали у своєму первісному запитанні, виконуються природним чином у вищезгаданій моделі, що ілюструє практичну корисність повністю байєсівської обстановки.


Кей, дякую за детальну відповідь. Я розумію, що відповідь трохи датована, але чи не могли б ви поділитися супровідним кодом, якщо ви зберегли його? Я намагаюся вивчити ієрархічне байєсівське моделювання, але намагаюся знайти інтуїтивні приклади в Р.
Жубарб

@Kay, дякую за цікаву відповідь, чи не могли б ви додати трохи посилань на ієрархічні байєсові моделі? Дякую!
user511005

1
Привіт @Zhubarb, user511005, ось посилання на документ, що описує вищевказану модель: sciencedirect.com/science/article/pii/S1053811913002371 Я зібрав тут короткий вступ до варіативного висновку: people.inf.ethz.ch/ bkay / розмови / Brodersen_2013_03_22.pdf
Kay Brodersen

2

p

paabb

ab(12,12)a,b

pa,b


У відповідь на ваші зміни:

pabppab

Байєсівське оновлення є

P(px)P(p)P(xp)

xpababp

Попередження Джефріса - це не те саме, що неінформативне попереднє, але я вважаю, що це краще, якщо у вас немає вагомих причин використовувати його. Не соромтеся задати ще одне питання, якщо ви хочете розпочати дискусію з цього питання.


Дякуємо за відгук! Я оновив своє первісне запитання, оскільки у цьому вікні коментарів мені не вистачало символів. Було б чудово, якби ви могли дати відгуки щодо деяких деталей, про які я написав в оновлення.
Міка Тіхонен
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.