Методи видобутку даних у кампанії Обами


10

Я зіткнувся з цією статтею про команду з пошуку даних у кампанії переобрання Обами. На жаль, стаття дуже нечітка щодо власне механізму статистичних алгоритмів. Однак це звучало так, ніби загальні прийоми відомі в соціальних і політичних науках. Оскільки це не моя сфера знань, чи може хтось вказати мені на (огляд) літератури про подібні методи?

Відповіді:


16

Ця область називається мікронацілюванням (якщо ви хочете перейти в Google). Кампанія досить скритна о своїх інструментах і процедурах, так мені відомо, не так багато опубліковані роботи , крім Hal Malchow в політичному націлювання (2008) або Green & Гербер (2008) вийти на голосуванні: Як збільшити Явку виборці (останні угоди більше з аспектами соціальних наук, наприклад, які ефективні та подібні оголошення).

Що стосується більш технічних питань, то література є ще дефіцитнішою, але див., Наприклад, Murray & Scime (2010) , документ про політичний аналіз Imai & Strauss (2011) ( післядрук ) або нещодавній газетний журнал " Аналіз прикладної статистики" від нас Rusch, Lee, Hornik, Jank & Zeileis (2013) ( післядрук ). Їх спільним є те, що вони використовують методи видобутку даних, переважно на основі дерев.

Murray & Scime використовують дерева стандартної класифікації, такі як CART.

Rusch та ін. використовувати класифікаційні дерева, логістичні моделі та гібрид дерев та логістичну регресію. Вони також використовують (серед інших) випадкові ліси, нейронні мережі, підтримуючі векторні машини та байєсівські аддиктивні регресійні дерева для порівняння зі своїми гібридами дерев, як це описано у реплікації до статті . Їх гібридні дерева виконуються нарівні з тими іншими методами в їх наборах даних і пропонують підвищену інтерпретацію (ми також ділимось їх кодом та даними).

Imai & Strauss цікавий тим, що вони представляють вичерпну теоретичну базу для прийняття рішень для оптимального планування кампанії, а не лише інструменти для мікронацілювання, як це роблять інші. Таким чином, вони дуже зосереджені на аспектах оперативних досліджень щодо того, як отримати максимум користі від кожного долара, що вкладається в кампанію. В аспекті їхньої бази, де вони використовують статистичні прийоми для мікронацілювання та оцінки явки, вони знову покладаються на класифікаційні дерева.

Тож, мабуть, існує певна думка, що використання деревних методів добре працює у цій галузі.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.