Brexit: чи було «відпустка» статистично значущою? [зачинено]


12

У цій публікації ми задаємо питання про природне явище, яке називається людиною, намагаючись знайти рішення шляхом підрахунку голосів . Специфічний випадок такого природного явища, про який йдеться у цьому питанні, стосується Brexit .

Зауважте: питання не в політиці. Мета - спробувати обговорити таке природне явище зі статистичної точки зору на основі спостережень.

Конкретне питання:

  • Питання: Що означає голос Brexit за відпустку ? Наприклад, це означає, що громадськість справді хоче вийти з ЄС? Це просто означає, що громадськість не впевнена і їй потрібно більше часу на роздуми? Або це щось інше?51.9%

Припущення 1: помилки в процесі голосування немає.


14
Демократія не в статистичному значенні. Результат 51,9% означає, що 51,9% тих, хто проголосував, проголосували за «відпустку». Це не опитування думки. Ті, хто не голосував, голосували (не) використовуючи ноги. Інтерпретувати 51,9% як "громадськість не впевнена, і їй потрібно більше часу на роздуми", просто лежить статистика. Brexit стався з вірогідністю 1.
Тім

7
Ця нитка призначена бути нестатистичною, висловлюваною та, можливо, навіть полемічною. Це просто не підходить для цього сайту, незалежно від того, наскільки популярним він може бути. У нас є чат із людьми, які були б раді брати участь у таких розмовах: перевірте це!
whuber

2
Я вважаю, що поточна дискусія є статистично орієнтованою і є хорошим прикладом інтерпретації результатів голосування, оскільки це стосується статистичного тестування.
Underminer

3
Ви ставите важливе питання: помилка вимірювання показників громадської думки, таких як опитування. Я боюся, що основне джерело помилок не в розмірі вибірки.
Аксакал

4
ІМХО, це нестатистичне питання з додаванням тонкого шпону статистики, щоб замаскувати цей факт. Як я читав, припущення "немає помилки в процесі голосування" виключає всі статистичні міркування і обов'язково направляє дискусію на те, що "голосування ... означає" в демократії. Це питання політології та філософії, а не статистики.
whuber

Відповіді:


17

Я погоджуюся з @Underminer, що помилки вибірки немає, але не тому, що вибірка є великою, а тому, що відбору не було . Ніхто не був вибіркою для голосування. Очевидно, була якась незначна частка людей, які хотіли проголосувати, але не змогли (наприклад, в цей день трапилася автомобільна катастрофа) або хто зробив недійсні голоси, але це єдиний "вибірки" тут.

Результат точний, помилки не було, оскільки все населення брало участь у голосуванні (деякі брали участь, не беручи в ньому участі). Деякі вирішили проголосувати, інші - не. Деякі вирішили проголосувати у відпустці, інші - не. Демократія полягає не в статистичній значущості, а в тому, що насправді сталося . Голосування призначене не для того, щоб дізнатися про думку людей, а для прийняття рішення. Власне, люди часом не голосують відповідно до того, що думають, а демонструють чи чогось домагаються . Наприклад, на виборах люди можуть голосувати не за свого кращого кандидата, а за другого бажаного кандидата, якщо вони вважають, що він має більше шансів на перемогу.


Розглянемо випадок сірої зони, де населення, що голосує, не дуже впевнене в тому, що для них добре. Наприклад, випадок наявності 2 кандидатів, що майже однаково добре. У такому випадку, я думаю, що ті, хто голосує, ймовірно, будуть несистематично відрізнятися, оскільки я думаю, що їхні голоси можуть мати розподіл, близький до рівномірного. Моя мета тут не переосмислити демократію (політичну тему), а скоріше зрозуміти, що можна сказати про те, чи був Brexit сірою зоною?
печерний людина

2
@caveman незалежно від того, впевнені вони чи ні, важливо, як вони проголосували, оскільки голосування стосується фактичних голосів. Напевно, деякі люди не мали чіткої думки, дехто з них голосував, а деякі ні, але це також не має значення, оскільки підрахунок - це фактичні голоси тих, хто проголосував.
Тім

Якщо я правильно це розумію, ваш погляд на те, як демократія тлумачить голоси? Я погоджуюсь з тобою. Однак я не трактую це так, як це роблять політики. Я намагаюся використовувати населення, щоб визначити, добре чи погане рішення чи не дуже зрозуміле. Це різне використання голосування.
печерник

2
@caveman люди постійно змінюють свою думку, психологи писали про це тисячі праць ... Так, 51,9% не означає, що саме 51,9% британців на 100% впевнені у виході з ЄС. Люди навіть можуть бути не впевнені у порівнянні довжин ліній ( en.wikipedia.org/wiki/Asch_conformity_experiment ) ...
Тім

1
@Aksakal Я не збираюся коментувати, хто має право голосувати, а хто ні. Я також не збираюся коментувати, наскільки складно отримати необхідні дані. Це політика і як така не є темою тут. Зі статистичної точки зору, кожен виборець, що має право на участь, має певну ймовірність не голосувати. На цю ймовірність можуть впливати певні фактори, які можуть бути, а не можуть бути пов'язані з їх уподобаннями, але кожен виборець, який має право вибору, обирає (не) здійснювати це право на власний розсуд.
користувач3697176

9

51,9% - відсоток виборців, які хочуть виїхати . Оскільки розмір вибірки настільки великий (> 33 мільйони), випадкової помилки вибірки практично немає.

Тестування статистичної значущості намагатиметься визначити, чи можна різницю залишків та відпусток пояснити лише помилкою вибіркової вибірки, і різниця, безумовно, буде значною (див. Відповідь @ печера).

Проблема такого підходу полягає в тому, що статистична значимість дає дуже сильне припущення, що вибірка є репрезентативною для всього населення (всієї Британії), а не лише тих, хто голосує.

Коефіцієнт невідповіді (тих, хто не голосує) має надзвичайно важливе значення для визначення того, чи хоче більше половини всієї Британії «виїхати», і це важко виміряти. Упередженість, що не відповідає, створюється тоді, коли підгрупи, які мають меншу ймовірність голосування, мають систематично різні погляди. Наприклад, на підставі опитувань, проведених на виїзді, тисячоліття мали меншу ймовірність голосування, але більш шанси на те, що голосування залишаться , що змінює результати, намагаючись представити населення всієї Британії.

З цієї причини тестування статистичної значущості в його традиційному розумінні в основному недоцільно .


Припущення: нам потрібно визначити деякі терміни для будь-якого з цього, щоб мати сенс і уникати політичного обговорення того, що намагається досягти голосування. Ось мої визначення:

Населення: Кожна людина, яка проживає у Великобританії

Рамка вибірки: Кожна людина, яка має право голосу, здатна голосувати

Методологія вибірки: Добровільна відповідь, акт голосування бере участь у опитуванні

Зразок: Особи, які насправді голосують

У цій установці вибіркова частка може бути використана (для кращого чи гіршого) для оцінки відсотка всіх людей, які схиляються до залишитися (або піти ).


8

Ви запитаєте

Що означає 51,9% голосу Brexit за відпустку?

Це означає, що 51,9% виборців проголосували за відпустку.

Наприклад, це означає, що громадськість справді хоче вийти з ЄС? Це просто означає, що громадськість не впевнена і їй потрібно більше часу на роздуми? Або це щось інше?

17421887161462971293135318

Можливо, можна було б скласти анкету, що відповідає вашим питанням. Схоже, це не було те, що сталося на референдумі, як здійснено.


1
Чи можете ви, будь ласка, обговорити значення голосувань стосовно виборців (тобто не всього населення), за винятком поверхневого висновку, що це означає « 51,9% проголосували »? Цікаво, який обсяг інформації ми можемо отримати з цього.
печерний чоловік

4
Caveman, цей коментар більше, ніж будь-який інший, демонструє ваше запитання нестатистичне. Оскільки 51,9% (разом із сумарними підрахунками) складають усі дані, що свідчать про виборців, і немає сумнівів (якщо ви не хочете оскаржити точність підрахунку, що є окремим питанням), ваше відхилення від цієї відповіді означає ви шукаєте нестатистичні висновки.
whuber

Що робити, якщо ми моделюємо Brexit як проблему бінарної класифікації та розглянемо виборців як оцінки класифікаторів, що входять до складу ансамблю. У цій моделі мета полягає не в тому, щоб визначити те, чого хоче більшість громадян, а скоріше мета - визначити оптимальний класифікатор з простору класифікаторів. Тоді ми можемо використовувати деякі заходи для перевірки доброти такого ансамблю класифікаторів на основі людини. Наприклад, ми можемо використовувати Perplexity або щось інше, що підходить для цієї задачі бінарної класифікації, коли основна істина невідома (наприклад, ми чітко не знаємо, чи відпустка краще, ніж залишається).
печерний чоловік

@caveman: З огляду на те, що основна істина є (правильно) невідома, яку метрику ви б використали для "визначення оптимального класифікатора з простору класифікаторів"? Будь-яка така метрика кодує ухили аналітика, який підбирає метрику, за винятком метрики, "відтворює результат голосування", на який метрику ви вже знаєте відповідь: 51,9% / 48,1%.
Ерік Тауерс

@EricTowers Я прийняв це politics.stackexchange.com , де я говорив про різні методи - politics.stackexchange.com/questions/11433 / ...
печерний

2

TL; DR

R=100051.9%51.9%

0

48.1%

0

Тому я роблю висновок, що голосування за Brexit не є галасливим побічним ефектом невпевненого чи розгубленого населення. Здається, є систематична причина, яка призводить їх до виходу з ЄС.

Я завантажив код імітатора сюди: https://github.com/Al-Caveman/Brexit

Деталі

Враховуючи припущення 1 , можливими відповідями (або гіпотезою) є:

  • H0
  • H1

Зауважте: неможливо, що громадськість впевнено хоче залишитися, тому що ми виключили помилки голосування.

H0H1

  • 51.9%
  • 151.9%

H1H0

Для того, щоб оцінити цю ймовірність, нам потрібно знати розподіл невпевненого британського населення в такій бінарній системі голосування, як Brexit. Отже, мій перший крок - це моделювати цей розподіл, дотримуючись припущення нижче:

  • Припущення 2: населення, яке складається з незахищених осіб, отримає випадковий голос. Тобто кожна можлива відповідь має рівний шанс бути обраним.

На мій погляд, це припущення є справедливим / розумним.

Крім того, ми моделюємо кампанії " залишити та залишитися " як два різних процеси наступним чином:

  • PleaveOleave=[l1,l2,,ln]
  • PremainOremain=[r1,r2,,rn]

де:

  • n
  • i{1,2,,n}li,ri{0,1}01

з урахуванням наступних обмежень:

  • i{1,2,,n}liri1li=1ri=0ri=1li=0i{1,2,,n}

Oleave=[1,0,0]3

Oremain=[0,1,0]3

Oleave[3]=Oremain[3]=0

33,568,18451.9%10051.9=48.1%

  • n=33,568,184
  • 33,568,184×0.519=17,421,887.496
    i=133,568,184Oleave[i]=17,421,887.49617,421,887
  • 33,568,184×(10.519)=16,146,296.504
    i=133,568,184Oremain[i]=16,146,296.50416,146,297

Тому ми визначаємо вихідні масиви наступним чином:

  • i{1,2,,17421887}Oleave[i]=1
  • i{17421887+1,17421887+2,,33568184}Oleave[i]=0
  • i{1,2,,17421887}Oremain[i]=0
  • i{17421887+1,17421887+2,,33568184}Oremain[i]=1
  • i{1,2,,33568184}Ounsure,m[i]=CC{0,1}mOunsure,mOunsure,mOunsure,1=Ounsure,20.533,568,184

pleave

pleave=1Rm=1R{1if (i=133,568,184Oleave[i])(i=133,568,184Ounsure,m[i])0else
ROunsure,m визначено.

premain

premain=1Rm=1R{1if (i=133,568,184Oremain[i])(i=133,568,184Ounsure,m[i])0else

R=1,000

total leave votes: 17421887
total remain votes: 16146297
simulating p values............ ok
p value for leave: 0.000000
p value for remain: 0.000000

Іншими словами:

  • pleave=0
  • premain=0

2
Можливо, в цьому випадку важливішим є показник невідповіді (тобто осіб, які не голосують). Похибка (або міра статистичної значущості) враховує лише випадкові похибки вибірки. Упередженість невідповіді НЕ включається до цього, і це набагато більш впливово, ніж випадкова помилка вибірки при опитуванні з таким великим розміром вибірки.
Underminer

46,499,53746,499,537(17421887+16146297)=12,931,353

3
Не існує статистично задовільного способу поводження з випадковими відсутніми даними.
Underminer

Ті, хто не проголосував, можуть складатися з людей, які не цікавляться політикою (наприклад, більше немає довіри). В якості альтернативи, це можуть бути ті, хто не впевнений у собі. Або це може бути суміш двох. Що було б, якщо припустити, що " всі незважаючі не впевнені "? Чи це буде верхньою межею для перевірки того, чи була нинішня ситуація, коли громадськість відчувала, що Brexit - це сіра зона ?
печерний чоловік

3
Тут існує плутанина щодо характеру та обсягу статистики. Ви намагаєтеся створити процес модель голосування, і як це може повідомити механізми & обгрунтованість управління і державних рішень. Це гідне завдання в політичній науці . Це просто не статистика (хоча задіяна статистика).
gung - Відновіть Моніку

1

Ви можете задати дещо інше запитання: якщо припустити, що 50% дуже великої сукупності проголосували "так", і ви запитали випадкову вибірку розміром S, яка ймовірність того, що 51,9% вашої вибірки відповіли "так", залежно від обсяг вибірки?

S1/2

S1/2(6.10.5/0.019)2


0

Це ще одне рішення з використанням аналітичного методу замість моделювання.

n0.5

51.9%17,421,887Oleave0.533,568,18417,421,887+10.533,568,184

17,421,887

i=17,421,88733,568,1840.533,568,184=(33,568,18417,421,887)×0.533,568,184=8.39663381928984×10101050240

( розраховується шляхом WolframAlpha )8.39663381928984×1010105024

І це ймовірність отримати відпустки щодо незахищеного населення .51.9%

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.