Представитель Республиканской партии 53 % Представитель Демократической партии 45 % Независимый кандидат 2 % (Предел погрешности 4 %)

Из центральной предельной теоремы вам известно, что приблизительно 95 % пропорций выборки будут отстоять от истинной пропорции доли голосов совокупности на расстоянии, не превышающем двух стандартных ошибок (в данном случае 4 %).

Таким образом, если мы хотим обеспечить большую уверенность в результатах экзитпола, то нам придется умерить свои амбиции в том, что касается точности прогноза. Как следует из приведенной выше пропорции доли голосов (к сожалению, мы не можем показать здесь соответствующую красочную вращающуюся 3D-диаграмму), ваша телекомпания может, при 95 %-ном доверительном уровне, объявить о том, что кандидат от республиканцев получил 53 % голосов избирателей ± 4 %, то есть между 49 и 57 % голосов избирателей, а кандидат от демократов – 45 % ± 4 %, то есть между 41 и 49 % голосов избирателей.

Правда, теперь вы сталкиваетесь с новой проблемой. При 95 %-ном доверительном уровне вы не можете отвергнуть вероятность того, что каждый из кандидатов мог набрать по 49 % голосов избирателей. Это неизбежный компромисс; единственная возможность обрести большую уверенность в том, что результаты вашего экзитпола будут соответствовать истинным результатам выборов без использования новых данных, – обуздать свои амбиции относительно точности прогнозов. Подумайте об этом вне статистического контекста. Допустим, вы говорите приятелю, что «почти не сомневаетесь» в том, что Томас Джефферсон был третьим или четвертым президентом США. Каким образом вы можете обрести большую уверенность в своих исторических познаниях? Снизив категоричность утверждений. Можно, например, сказать, что вы «абсолютно уверены» в том, что Томас Джефферсон был одним из первых пяти президентов США.

Ваш начальник предлагает вам заказать пиццу и быть готовым к тому, что придется поработать вечером (или даже всю ночь). На этот раз статистические боги оказываются к вам милостивы. Вам на стол кладут данные второго экзитпола, для проведения которого использовалась выборка из 2000 избирателей. Его результаты таковы: кандидат-республиканец – 52 % голосов, кандидат-демократ – 45 % голосов, независимый кандидат – 3 % голосов. На этот раз ваш босс совершенно взбешен, поскольку эти данные показывают, что разрыв между кандидатами сократился, а это еще больше затрудняет своевременное предсказание итогов голосования. Но не нужно спешить с выводами! Вы указываете (стараясь сохранять присутствие духа), что размер второй выборки (2000) в четыре раза больше первой, которая использовалась при проведении первого экзитпола. Таким образом, стандартная ошибка существенно уменьшилась. Новая стандартная ошибка для кандидата от республиканцев равняется √[0,52(0,48)/2000], что составляет 0,01.

Если вашего начальника по-прежнему устраивает 95 %-ный доверительный интервал, то вы можете объявить победителем кандидата от республиканцев. С учетом вашей новой стандартной ошибки 0,01 95 %-ные доверительные интервалы для кандидатов таковы: кандидат-республиканец: 52 ± 2, или между 50 и 54 % голосов избирателей; кандидат-демократ 45 ± 2, или между 43 и 47 % голосов избирателей. Теперь между этими двумя доверительными интервалами нет никакого взаимного перекрытия. Вы можете в прямом эфире сообщить, что на выборах победил кандидат от республиканцев; такой прогноз окажется правильным более чем в 95 случаях из 100[52].

Но это даже лучше. Из центральной предельной теоремы вам известно, что в 99,7 % случаев пропорция долей выборки будет отстоять от истинной пропорции долей совокупности на расстоянии, не превышающем трех стандартных ошибок. В нашем примере с выборами 99,7 %-ные доверительные интервалы для двух кандидатов таковы: кандидат от республиканцев: 52 ± 3 %, или между 49 и 55 % голосов избирателей; кандидат от демократов 45 ± 3 %, или между 42 и 48 % голосов избирателей. То есть после того как вы объявите победителем выборов кандидата-республиканца, благодаря новой выборке из 2000 избирателей останется лишь ничтожная вероятность того, что вы вместе со своим начальником будете уволены.

Вы, наверное, обратили внимание, что использование большей по объему выборки снижает стандартную ошибку. Именно за счет этого крупные общенациональные опросы позволяют получить необычайно точные результаты.

В то же время выборки меньшего размера увеличивают величины стандартных ошибок и, следовательно, доверительный интервал (или «предел ошибки выборочного исследования», как принято говорить среди специалистов по проведению опросов общественного мнения). Текст, набранный мелким шрифтом в опросе The New York Times / CBS News, гласит, что предел погрешности для вопросов по поводу праймериз республиканцев составляет 5 процентных пунктов в сравнении с 3 процентными пунктами для других вопросов, включенных в опрос общественного мнения. Эти вопросы задавались лишь тем, кто сам назвал себя сторонником Республиканской партии, и тем, кто участвовал в голосованиях на закрытых собраниях ее членов, поэтому размер выборки для данной подгруппы вопросов снизился до 455 (общее количество избирателей, участвовавших в опросе, составило 1650).

Как обычно, примеры, приведенные в этой главе, «грешат» многими упрощениями. Вы, наверное, обратили внимание, что в примере с выборами у кандидатов от Республиканской и Демократической партий должна была быть своя собственная стандартная ошибка. Вернемся еще раз к приведенной выше формуле: SE = √[p(1 − p)/n]. Размер выборки n один и тот же для обоих кандидатов, однако p и (1 − p) будут несколько разниться. Во втором экзитполе (когда размер выборки был увеличен до 2000 избирателей) стандартная ошибка для кандидата от Республиканской партии составила √[0,52 ? (0,48)/2000] = 0,01117; для кандидата от Демократической партии – √[0,45? (0,55)/2000] = 0,01112. Разумеется, какими бы ни были наши намерения и цели, эти два числа должны быть одинаковы[53]. Именно поэтому я остановил свой выбор на общепринятом соглашении: из двух значений стандартной ошибки использовать большее значение для всех кандидатов. В любом случае такой подход вносит в доверительные интервалы небольшую дополнительную меру предосторожности.

При проведении многих общенациональных опросов общественного мнения, включающих в себя большое число вопросов, идут еще дальше. В случае опроса The New York Times / CBS News для каждого вопроса должна быть, строго говоря, своя стандартная ошибка (в зависимости от ответа). Например, стандартная ошибка, относящаяся к ситуации, когда 9 % участников опроса одобряют деятельность Конгресса США, должна быть меньше стандартной ошибки, относящейся к ситуации, когда 46 % участников опроса одобряют деятельность Обамы на посту президента США, поскольку 0,09 ? 0,91 меньше, чем 0,46 ? 0,54: 0,0819 против 0,2484. (Интуитивные соображения, на которых основывается эта формула, объясняются в приложении к настоящей главе.)

Поскольку использование собственной стандартной ошибки для каждого вопроса было бы неудобным и вносило бы излишнюю путаницу, при проведении подобных опросов общественного мнения обычно предполагается, что доля выборки для каждого вопроса равняется 0,5 (или 50 %) – что порождает максимально возможную стандартную ошибку для любого размера выборки, – и именно такая стандартная ошибка используется при вычислении предела ошибки выборки для опроса в целом[54].

При соответствующей организации опросы общественного мнения становятся поистине замечательными инструментами. Согласно Фрэнку Ньюпору, главному редактору Gallup Organization, опрос 1000 человек позволяет с высокой степенью точности оценить настроения в обществе в целом. С точки зрения статистики Фрэнк Ньюпор, несомненно, прав. Но чтобы получить столь значимые и точные данные, мы должны надлежащим образом провести опрос, а затем правильно интерпретировать его результаты, что порой намного легче сказать, чем сделать. Неправильные результаты опросов обычно обусловлены не ошибкой в математических расчетах при вычислении стандартных ошибок, а являются следствием некорректно сформированной выборки, или неправильно сформулированных вопросов, или того и другого. Выражение «мусор на входе – мусор на выходе» полностью применимо к проведению социологических опросов. Ниже перечислены ключевые методологические вопросы, которые необходимо задать при проведении любого опроса общественного мнения или оценивании чьей-то работы.

<< | >>
Источник: Чарльз Уилан. Голая статистика. Самая интересная книга о самой скучной науке. 2016

Еще по теме Представитель Республиканской партии 53 % Представитель Демократической партии 45 % Независимый кандидат 2 % (Предел погрешности 4 %):

  1. ПОЛИТИЧЕСКИЕ ПАРТИИ
  2. Политические партии
  3. Определение оптимального размера заказываемой партии
  4. 8. Играйте долгие партии
  5. В далёком 1969 году я совершил величайшую ошибку в своей жизни. В конце 2007 года о ней неожиданно вспомнил депутат от либерально-демократической партии в палате общин Винс Кейбл, как раз тогда, когдаVirgin Money собиралась выкупить банк Northern Rock. выступая с трибуны Парламента Великобритании, он сказал, что я не вполне подходящая кандидатура для управления банком. вот так спустя сорок лет мне вновь пришлось расплачиваться за допущенную мной ошибку.
  6. В далёком 1969 году я совершил величайшую ошибку в своей жизни. В конце 2007 года о ней неожиданно вспомнил депутат от либерально-демократической партии в палате общин Винс Кейбл, как раз тогда, когдаVirgin Money собиралась выкупить банк Northern Rock. выступая с трибуны Парламента Великобритании, он сказал, что я не вполне подходящая кандидатура для управления банком. вот так спустя сорок лет мне вновь пришлось расплачиваться за допущенную мной ошибку.
  7. Правовой статус налоговых представителей
  8. Задание 2 Пользуясь приведенными в табл. 18.2 исходными данными, определить продолжительность срока расхода одной доставляемой партии товара (дней).
  9. Представители
  10. Уполномоченный представитель:
  11. СПЕЦИАЛЬНЫЕ ПРОГРАММЫ ДЛЯ ПРЕДПРИНИМАТЕЛЕЙ —ПРЕДСТАВИТЕЛЕЙ МЕНЬШИНСТВ
  12. ПРИЛОЖЕНИЕ 1. Интервью с представителями поисковых систем
  13. Типичные представители: Боден и Ботеро
  14. 10.4. Доведение результатов аудита до руководства и представителей собственника аудируемого лица
  15. Основные функции деятельности торговых представителей
  16. Интервью-диалог и беседа в общении с представителями СМИ
  17. Факторы, определяющие работу успешных торговых представителей
  18. Основные функции деятельности торговых представителей