?

Log in

No account? Create an account

Previous Entry | Next Entry


Для анализа были взяты данные с сайта ЦИК Украины http://www.cvk.gov.ua/vp2014 . При этом мной не были учтены данные голосования по заграничным округам, так как количество проголосовавших там мало по сравнению с общим числом, так что вклад в результат минимален, а распределение обычно сильно отличается основного, что затрудняет анализ. Из-за этого приведенные данные могут чуть-чуть отличаться от официальных.
Еще одна причина возможного расхождения результатов – Крым и Севастополь. На сайте ЦИК в разделе о численности избирателей они присутствуют, а о данных голосования их нет совсем, так что мною они не брались. В некоторых областях по некоторым округам данные о голосовании отсутствуют, в этом случае я брал число проголосовавших как нулевое, а доли проголосовавших как неопределенное, то есть в анализе эти данные не участвовали.
В результате из 225 избирательных округов использовались данные по 189 округам.
Для того, чтобы читателям было проще ориентироваться, я буду параллельно приводить результаты по другим выборам и сравнивать результаты.

1. Явка
Во время скандальных последних выборов в Думу России одна из самых обсуждаемых тем было то, что вместо «кривой Гаусса» в распределении явки по округам получилась «пила Чурова»:

Помимо участков с очень высокой явкой (это были спецучастки – воинские части, больницы и СИЗО) были также характерные всплески сразу после явки, превышающей круглое число процентов. К сожалению, на сайте ЦИК Украины были представлены данные не по избирательным участкам, а по округам, при переходе к которым подобные эффекты становятся незаметными.
Для Украины распределение явки оказалось следующим

Здесь по оси X – доля избирателей, принявших участие в голосовании, а по оси Y – число округов.
На Гаусса здесь так же непохоже. Разумеется, чистый «Гаусс» и не должен быть, так как он получается только при заведомо идеализированных условиях, однако для примера приведу распределение по явке на некоторых других выборах:

Явка на выборы заметно различается в разных областях, причем в каждой области она очень однородна. На приведенном ниже графике столбиком показана средняя явка, а полосами погрешности – границы от минимальной по округам до максимальной:


2. Испорченные бюллетени
Сумма голосов, поданных за кандидатов, не совпадала с общим количеством проголосовавших и была немного меньше. Я считал это за испорченные бюллетени, так как в официальной статистике такого не было.
Распределение по доле испорченных бюллетеней среди принявших участие в голосовании было следующее:

Везде доля таких бюллетеней была не менее полупроцента и разбросы по этому количеству были очень велики. Также была получена сильная связь доли испорченных бюллетеней с долей принявших участие в голосовании:

На этом графике по оси X – доля явки на голосование, по оси Y – доля испорченных среди принявших участие в голосовании. Следовательно, чем выше была явка, тем меньше портили бюллетени.

3. Распределение голосов
Таблица со статистическими результатами анализа по округам выглядит так:

Замечу, что среднее по округам не должно точно совпадать с официальными совокупными данными (так, за Порошенко официально около 55%, а здесь – 52%) по двум причинам:
А) Округа разной численности
Б) На них разная явка, и там, где больше протестные настроения, и явка ниже, и доля поданных голосов за основного кандидата тоже ниже.
Однако есть некоторые особенности в полученных результатах, которые мне резко не нравятся. Это – степень вариативности голосования за основных претендентов.
По идее чем больше набирает кандидат, там меньше должна быть вариация поданных за него голосов в разных округах. Оценивать степень вариативности можно по коэффициенту вариации (отношению среднеквадратичного отклонения к среднему), коэффициенту асимметрии (ноль, если распределение симметрично, положительно, если встречаются выбросы в большую сторону, и отрицательно, если в меньшую) и коэффициенту эксцесса (степень выраженности выбросов). Однако для кандидатов с достаточно большими количествами голосов эта тенденция достаточно слабая. Здесь же за Порошенко везде доля проголосовавших почти одинаковая.
Особенно странно это, если сравнивать вариабельность доли голосов, отданных за основных кандидатов, с вариацией явки. Насколько помню, явка всегда более вариабельна, так как нелояльность региона прежде всего отражается в неучастии на выборах, здесь же коэффициент вариации явки вдвое больше, чем отданных за Порошенко голосов.
Даже если отбросить округа, в которых явка была менее 25%, то коэффициент вариации явки составит 15%, а коэффициент вариации голосов за Порошенко – 10%.
Далее гистограммы распределения поданных голосов за 3 первых претендентов. По оси X – доля отданных голосов среди принявших участие в голосовании, по оси Y – число округов.






4. Связь голосования и явки
Сильным аргументов в пользу того, что на думских выборах в России были вбросы, явилась неожиданная регрессионная связь явки и результатов голосования. Если Y – число голосов, подданных за данного претендента, а X – количество пришедших на голосование на данный участок, то ожидаемая связь между ними имеет вид
Y=MX
Где M – доля голосов, отданных за этого кандидата в целом. Если же имеются вбросы разной интенсивности в пользу данного кандидата, то связь становится вида
Y=a+bX
Где a меньше 0 и b больше M.
Соответственно для других кандидатов, которых обидели и голоса которых украли, связь Y=a+bX будет с a больше 0 и b меньше М.
Так что я не буду ничего далее объяснять и комментировать, а просто приведу полученные коэффициенты для регрессионного анализа по кандидатам:


То есть те соотношения, которые в думских выборах были приняты как доказательства вбросов в пользу ЕР, на выборах на Украине тоже наблюдались в пользу Порошенко, Тимошенко, Ляшко и Тягнибока.
А вот Рабиновича, как и многих других, обидели

Переход по щелчкуВ верхнее тематическое оглавление
 Переход по щелчку Тематическое оглавление (Политика)
Buy for 60 tokens
Buy promo for minimal price.

Comments

( 38 комментариев — Порадовать комментарием )
pvn123
1 июн, 2014 13:16 (UTC)
Спасибо.
Отличный анализ. Вполне объективный, без пропаганды.
uborshizzza
1 июн, 2014 13:24 (UTC)
Спасибо.
Пропаганда будет отдельным постом, чтобы не смешивать
(без темы) - pvn123 - 1 июн, 2014 14:04 (UTC) - Развернуть
(без темы) - serega133 - 1 июн, 2014 14:16 (UTC) - Развернуть
(без темы) - zepete - 1 июн, 2014 16:23 (UTC) - Развернуть
(без темы) - pvn123 - 1 июн, 2014 16:37 (UTC) - Развернуть
(без темы) - assargaddon - 4 июн, 2014 04:53 (UTC) - Развернуть
lev_davidovich
1 июн, 2014 15:41 (UTC)
Круто замесил ! Внушаить. Только вот если Поросенко устраивает все стороны - быть ему Перзидентом ! Правда от рукопожатий многие будут уклоняться.
uniala
2 июн, 2014 15:28 (UTC)
Если так подумать... То связь между явкой и числом проголосовавших за основного кандидата можно объяснить и психологическими причинами. Скажем, поделим избирателей на тех, кто голосует по убеждениям и тех, кто голосует случайным образом. Среди избирателей, голосующих по убеждениям, можно выделить ядро фанатиков, которые целенаправленно идут на участок, проголосовать за своего кандидата, у них явка 100% и хвост из сочувствующих/колеблющихся, которые могут прийти и могут не прийти, у них явка ниже. Среди тех, кто голосует случайным образом, явка так же ниже (скажем, они и являются голосовать под действием случайного фактора). И получается, что если доля голосующих по убеждениям на участке высока, то и явка выше и наиболее сильно этот эффект проявится в отношении основного кандидата, поскольку для него размеры "ядра" со 100% явкой будут в большей степени влиять на общую картину явки.
assargaddon
4 июн, 2014 07:29 (UTC)
Связь между явкой и числом проголсовавших за основного кандидата в тексте статьи не показана. Возможно её нет, возможно она есть - из текста статьи не следует ни то ни другое.
uniala
2 июн, 2014 15:42 (UTC)
В общем, наверное, вбросы могли иметь место, но я бы рассматривала М=0,52, как иллюстрацию феномена массовой истерии, т.е. когда локально доля приверженцев какого-либо кандидата превышает пороговый уровень, то это приводит к некритическому мышлению. Грубо говоря, если из 10-ти знакомых один Вася с пеной у рта рассказывает, какой Х спаситель, то человек информацию фильтрует, а когда из 10 знакомых уже 7 рассказывают, какой Х спаситель, то субъект "заражается" этой идеей и транслирует ее дальше с той же пеной у рта, соответственно градус некритичной народной любви начинает расти совместно с повышением полититической активности и процесс приобретает направленный неслучайный характер.
Собственно, я все пытаюсь продолжить мысль о том, что размеры ядра стопудово уверенных, что Х спаситель, и дающих 100% явку могут быть связаны с общей долей подавших голоса за Х нелинейно. Если, скажем, доля приверженцев Х локально превышает 80%, то это ядро очень большое и все, от мала до велика считают своим священным долгом в едином порыве поддержать и пр. Если доля приверженцев Х составляет 50%, то ядро маленькое и средняя явка низкая.

Edited at 2014-06-02 15:53 (UTC)
kymyl
3 июн, 2014 19:09 (UTC)
Родственница из центральной Украины прямо говорила, что кроме Порошенко среди кандидатов никого нет. Мои осторожные намеки, что Порошенко за год увеличил капитал с 1 до 1.6 млрд долларов, будучи при этом одним из руководителей Нацбанка и министром правительства, натолкнулись на абсолютное непонимание.
Не зря Порошенко обещал все продать, кроме пятого канала
assargaddon
4 июн, 2014 04:50 (UTC)
К сожалению, на сайте ЦИК Украины были представлены данные не по избирательным участкам, а по округам

Это не соответствует действительности.
На сайте ЦИК Украины данные представлены по избирательным участкам.
Я лично смотрел данные отдельно по 4 избирательным участкам в моём родном посёлке.

Я считал это за испорченные бюллетени, так как в официальной статистике такого не было.

Это не соответствует действительности.
На сайте ЦИК есть данные об испорченных бюллетенях - и по всей украине, и отдельно по каждому участку.

Edited at 2014-06-04 05:01 (UTC)
(без темы) - assargaddon - 4 июн, 2014 06:36 (UTC) - Развернуть
(без темы) - uborshizzza - 4 июн, 2014 05:45 (UTC) - Развернуть
(без темы) - assargaddon - 4 июн, 2014 06:39 (UTC) - Развернуть
(без темы) - uborshizzza - 4 июн, 2014 06:46 (UTC) - Развернуть
(без темы) - assargaddon - 4 июн, 2014 07:05 (UTC) - Развернуть
assargaddon
4 июн, 2014 04:50 (UTC)
На Гаусса здесь так же непохоже

Я вот смотрю - и вижу чистый гаусс, плюс много участков, на которых нулевая явка. Вроде бы так и должно быть, разве нет? Это хорошо согласуется с провалами явки в Донецкой и Луганской областях на диаграмме ниже.

P.S. В чём измеряется frequency? Это абсолютное количество?

Edited at 2014-06-04 04:55 (UTC)
uborshizzza
4 июн, 2014 05:42 (UTC)
"В чём измеряется frequency? Это абсолютное количество?" - да

"Пилу Чурова" по Украине получить невозможно просто из-за отсутствия детализированных данных. Но с явкой есть другая очень неприятная особенность - малые разбросы. В каждой из областей по всем избирательным округам данные по явке были очень близки друг к другу, тогда как в областях, в том числе соседних, отличались значительно больше. Гипотеза о том, что внутри области все люди очень похожи друг на друга, а в разных областях живут разные, кажется маловероятной
(без темы) - assargaddon - 4 июн, 2014 06:50 (UTC) - Развернуть
assargaddon
4 июн, 2014 05:45 (UTC)
Сильным аргументов в пользу того, что на думских выборах в России были вбросы, явилась неожиданная регрессионная связь явки и результатов голосования.
...
То есть те соотношения, которые в думских выборах были приняты как доказательства вбросов в пользу ЕР, на выборах на Украине тоже наблюдались в пользу Порошенко, Тимошенко, Ляшко и Тягнибока.


В статье АБСОЛЮТНО не показано наличие регресионной связи между явкой и итогами. Не показано ВООБЩЕ. Для этого надо было бы посчитать корелляцию. Она не подсчитана ВООБЩЕ.

Беря два каких угодно несвязанных процесса, вы всегда получите какие-нибудь регресионные коэфициенты. Их величина не доказывает ничего, пока не показано, что между ними есть корелляция. Это же азы.
uborshizzza
4 июн, 2014 06:44 (UTC)
Как это не подсчитана регрессионная связь, если даже таблица с регрессионными коэффициентами приведена?

То, что регрессионный коэффициент больше средней доли, и означает, что имеется положительная корреляция между явкой и долей за данного кандидата. Давать и те, и другие данные в исходных числах - перетежелять статью для тех, кто математику не знает, тогда как математикам и так все понятно.

Вас интересуют величины корреляций? Никаких проблем, возьмите данные с сайта ЦИК и посчитайте.
(без темы) - assargaddon - 4 июн, 2014 07:01 (UTC) - Развернуть
(без темы) - uborshizzza - 4 июн, 2014 07:17 (UTC) - Развернуть
(без темы) - assargaddon - 4 июн, 2014 07:27 (UTC) - Развернуть
assargaddon
4 июн, 2014 06:33 (UTC)
В общем, если кому-то настолько интересно увидеть достоверный анализ такого типа - напишите мне. Я могу и даже хочу его сделать, но для этого надо слить воедино около 200 таблиц (по штуке на окружную комиссию), чтобы получить единую таблицу с результатами по всем участкам. В одиночку это слишком долго и трудозатратно.

uborshizzza, вы как насчёт скооперироваться?
uborshizzza
4 июн, 2014 18:17 (UTC)
Я пока не совсем определился с планами, но если будет что-то, я скину исходники
pansar
5 июн, 2014 10:20 (UTC)
Спасибо, интересно. Было бы здОрово, если бы вы выложили исходники. Первая гистограмма по Украине -- там настолько явный провал в центре из-за выбраного bin size, график плотности (aka kernel density) был бы полезнее. Также было бы хорошо посмотреть на p-values или стандартное отклонение для коэффицентов в регрессионной таблице -- без этого ценность таблицы довольно сомнительна.
uborshizzza
9 июн, 2014 15:39 (UTC)
Исходники выложил, причем на уровне избирательных участков. Посмотрите мои следующие посты по этому тагу, там есть ссылка
(без темы) - pansar - 11 июн, 2014 10:07 (UTC) - Развернуть
romanik
9 июн, 2014 15:05 (UTC)
"К сожалению, на сайте ЦИК Украины были представлены данные не по избирательным участкам, а по округам"


Горе-исследователь, который не может найти данных по УИКам на сайте ЦИКа Украины... И зачем дальше читать. Читайте нормальных людей. http://abuzin.livejournal.com/141176.html
uborshizzza
9 июн, 2014 15:38 (UTC)
А еще можно посмотреть мои посты за следующие дни, тоже отмеченные тагом "Выборы" - там анализ по найденным данным по избирательным участкам
(без темы) - uborshizzza - 9 июн, 2014 17:39 (UTC) - Развернуть
(без темы) - romanik - 10 июн, 2014 05:46 (UTC) - Развернуть
(без темы) - uborshizzza - 10 июн, 2014 07:44 (UTC) - Развернуть
( 38 комментариев — Порадовать комментарием )

Latest Month

Ноябрь 2019
Вс Пн Вт Ср Чт Пт Сб
     12
3456789
10111213141516
17181920212223
24252627282930

Метки

Разработано LiveJournal.com
Designed by Tiffany Chow