Hodgkin Sep 11 2023 at 11:11

Фальсификации в выборах муниципальных депутатов 2022 в Москве

13 min

6.5K

Аннотация

Наши результаты показывают, что подсчет результатов очного голосования на московских выборах муниципальных депутатов в 2022-м году был честным или практически честным. Подсчет же результатов дистанционного электронного голосования (ДЭГ) проходил с нарушениями — это видно, например, по аномалиям в том, как распределены голоса за кандидатов во времени. С четырех часов в пятницу до ночи с субботы на воскресенье голоса фальсифицировались в пользу некоторых кандидатов, большинство из которых принадлежит “системной оппозиции”: КПРФ, ЛДПР, СРЗП и партии “Новые люди”.

Мы оцениваем количество депутатов, за которых были вбросы, минимум в 115 человек. За этих 115 человек согласно нашей модели было вброшено около 95 тысяч голосов.

Очные выборы мундепов в Москве в первом приближении честные (или нам не удалось поймать фальсификации)

I. Явка и результат административных кандидатов не коррелируют

В прошлом на российских выборах в некоторых регионах (в т. ч. в Москве) на некоторых УИКах вбрасывали бюллетени, за счет этого росла явка и рос результат партии или кандидата, за которых вбрасывали бюллетени.

(УИК — участковая избирательная комиссия; метонимически обозначает избирательный участок).

За счет этого возникали:

Корреляция явки и “провластного” результата;
Разделение всех УИКов на два кластера: с высокими явкой и провластным результатом и с явкой и провластным результатом пониже.

Как это выглядит, можно увидеть, например, здесь.

В этот раз ничего такого на очных участках не видно или почти не видно: разделения УИКов на два кластера нет; есть участки с очень высокой явкой и высоким результатом Единой России и Моего района, но они единичны, и это вполне может быть вызвано естественными причинами (рис. 1).

II. У явки нет пиков на круглых числах

Когда на участках полностью рисуют явку и результат (придумывая их), в явке и результатах чаще, чем по случайности, встречаются целые (и особенно круглые) числа процентов. Этот феномен (т. н. “пила Чурова”) был заметен, например, на референдуме о поправках в Конституцию.

Мы проверили, не является ли количество УИКов с целой явкой на этих этих выборах аномально высоким. Оказалось, что нет.

Для этого мы использовали методику из статьи Kobak, Shpilkin, Pshenichnikov, 2016.

Для каждого УИКа мы моделируем явку на нем, используя биномиальное распределение с n = кол-во зарегистрированных на этом участке избирателей и p = заявленная явка. Иными словами, модель заключается в том, что каждый избиратель приходит на избирательный участок с вероятностью, равной итоговой явке. Если для какого-то УИКа была нарисована явка, она останется примерно такой же и в модели, но модель не будет предпочитать целые числа нецелым.

Мы моделируем эту ситуацию достаточно больше количество раз (в нашем случае — 10 000) и создаем доверительный интервал. В случае “пилы Чурова” количество УИКов с круглой или целой явкой должно выходить за пределы доверительного интервала.

Но ничего такого мы не наблюдаем (рис. 2).

В основном кластере УИКов за границы доверительного интервала выходит только одна точка (на 12%), что даже меньше ожидаемых 5% (15 точек на отрезке 0% – 30%).

Если считать “целой” явку, равную целому числу ± 0,05%, то количество УИКов с “целой” явкой не отличается статистически значимо от ожидаемого (р = 0,06).

Мы проверили отсутствие аномалий и для других значений допустимого отклонения от целого числа процентов, внутри которого мы считаем явку “целой”. Для этого для каждого допустимого отклонения мы посчитали количество УИКов с “целой” явкой и z-score для него — число стандартных отклонений от среднего количества таких УИКов по всем моделям. Для z-score мы посчитали 95%-й доверительный интервал. Реальное количество УИКов с целым числом процентов ни разу не выходит за пределы доверительного интервала (рис. 3).

Поскольку на участках, на которых рисуют явку, скорее всего, рисуют и результаты, можно ожидать, что и у Единой России/другой провластной партии будут пики результатов на целых и круглых числах. Но и этого мы не видим (рис. 4).

Результаты ДЭГа странным образом отличаются от результатов очного голосования

I. У КПРФ, ЛДПР, СРЗП и Новых людей есть много кандидатов со странно высокими результатами по ДЭГу

Мы проверили, есть ли для ДЭГа корреляция между явкой в округе и результатом какой-либо партии в этом округе. “Глазами” ее не видно (коэффициенты корреляции мы не считали) (рис. 5).

Зато у нескольких партий “системной оппозиции” (КПРФ, ЛДПР, СРЗП, Новые люди) есть группы кандидатов на УИКах с типичной явкой, но с заметно большим результатом, чем в основном кластере (рис. 6).

Само по себе это не очень странно: некоторые кандидаты просто могут быть сильно популярнее среднего по их партии, но на таких же диаграммах для результатов очного голосования таких выделяющихся из основного кластера групп кандидатов не видно.

II. Результат некоторых кандидатов по ДЭГу в разы больше, чем по очному голосованию

Теперь рассмотрим результаты отдельных кандидатов (рис. 7). Результат кандидата — это доля бюллетеней, в которых за него была поставлена галочка.

Во-первых, здесь видно, что у большого количества партий средний кандидат получает по ДЭГу результат ниже, чем по очному голосованию. Видимо, это связано с тем, что в среднем в бюллетене ДЭГа меньше галочек: 2,7 против 3,3 в очном голосовании.

Во-вторых, у некоторых партий (СРЗП, ЛДПР, Новые люди, КПРФ, Коммунисты России) есть кандидаты, результат которых по ДЭГу в разы больше, чем по очному голосованию (рис. 8).

Самый яркий пример такого кандидата — Сергей Александрович Финик, баллотировавшийся во втором избирательном округе района Косино-Ухтомский, набравший по очному голосованию 13 голосов (0,6%), а по ДЭГу — 2184 голоса (33%), но занявший в итоге шестое место и не прошедший в совет депутатов.

III. Кандидаты с большим отношением результатов по ДЭГу и очному голосованию занимали по очному голосованию не первые места.

Рангом кандидата здесь и далее мы называем место, которое он занял по результатам голосования.

Можно видеть, что у представителей “системной оппозиции” встречаются высокие, и иногда очень высокие, отношения результатов по ДЭГу к результатам по очному голосованию (рис. 9), при этом они встречаются у не самых популярных (очно) кандидатов.

IV. Из-за ДЭГа эти кандидаты перемещаются на места выше, некоторые получают мандат

Кандидаты с высоким отношением результатов по ДЭГу и по очному голосованию перемещаются на более высокие (по сравнению с очным голосованием) ранги по итоговым результатам (рис. 9 и 10). Особенно хорошо это видно на примере ЛДПР — там на первых местах есть только такие кандидаты.

В результатах ДЭГ самих по себе есть аномалии, указывающие на фальсификации

I. Аномалия в пятницу

Приблизительно в четыре часа дня в пятницу около 20 минут в ДЭГ вообще не поступали голоса; после интенсивность поступления голосов за некоторых кандидатов резко выросла (рис. 11, см. на скачок в количестве голосов в минуту у прошедших кандидатов от “системной оппозиции”).

Рис. 11. Оранжевым отмечены кандидаты, получившие мандат

Например, такое произошло с единственным прошедшим кандидатом от Коммунистов России, Екатериной Сергеевной Бакашевой, баллотировавшейся в третьем избирательном округе района Южное Тушино.

Для каждого кандидата мы рассчитали разницу в среднем количестве голосов в минуту за 2,5 часа до и после сбоя в пятницу(рис. 12).

Рис. 12. Красным отмечены значения, выделившиеся в отдельный кластер

Видно, что для большей части кандидатов эта разница близка к нулю или отрицательна, т. к. общая интенсивность голосования падала в это время, но есть “хвост” из тех, у которого эта разница положительна, т. е. за них голосовали после сбоя интенсивнее, чем до.

Просто глядя на гистограмму, хочется выделить в “хвост” всех кандидатов с разницей больше примерно 0,1, но мы решили разделить эти данные на два кластера алгоритмом k-means. В отдельный кластер выделились значения больше примерно 0,37, и мы оставили разделение таким.

В этот кластер вошло 108 кандидатов. Из них 29 от КПРФ, 27 от Новых людей, 23 от СРЗП, 22 от ЛДПР, 3 от Единой России, 2 от Моего района, 1 от Коммунистов России и 1 самовыдвиженец.

Затем мы нормировали количество голосов, полученное отдельными кандидатами в каждую минуту, на общую интенсивность голосования в эту минуту. Для каждого кандидата мы взяли получившиеся значения за 2 часа до сбоя и 2 часа после (отступив на 20 минут, чтобы не захватывать голоса, которые приходили во время сбоя) и провели на них тест Манна-Уитни, сделав поправку Холма на множественные сравнения.

Для критического значения р = 0,05 можно отвергнуть гипотезу о том, что результаты до и после сбоя приходят из одного распределения, для 115 кандидатов, 103 из которых входят в тех 108, которых мы выделили кластеризацией.

Мы считаем более надежным этот статистический тест и далее работаем с кандидатами, которых он выделил.

Среди этих 115 человек снова всего три человека из Единой России и два — из Моего района, и там все еще больше всего “системной оппозиции”: 34 кандидата от КПРФ, 27 — от Новых людей, 23 — от ЛДПР из 23 от СРЗП, а еще два самовыдвиженца и одна кандидатка от Коммунистов России.

Мы выделили полученных кандидатов на графике (рис. 13). Действительно, у них виден “подскок” приблизительно в 16:00 в пятницу.

Рис. 13. Красным отмечены кандидаты, за которых мы нашли вбросы тестом Манна-Уитни

II. После аномалии в пятницу ДЭГ фальсифицировали до ночи с субботы на воскресенье

Чтобы понять, как долго продолжались фальсификации в пользу этих кандидатов, мы повторили вот этот график. Предположительно, за кандидатов от Умного голосования вбрасывать голоса не будут, и их результат можно использовать как контроль.

Мы построили график отношения суммарного количества голосов за всех кандидатов, за которых мы нашли вбросы, к суммарному количеству голосов за всех кандидатов, выдвинутых УмГ, от времени (рис. 14).

Видно, что это отношение резко подскакивает как раз после сбоя в пятницу, но возвращается к таким же значениям, как до сбоя, ночью с субботу на воскресенье. Мы считаем, что программа, которая вбрасывала или перебрасывала голоса, работала как раз этот промежуток времени.

То, что нет корреляции явки на ДЭГ с результатами каких-нибудь партий (см. выше), свидетельствует в пользу того, что голоса не добрасывались, а перебрасывались между кандидатами.

Чтобы это проверить, мы построили график количества поступивших в ДЭГ голосов от времени (рис. 15).

Видно, что после сбоя в пятницу есть резкий “подскок” числа голосов (видимо, это пришли голоса, которые не проходили в сбой), но после интенсивность голосования возвращается к уровню до сбоя. Это тоже свидетельствует в пользу гипотезы о перебросе голосов, но мы не можем быть в этом уверенными, поскольку нам неизвестен размер эффекта, который мы ищем. Далее мы приводим нашу оценки количества вброшенных голосов за 115 ранее выделенных кандидатов, это около 95 000 тысяч галочек. Если вбросы проходили равномерно вторую половину пятницы и субботу, исключая ночь, в минуту вбрасывали около 65 голосов — эффект, который невозможно обнаружить на нашем масштабе.

III. Оценка количества сфальсифицированных голосов.

Мы смоделировали для каждого кандидата его результат при честном подсчете голосов. Для каждой партии мы рассчитали среднее количество голосов, которое кандидат от нее получает в каждую минуту. Для такого “среднего” кандидата мы рассчитали количество голосов, которое он получил за три дня (M₃), и количество голосов, которое он получил в воскресенье с четырех утра (M_воскр).

Далее мы делаем два допущения:

В воскресенье подсчет голосов был честным;

При честном голосовании у двух кандидатов от одной партии на протяжении всего голосования сохраняется отношение результатов.

Пункт 2, очевидно, является только приближением.

Для каждого кандидата мы тоже считаем количества голосов, которое он получил по ДЭГу за все три дня (C₃) и за воскресенье(C_воскр).

После для каждого кандидата мы рассчитываем ожидаемое количество голосов за него по формуле C_воскр × M₃ / M_воскр.

Затем для каждого кандидата считаем разницу между реально полученным количеством голосов и смоделированным. Для кандидатов, за которых были вбросы, эта разница будет приблизительно отражать количество вброшенных бюллетеней (и будет, видимо, меньше него, поскольку вброшенные бюллетени повышают среднее количество бюллетеней за кандидата от этой партии за три дня).

Для 115 человек, которых мы выделили раньше, сумма смоделированных выброшенных голосов равняется 94 590 (около 2% всех галочек в ДЭГ).

Если наша модель адекватно отражает реальность, это оценка снизу. Во-первых, тестом Манна-Уитни мы отобрали только часть кандидатов, за которых были вбросы. Во-вторых, если кандидаты, за которых вбрасывали бюллетени, составляют значительную часть от всех кандидатов партии, это снижает оценку вброшенных бюллетеней; если в партии за всех бюллетени вбрасывали пропорционально, наша модель этого не заметит.

Далее мы посмотрели, какую долю бюллетеней для каждого кандидата составляют “вброшенные”, т.е. на какую долю смоделированный результат отличается от получившегося (рис. 16).

Можно видеть, что для ЛДПР, СРЗП и Новых людей распределение выглядит бимодальным. Мы предполагаем, что правый кластер — как раз те, за кого вбрасывали бюллетени.

IV. Аномалия в воскресенье

В воскресенье в 13:41–13:42 кандидаты получали сильно больше голосов, чем в соседние минуты (рис. 15). Суммарно в эту минуту было получено 18 919 голосов, тогда как максимум за 2 часа до и 2 часа после — 1334.

В нашей модели мы считаем, что для каждого кандидата количество голосов в минуту приходит из распределения Пуассона. Это распределение описывает ситуацию, в которой случайные независимые события (в данном случае голоса) происходят с постоянной средней интенсивностью (мы решили, что за 4 часа она не поменяется настолько, чтобы эта модель перестала работать): тогда количество каких-то интервалов времени (в нашем случае минут), в которые произошло 0, 1, 2 и т. д. событий оказывается распределено по Пуассону.

Для каждого кандидата мы получили параметр этого распределения, усреднив количество голосов за него за 2 часа до и 2 часа после аномальной минуты, исключая ее саму. Затем мы посчитали вероятность, что в эту минуту кандидат получит столько же или больше голосов, чем он получил на самом деле, если количество голосов в эту минуту подчиняется тому же распределению, что в остальные. Мы сделали поправку Холма и получили список кандидатов для критического уровня значимости 0,05, для которых мы принимаем гипотезу о том, что количество голосов в эту минуту аномально велико. В нем оказалось 1499 человек.

В эти 1499 человек входят 107 из 115 человек из тех, у кого было аномально много голосов в пятницу после сбоя.

В этом списке оказалось 825 кандидатов от ЕР, 165 от КПРФ, 128 самовыдвиженцев, 105 от Новых людей, 84 от СРЗП, 74 от Моего района, 61 от ЛДПР, 35 от Коммунистов России, 10 от Яблока, 9 от Зеленых, 2 от РПСС и 1 от Партии возрождения России.

Кандидаты от разных партий входят в этот список с разной вероятностью (тест χ², р = 6 × 10⁻²⁹⁸). В этом списке непропорционально много кандидатов от Единой России и от Моего района, от остальных партий непропорционально мало.

Так как голос не за конкретного, а за любого кандидата — тоже Пуассоновская величина, мы можем использовать тот же способ, чтобы оценить общее количество вброшенных голосов в эту минуту. С вероятностью 95% “честных” голосов в случайную минуту днем в воскресенье будет 920 или меньше, а значит мы оцениваем количество вброшенных в 18 тысяч.

V. Аномалии в типах бюллетеней

ДЭГ сохраняет порядок, в котором избиратель отмечает кандидатов.

На рис. 17 мы визуализируем бюллетени в округе, где избирался Сергей Александрович Финик, получивший в 60 раз более высокий результат по ДЭГ, чем по очному голосованию.

Рис. 17. Каждый бюллетень — очень тонкий столбец на этом рисунке, в котором цветом обозначены партии кандидатов, которые в нем отмечены. Бюллетени с одинаково отмеченными партиями собраны вместе, поэтому ширина одинаково раскрашенной колонки отражает количество бюллетеней такого типа. Например, самая левая колонка на рисунке — это бюллетени с единственным голосом за кандидата от Единой России, а самая правая — бюллетени с пятью голосами за самовыдвиженцев

Можно видеть, что большая часть голосов за СРЗП (партия Финика) получена из бюллетеней, в которых идут два голоса за Единую Россию, голос за СРЗП и снова два голоса за ЕР.

Для каждого избирательного округа мы решили найти такие вот странные бюллетени, где только одна галочка поставлена не за Единую Россию или Мой район, и бюллетеней такого типа много.

Для этого для каждого избирательного округа для каждого типа бюллетеней (тип бюллетеней = совокупность кандидатов в определенном порядке) мы рассчитали количество бюллетеней.

Полученные количества мы кластеризовали алгоритмом k-means. Для каждого округа выделили два кластера: типы бюллетеней с большим количеством бюллетеней (таких обычно немного), и типы бюллетеней с небольшим количеством бюллетеней (таких больше).

Из всех типов бюллетеней, попавших в первый кластер в своем округе, мы выделили те, в которых только один кандидат был не из Единой России или Моего района.

Мы нашли 65 таких “странных” кандидатов: 18 от ЛДПР, 17 от КПРФ, 16 от Новых людей, 12 от СРЗП, 1 от Коммунистов России и 1 самовыдвиженец. 41 кандидат из этих 65 входит в список из 115 человек, который мы выделили тестом Манна-Уитни.

У этих 115 людей непропорционально часто встречаются аномалии в типах бюллетеней (тест χ², р = 5 × 10⁻⁵⁶). Если бы эти события были независимы, мы ожидали бы увидеть менее двух людей в пересечении.

Мы думаем, что то, что не все кандидаты с аномалиями в типах бюллетеней имеют p-value менее критического в тесте Манна-Уитни, связано с низкой мощностью теста.

Наши выводы и гипотезы

I. Количество сфальсифицированных голосов

Мы оцениваем (снизу) количество сфальсифицированных голосов за период с 16 часов в пятницу до 4 часов воскресенья в 94 590.

Количество сфальсифицированных голосов во время аномалии в воскресенье мы оцениваем в 18 тысяч.

II. Природа фальсификаций

Мы хотим различить три способа фальсифицировать результаты выборов:

Вброс целых бюллетеней с желаемым содержанием;
Доставление в бюллетени галочек за нужных кандидатов (под видом переголосования);
Редактирование бюллетеней с переставлением галочек (под видом переголосования).

Преобладание бюллетеней с конкретным порядком кандидатов — свидетельство в пользу первой или третьей гипотезы. Аномалия в воскресенье свидетельствует в пользу первой и второй, но возможна и при истинности третьей гипотезы, если при редактировании бюллетеней галочек становится в среднем больше. Отсутствие корреляции явки с результатами кандидатов от “системной оппозиции” и отсутствие видимого изменения в интенсивности голосования свидетельствуют против первой и второй гипотез, но слабо, поскольку и ожидаемый эффект при таком количестве вброшенных голосов довольно слабый.

На выборах 2021-го года московский ДЭГ в определенный промежуток времени превращал (под предлогом переголосования) бюллетени за оппозицию в бюллетени за провластных кандидатов (раз, два).

Логично предположить, что способ фальсификаций не сильно изменился, поэтому мы склоняемся к гипотезе 3.

III. Смысл фальсификаций

Большая часть найденных нами фальсификаций была не в пользу Единой России или Моего района. Этому можно предложить несколько объяснений:

Мы не смогли засечь нашими методами фальсификации в пользу провластных кандидатов. Возможно, они были сделаны другими методами, или же методы, используемые для фальсификаций, порождают аномалии только у других партий;
Фальсификации за “системную оппозицию” нужны для создания иллюзии плюрализма;
ДЭГ фальсифицировали за чем-то выгодных кандидатов;
Фальсификаторы поддерживают этих кандидатов по собственным политическим соображениям;
Фальсификации за “системную оппозицию” — результат осечки программ, которые должны были определить, за кого фальсифицировать. В таком случае, видимо, верен и пункт 1 — наверняка такая программа не ошибается чаще, чем ошибается.
Фальсификации за непопулярных кандидатов от “системной оппозиции” нужны, чтобы отнять мандат у “невыгодных” популярных кандидатов, не вбрасывая при этом голоса за Единую Россию. Возможно, вбросы за Единую Россию в прошлом вызывали слишком большой резонанс, и в 2022-м году решили обойтись без них.

Все эти гипотезы довольно сложные и неправдоподобные, и мы, наверное, упускаем какую-то модель, которая объясняла бы все фальсификации.

Возможно также, что в каждом округе причина фальсификаций была своя. Впрочем, это странно, поскольку фальсификации во всех округах шли по одному паттерну.

IV. Чему мы пока не можем найти объяснение

Изменение среднего количества галочек в бюллетенях ДЭГа приблизительно в 13:35 субботы.

Среднее количество галочек в бюллетенях ДЭГа практически не изменялось в пятницу, особенно в первую половину дня, видимо, поскольку бюллетеней приходило очень много.

Оно колеблется по утрам и вечерам, а еще довольно резко падает в субботу приблизительно в половину второго (рис. 18).

Мы не делали статистические тесты, проверяющие значимость этого падения, и, возможно, оно вызвано естественными причинами.

Tags:

Hubs: