Не нужно иметь кандидатскую степень, чтобы догадаться, что на некоторые вопросы респонденты могут отвечать не совсем честно. Спрашивая людей о том, сколько они зарабатывают, за кого они голосовали, предлагали ли им деньги в обмен на голоса, не стоит ожидать от них искренности, поскольку они по понятным причинам опасаются за свою безопасность.
Вариантов правильно измерить "чувствительные" вопросы много, но сегодня я хочу рассказать вам о том, который удивил меня больше всего. Речь идёт о статье Д. Корстенджа
Clientelism in Competitive and Uncompetitive Elections (2018), где автору было необходимо измерить, какое количество избирателей Ливана сталкивались с предложениями купить их голоса.
Для этого он прибегнул к методам причинно-следственного вывода и разделил свою выборку на контрольную и экспериментальную группу. Обеим группам были представлены пункты, которые потенциально могли повлиять на их желание проголосовать (вы видели агитацию, вы обсуждали кандидатов с друзьями и тд) и в том числе пункт о покупке голосов. Вот только одной группе предложили отметить конкретные пункты, которые повлияли на них, а другой – всего лишь назвать их количество.
Когда респондент не говорит о попытках подкупа напрямую, а говорит только общее число того, что с ним происходило, создаётся иллюзорное ощущение анонимности. Однако через результаты контрольной группы можно восстановить через разность именно число конкретного ответа про подкуп. Разница оказалась колоссальной: 26% респондентов указали этот пункт напрямую, но во восстановленным данным из экспериментального дизайна результат увеличился до (!) 55%.
Этот пример хорошо показывает, почему нельзя без предварительной подготовки напрямую интерпретировать результаты никаких опросов. Эти данные всегда искажены как формулировками, так и внешними условиями, и, чтобы грамотно объяснить цифры и увидеть в них какие-то закономерности, всегда нужна соответствующая линза.
#PS_methods