Картографирование статистики: база данных муниципальных образований 📕Росстат ежегодно собирает и публикует тысячи показателей государственной статистики. Один из самых важных и популярных наборов –
база данных показателей муниципальных образований (БД ПМО)
Эту статистику очень интересно анализировать и на ее основе можно выявлять разные пространственные закономерности
✨Для ассоциации данных с административными ячейками их нужно сопоставить с
границами муниципалитетов, используя единый идентификатор. Таким ключом может служить уникальный код —
ОКТМО (Общероссийский классификатор территорий муниципальных образований)
📎Кажется, это задача довольно простая, и мы с легкостью можем получить набор пространственных данных. Но, к сожалению, это не совсем так, и при работе с государственной статистикой важно учитывать несколько моментов:
1.
Официальные данные Росстата не представлены в машиночитаемом и удобном для работы формате – будто предназначены исключительно для тех, кто скачивает xlsx таблички и просматривает их вручную
☹️Эту проблему, впрочем, во многом уже решили за нас: можно найти предобработанные данные, например, от
«Инфраструктуры научно-исследовательских данных» или
«Если быть точным»*️⃣Однако есть и другая, более насущная проблема!
2.
Муниципалитеты – это непостоянные единицы. Их границы, названия и типы меняются, что затрудняет сбор данных, построение временных рядов и значительно усложняет анализ
По этой теме есть
отличное исследование от СберИндекса, где рассмотрены особенности подобных преобразований и как это влияет на работу аналитиков. Там же
можно скачать границы муниципалитетов с учетом всех изменений, начиная с 2018 года
😍*️⃣*️⃣*️⃣В общем, чтобы упростить себе работу с БД ПМО, мы можем использовать один из вариантов (
первый или
второй) предобработанных данных и
границы муниципалитетов, учитывающие преобразования. Главное, не забывать ссылаться на тех, кто подготовил это для нас
💙А вот чудесная
статья об опыте работы с исходными данными
🙃#geo_data🌎🕊️ GIS_AND_PEACE