Вторая инфографика еще красивее и новее (до 2016 года). WP провел похожий анализ, но разделил слова по темам и посчитал относительную частоту. И там сразу видны логичные вещи:
1)
названия стран произносят практически только когда с ними воюют;
2) про
демократию говорят, когда есть очевидно недемократичные враги;
3) про
работу и
нефть вспоминают чаще, если их нет.
Еще интересно, что почему-то Рузвельт называл Советский Союз Россией
🤔 Все до и после него редко так говорили.
Конечно, серьезных выводов из таких датасетов делать не стоит. Я бы строила гипотезы и сопоставляла с текстовыми данными исполнительных указов, международных договоров, биллей и др. данных.
Но для анализа дискурса это ценный контент.