Облака слов и корпоративные чаты
Облако слов
☁️ (Word Cloud) — это визуализация, содержащая слова из некоторого набора данных, при этом размер шрифта прямо пропорционален частотности слова в наборе.
Про то, как делать и кастомизировать такие визуализации в Python, я писал в статье '
Облака слов в Python и Tableau'.
В статье есть код, и облака можно кастомизировать, меняя параметры. Можно использовать маску - изображение, по которому будет формироваться облако. В коде используется библиотека wordcloud. Если какие-то слова надо исключить из анализа (наречия, предлоги и др.), можно задавать список стоп-слов либо внешним .csv файлом, либо использовать библиотеки типа
stop_words
На заглавном изображении снизу - часть проекта по
визуализации всех слов известных 25 книг. Одна книга - одно облако.
В бизнес-дашбордах подобные визуализации лучше не использовать. Но есть интересные случаи, когда такие визуализации заходят бизнесу. На работе используем мессенджеры:
Slack,
Телеграм или другие, и рабочих каналов может быть больше сотни. Есть общие каналы и чаты, где общается почти вся компания. Раз в год, обычно под новый год делаю такие облака слов по общим чатам, использую лого компании в качестве маски. Саму визуализацию скидываем в общие чаты. Прикол таких визов в том, что они показывают чем жили сотрудники весь год, их боли и радости. Когда делаешь в высоком разрешении, интересно смотреть сочетания слов в таком облаке - часто попадаются перлы, максимально отражающие какое-либо событие или просто прикольные выражения. Чатики с нецензурной лексикой вызывают больший интерес
😊
А еще мы делали худи с облаком в логотипе компании.
🥼🥼🥼
Была мысль сделать облако по всему репозиторию аналитики: распарсить все .sql, .py файлы и напечатать визуализацию на футболках. Но есть риск, что в облаке будет чувствительная информация. Поэтому отказались от идеи. Пока
😎
Примеры облаков слов чатика датавиза в Телеге - сверху на картинке. Там облако в виде лого чата.