Что почитать сегодня – NOTA AI/ML Daily Digest.
1. CatBoost, XGBoost и выразительная способность решающих деревьев
Статья исследует алгоритмы машинного обучения CatBoost и XGBoost, основанные на решающих деревьях. Обсуждаются преимущества и особенности этих алгоритмов, включая упорядоченное target-кодирование, использование решающих таблиц и возможность работы с текстовыми признаками. Автор проводит собственное исследование и эксперименты, демонстрируя, что ансамбли деревьев ограниченной глубины не являются универсальными аппроксиматорами.
https://habr.com/ru/articles/645887
————————————————————
2. Powerful Machine Learning Resources: What Google Colab Is and How to Use It
Статья рассказывает о Google Colab, бесплатной облачной платформе для машинного обучения, работающей на основе Jupyter notebooks. Colab предлагает использование GPU для тяжелых вычислений и интеграцию с Google Drive. Автор объясняет, как начать работу с Colab и для каких проектов его можно использовать, включая обучение моделей на изображениях, текстах и звуках.
https://medium.com/imagescv/powerful-machine-learning-resources-what-google-colab-is-and-how-to-use-it-195399ae6b6d
————————————————————
3. How to choose a table index for your SQL database
Статья предназначена для начинающих и посвящена оптимизации SQL-запросов через правильный выбор индексов для таблиц базы данных. Автор объясняет, как индексы ускоряют операции чтения, записи и обновления, предлагает методы выбора подходящих столбцов для индексации, в том числе мультиколоночные индексы, и обсуждает важность уникальных ключей. Подчеркивается значимость тестирования производительности и компромисс между размером и оптимизацией.
https://medium.com/the-software-firehose/how-to-choose-a-table-index-for-your-sql-database-d47715a35f34
————————————————————
Теги:
#algorithms #jupyter #sql