ИИ и Работа с ним | NOTA

#image_ai
Канал
Технологии и приложения
Образование
Новости и СМИ
Русский
Логотип телеграм канала ИИ и Работа с ним | NOTA
@nota_aimlПродвигать
22
подписчика
46
ссылок
Ежедневный дайджест самых интересных статей про AI и машинное обучение. По всем вопросам: @nota_admin
​​Что почитать сегодня – NOTA AI/ML Daily Digest.

1. Как сделать Stable Diffusion XL ещё умнее, используя отрицательные подсказки

Статья описывает нововведения в модели генерации изображений Stable Diffusion XL, включая использование отрицательных подсказок для улучшения качества генерации. Автор обсуждает методы оптимизации и приводит примеры работы с моделью через библиотеку Python и Hugging Face. Рассматриваются практические аспекты использования моделей улучшения и новые функции, такие как prompt weighting и Dreambooth LoRA, позволяющие настраивать модель под специфические задачи. Также автор делится своим опытом обучения модели и сравнивает результаты с применением отрицательных подсказок.

https://habr.com/ru/articles/756496
————————————————————

2. Learning To Learn

Статья объясняет понятие "учиться учиться" и его значение в процессе обучения программированию. Автор исследует такие концепции, как таксономия Блума и кривая забывания, а также их применение в обучении. Переходя через уровни таксономии, от запоминания до создания оригинальных работ, читатели узнают, как максимизировать свои учебные способности. Статья подчеркивает важность понимания, применения, анализа, оценки и создания в контексте программирования.

https://medium.com/@lrkhan/learning-to-learn-3323cdad62d1
————————————————————

3. Generating PDF Reports Programmatically in Python Using API Data

Статья рассказывает о создании программных PDF-отчетов на Python с использованием данных API. Автор делится опытом генерации финансовых справочников с помощью Capital Finder API и предоставляет руководство с примерами кода в Jupyter Notebook. Описан процесс, начиная с получения данных до визуализации отчетов, которые являются привлекательными и удобными для распространения среди клиентов. В статье содержатся советы по созданию отчетов и шаблон HTML для их форматирования.

https://medium.com/alliedoffsets/generating-pdf-reports-programmatically-in-python-using-api-data-9f4dfe2cad6a
————————————————————

Теги:

#image_ai #softskills #python #jupyter
​​Что почитать сегодня – NOTA AI/ML Daily Digest.

1. Постановка задачи компьютерного зрения

Автор делится своим многолетним опытом в области компьютерного зрения, распознавания образов и машинного обучения. Основная тема статьи - распространённые ошибки при формулировке задач CV и важность тестовой базы примеров для корректной работы систем. База данных необходима для определения границ применения алгоритма и предсказуемости его поведения в разных ситуациях. Статья содержит примеры из реальной практики и советы по сбору репрезентативной базы данных.

https://habr.com/ru/articles/274725/
————————————————————

2. Trunk-Based Development: The Key to Better and Faster Software

Статья объясняет принципы trunk-based development (TBD) - методологии разработки ПО, фокусирующейся на одной главной ветке кода. Автор анализирует, как TBD может улучшить качество и ускорить процесс разработки за счет коротких жизненных циклов веток, частых коммитов, непрерывной интеграции и доставки (CI/CD), автоматизированного тестирования и использования флагов функций. Сравнивается с другими стратегиями ветвления и даются советы по реализации TBD в организациях для достижения лучшей эффективности и скорости разработки.

https://semaphoreci.medium.com/trunk-based-development-the-key-to-better-and-faster-software-577a76fad3cf
————————————————————

3. sense2vec in python3

Статья посвящена инструменту sense2vec для получения синонимов и корреляций по ключевым словам в Python. Рассказывается о том, как использовать sense2vec без обучения собственного корпуса текстов, и предоставляются два предварительно обученных набора векторов с Reddit 2015 и 2019 годов. Описываются шаги установки, импорта библиотек, использования sense2vec и решение распространенных проблем. Автор даёт советы для работы с инструментом, включая выбор подходящего набора векторов и избегание ошибок нехватки памяти.

https://medium.com/nerd-for-tech/sense2vec-in-python3-9d3db9557495
————————————————————

Теги:

#devblog #image_ai #devops #python
​​Что почитать сегодня – NOTA AI/ML Daily Digest.

1. ChatGPT прошёл собеседование в Google на должность младшего инженера-программиста грейда L3

Статья о том, что чат-бот ChatGPT, созданный компанией OpenAI, успешно прошёл тестовое собеседование в Google и был принят на должность младшего программиста. Однако при решении логических задач ChatGPT ошибся, в отличие от LaMDA от Google. Представлены детали должности, затронута тема о том, будет ли искусственный интеллект заменять программистов в будущем.

https://habr.com/ru/news/715278/
————————————————————

2. Aligning RGB channels using NCC

В статье рассматривается задача раскрашивания черно-белых фотографий коллекции Прокудина-Горского путем выравнивания RGB-каналов с помощью нормированной кросс-корреляции. Загружается примерное изображение из коллекции, разделяется на 3 канала, которые последовательно сдвигаются для максимизации NCC и объединяются в цветное изображение. Приводятся детали реализации алгоритма на Python.

https://siddhant-shah.medium.com/aligning-rgb-channels-using-ncc-fceaa6effa57
————————————————————

3. Four Random Thoughts Vol. 5

В статье автор делится четырьмя случайными мыслями: 1) о книге Born to Run и о том, как автору захотелось начать бегать после ее прочтения; 2) о том, что для работы с ИИ нужно овладеть основами программирования; 3) об авторском скептицизме в различных областях; 4) об особенностях жизни бездомных в Сан-Франциско.

https://medium.com/@solsona/four-random-thoughts-vol-5-979235df826
————————————————————

Теги:

#gpt #image_ai #career
​​Что почитать сегодня – NOTA AI/ML Daily Digest.

1. Tesseract vs таблицы. Распознавание документов

Автор рассказывает о своем опыте использования Tesseract и openCV для распознавания текста и таблиц в PDF документах. Описывается алгоритм предварительной обработки изображения, выделения контуров, классификации объектов на текст и таблицы. Рассматривается представление таблиц в виде графа для последующей обработки.

https://habr.com/ru/articles/546824/
————————————————————

2. NLP in C# made easy with spaCy & Catalyst

В статье рассматривается использование библиотек spaCy и Catalyst для разработки решений NLP на C#. Описывается интеграция spaCy с C# через Catalyst, демонстрируются примеры работы с текстом, извлечения имен сущностей, классификации. Показана простота разработки NLP приложений на C# с использованием данных библиотек.

https://theolivenbaum.medium.com/nlp-in-c-made-easy-with-spacy-catalyst-acc93e005f3d
————————————————————

3. Building a Text Classifier with Spacy 3.0

Статья описывает процесс обучения классификатора текстов с использованием библиотеки SpaCy 3. Загружаются данные для обучения из репозитория ML-Datasets. Показана простая реализация классификатора с несколькими строками кода без предобученных векторов.

https://medium.com/analytics-vidhya/building-a-text-classifier-with-spacy-3-0-dd16e9979a
————————————————————

Теги:

#image_ai #nlp #csharp
​​Что почитать сегодня – NOTA AI/ML Daily Digest.

1. Шесть степеней свободы: 3D object detection и не только

Статья рассматривает задачу определения положения 3D объектов на изображении. Рассматриваются основные этапы решения этой задачи: получение 3D модели объекта, детекция ключевых точек на изображении, применение алгоритма PnP для нахождения параметров преобразования из 3D в 2D.

https://habr.com/ru/companies/ods/articles/522836/
————————————————————

2. Topic Modeling with BERTopic

Статья посвящена тематическому моделированию (topic modeling) с использованием библиотеки BERTopic для языка Python. Рассматривается процесс подготовки текстовых данных, выбора количества топиков и интерпретация полученных результатов.

https://medium.com/cmotions/topic-modeling-with-bertopic-71834519b956
————————————————————

3. Solve the Project Euler Problems in Python — Introduction and Problems 1–3

Статья посвящена разбору первых трех задач сайта Project Euler и их решению на Python. Первая задача касается нахождения суммы всех кратных 3 и 5 меньше 1000. Вторая - суммы четных чисел в ряде Фибоначчи меньше 4 млн. Третья задача находит наибольший простой делитель числа 600851475143.

https://levelup.gitconnected.com/solve-and-understand-the-project-euler-problems-in-python-introduction-and-problems-1-3-32625d1633f7
————————————————————

Теги:

#image_ai #python #nlp #algorithms
​​Что почитать сегодня – NOTA AI/ML Daily Digest.

1. Как клеить по 13 девушек в час, используя машинное обучение и Tinder

Автор рассказывает о применении машинного обучения для оптимизации поиска партнеров на Tinder. Описывается сбор большого датасета фотографий, предварительная обработка данных, обучение нейронной сети для оценки внешности и запуск бота. Бот позволил автору получить 13 совпадений за час с девушками, с которыми начался диалог.

https://habr.com/ru/companies/ruvds/articles/508280/
————————————————————

2. How nonprofits reimagine work using smart technology

Статья рассматривает применение умной технологии неправительственными организациями, в частности искусственного интеллекта. Приводятся примеры ее использования для автоматизации рутинных задач и повышения эффективности работы, например, чат-ботов. Описывается подход к внедрению на основе определения конкретных задач и обратной связи с пользователями.

https://aws.amazon.com/ru/blogs/publicsector/how-nonprofits-reimagine-work-using-smart-technology/
————————————————————

3. Voice recognition on the web using IBM Watson

В видеоролике демонстрируется интеграция сервиса распознавания речи IBM Watson с React.js. Автор поясняет основные этапы подключения API Watson и работу с полученными результатами распознавания в веб-приложении. Цель заключается в добавлении возможности ввода команд голосом для управления приложением.

https://medium.com/humans-create-software/voice-recognition-on-the-web-using-ibm-watson-10dfac43d9cb
————————————————————

Теги:

#image_ai #nlp
​​Что почитать сегодня – NOTA AI/ML Daily Digest.

1. Нейронные сети, DeepFake и колени: как обмануть рентгенолога

Статья рассказывает об исследовании, в котором ученые создавали фейковые рентгеновские снимки колен с помощью нейронных сетей. Эти снимки обманывали врачей-специалистов. Цель заключалась в расширении базы данных для обучения ИИ, чтобы в дальнейшем совершенствовать диагностику. DeepFake позволил получить данные без нарушения медицинской этики и соблюдения законов о конфиденциальности.

https://habr.com/ru/articles/702492
————————————————————

2. Improve newspaper digitalization efficacy with a generic document segmentation tool using Amazon Textract

Статья рассказывает о том, как использовать инструмент Amazon Textract для сегментации документов и повышения эффективности оцифровки газет. Amazon Textract позволяет распознавать текст, список, таблицы и изображения в сканированных документах. Это облегчает извлечение и структурирование данных из оцифрованных материалов.

https://aws.amazon.com/ru/blogs/machine-learning/improve-newspaper-digitalization-efficacy-with-a-generic-document-segmentation-tool-using-amazon-textract/
————————————————————

3. 10 High Paying Technology Jobs You Can Aim for Better Salary in 2023

Статья рассматривает десять высокооплачиваемых профессий в области технологий, на которые можно ориентироваться в 2023 году для получения высокой зарплаты. Среди них: специалисты по искусственному интеллекту, системные инженеры, специалисты по облачным технологиям, разработчики веб-сервисов, специалисты по кибербезопасности и др.

https://medium.com/javarevisited/top-10-technology-jobs-for-programmers-and-it-professionals-c10784090031
————————————————————

Теги:

#image_ai #career
​​Что почитать сегодня – NOTA AI/ML Daily Digest.

1. Основы фрактального сжатия изображений

Статья освещает основы фрактального сжатия изображений с помощью фракталов и итеративных систем функций. Фрактальное сжатие позволяет большим количеством коэффициентов описать сложные объекты. Алгоритм сжатия разбивает изображение на блоки и находит наилучшее преобразование для сопоставления блоков.

https://habr.com/ru/articles/126653/
————————————————————

2. Popularity of Data Science, Python and Python’s Major Libraries

Статья анализирует популярность данные науки, Python и его библиотек на основе данных с GitHub и Google Trends. Python популярен благодаря читабельности и обширной библиотечной базе. Наиболее просматриваемым репозиторием на GitHub является TensorFlow. Пандас становится всё более популярной.

https://medium.com/@atillaguzel/popularity-of-data-science-python-and-pythons-major-libraries-f7146e202e5d
————————————————————

3. Greedy Algorithms

Алгоритмы по жадности принимают локально оптимальное решение, которое не всегда является глобальным. Они описываются на примере поиска максимальной суммы в дереве. Достоинства - простота и эффективность, недостаток - не оптимальный результат. Применяются в задачах кратчайшего пути.

https://medium.com/the-graph/greedy-algorithms-f91424e56780
————————————————————

Теги:

#algorithms #image_ai #python #tensorflow #pandas
​​Что почитать сегодня – NOTA AI/ML Daily Digest.

1. ИИ ищет в микробах соединения для новых лекарств

Исследователи создали алгоритм NRPminer, который может искать в геномах микробов вторичные метаболиты - нерибосомные пептиды (NRP), предсказывать их структуру и оценивать потенциал для использования при создании новых лекарств. Алгоритм успешно нашёл несколько новых NRP и показал перспективность для дальнейших поисков.

https://habr.com/ru/articles/561050
————————————————————

2. An Introduction to Hadoop for Beginners

Статья представляет вводную информацию о системе Hadoop. Рассказывается что Hadoop - это open-source платформа для хранения и обработки больших данных. Система включает HDFS для хранения файлов и YARN для планирования задач. Также в статье дается классификация инструментов Hadoop экосистемы на три группы: основной стек, инструменты для обработки данных и инструменты для координации.

https://python.plainenglish.io/introduction-to-hadoop-part-1-8629bfd8464d
————————————————————

3. Extracting Dominant Colours from an Image using K-means Clustering from Scratch

Статья описывает имплементацию алгоритма k-средних для группировки пикселей изображения по цвету и выделения наиболее доминирующих цветов в изображении. Приведен пример реализации на Python для извлечения 5 доминирующих цветов из поданного на вход изображения. Алгоритм реализован "с нуля" без использования внешних библиотек.

https://medium.com/analytics-vidhya/extracting-dominant-colours-in-an-image-using-k-means-clustering-from-scratch-2ce79a3eea5d
————————————————————

Теги:

#python #hadoop #algorithms #image_ai
Добро пожаловать на канал ИИ и Работа с ним | NOTA!

Здесь мы ежедневно публикуем подборки статей, в которых эксперты и энтузиасты IT-индустрии делятся своими знаниями, опытом и историями с реальных проектов.

Этот канал посвящен искусственному интеллекту и машинному обучению, а если вас интересуют и другие направления, подписывайтесь на наши каналы:

Про Frontend каждый день | NOTA
Про Backend каждый день | NOTA

По любым вопросам можно писать сюда: @nota_admin

Теги для навигации:
Языки - #python #rlang #cplusplus #csharp
Направления - #data #algorithms #image_ai #nlp
Инструменты - #tensorflow #pandas #hadoop #jupyter #gpt #sql
Смежные темы - #devops #architecture #mobile
Другое - #devblog #career #softskills