🖥 NVIDIA выпустила линейку языковых моделей
Компания
NVIDIA, известная, прежде всего, графическими процессорами (GPU),
объявила о релизе своей первой линейки больших мультимодальных моделей
NVLM 1.0. По словам разработчиков, она справляется с текстовыми задачами, распознает изображения и решает задачи по математике.
Что умеет NVLM 1.0
🟢 Распознавать текст на изображениях. NVLM 1.0 обрабатывает текстовую и визуальную информацию, благодаря чему решает сложные задачи. Модель умеет распознавать текст на изображении и отвечать на вопросы о содержании картинок. В ряде
тестов по распознаванию текста NVLM 1.0 даже обошла GPT-4o.
🟢 Интерпретировать мемы и другие изображения. Модель может объяснить, в чем состоит шутка на картинке, подскажет значение дорожного знака, определит по фото тип видеокарты или процессора.
🟢 Писать код на основе текстового промпта. Можно написать на листе задачу по программированию, и модель не только распознает текст, но и сгенерирует код.
🟢 Решать задачи по математике. NVLM 1.0 демонстрирует высокую точность в решении математических задач,
обгоняя LLM от Google и лишь немного уступая Claude 3.5 от Anthropic.
Модель Open Source
NVIDIA планирует сделать линейку моделей полностью открытой, что ставит их в один ряд с такими популярными LLM с открытым кодом, как Llama или Mistral. Веса моделей NVLM 1.0 станут доступны на
платформе Hugging Face — исследователи смогут использовать технологии
NVIDIA для своих проектов.
Больше по теме:
Дженсен Хуанг: от уборщика до директора самой дорогой компании в мире
#news #NVIDIA
@hiaimedia