Закончил обучение нового маршрутизатор
pavelgpt-ensemble-v002-instruct
, он уже доступен в боте
PavelGPT, версия v002 доступна по умолчанию, но если выбрана первая версия то переключиться можно через
Меню Start > Settings > Switch LLM
.
В новой версии маршрутизатора сделал упор на модели модели общего назначения умеющие в русский язык и добавил ещё
qwen 2.5 coder
, обучал на почти всех сегментах датасета
MERA-evaluation/MERA
, на датасете загадок и на нескольких датасетах связанных с кодингом.
В данный момент момент у меня собираются тестовые данные через бенчмарки, пока что разобрался только с MMLU-Pro и почти сбор данных через бенчмарк MERA (так сложности с тем чтобы подружить его с ollama).
Так что моделькой можно уже пользоваться, а упомянутые бенчмарки опубликую отдельным постом, список моделей и датасетов в сообщения прод постом.