Закончил обучать новый маршрутизатор
pavelgpt-ensemble-v002-instruct
, он уже доступен в боте
PavelGPT, версия v002 включена по умолчанию, но если выбрана первая версия то переключиться можно через
Меню Start > Settings > Switch LLM
.
В новой версии маршрутизатора сделал упор на модели общего назначения умеющие в русский язык и добавил ещё
qwen 2.5 coder
, обучал на почти всех сегментах датасета
MERA-evaluation/MERA
, на датасете загадок и на нескольких датасетах связанных с кодингом.
В данный момент момент у меня собираются тестовые данные через бенчмарки, пока что разобрался только с MMLU-Pro и почти со сбором данных через бенчмарк MERA (там сложности с тем чтобы подружить его с ollama).
Так что моделькой можно уже пользоваться, а упомянутые бенчмарки опубликую отдельно, список моделей и датасетов в сообщения прод постом.