Семейство языковых моделей ДНК GENA-LM наконец-то опубликовали в рецензируемом журнале.
Пока я временно выпала из работы, выкармливая свою двойню, команда добила статью по GENA-LM до публикации. Это был сложный путь. Сразу мы год общались с ревьюерами и редактором Nature Methods, ответив на все вопросы и добавив запрошенные дополнительно задачи. Нас отклонили субъективным решением редактора. И вскоре стало понятно почему: вышла статья с моделью от наших конкурентов, которая так же не отличается от нашей по запрошенным требованиям, но проигрывает нам в ряде задач
(да-да, вы все правильно поняли, я обиделась).
Затем работа была отправлена в Nucleic Acids Research. Там получили один положительный отзыв и один реджект с комментарием «the authors put a pin on my suggestion….»
(вообще думала, что это хамство, переведя на русский. Но чатгпт говорит, что вполне нейтральная фраза.)
Но! Мы были приятно удивлены, что впервые в нашей практике редактор не просто прислал свое положительное решение, но и написал Вениамину личное письмо с благодарностью за проделанную работу.
Поэтому выводы можно сделать разные, но лучше посмотреть на цифры. С момента публикации первых моделей и размещения статьи на биоархиве:
5️⃣1️⃣ цитирование
препринта
3️⃣0️⃣5️⃣0️⃣7️⃣ скачиваний суммарно с
Hugging Face
1️⃣ web-сервис для решения нескольких популярных задач
GENA-Web