Standard Intelligence выпустили ИИ-модель hertz-dev, для голосового общения в реальном времени. Пример общения в видео и я бы не отличил робота от человека на слух.
Основные особенности:
- открытый исходный код
- крайне быстрое взаимодействие в 120 мс, быстрее вам ответит только человек который не хочет общаться
- 8.5 млрд параметров и ограничение обработки до 4 минут речи
Быструю скорость установили на Nvidia RTX 4090, и это в 2 раза быстрее чем платные аналоги.
⛓️💥 Проект
на GitHub