Apple в октябре незаметно выпустила собственную мультимодальную большую языковую модель Ferret; принцип ее работы состоит в том, что модель изучает указанный фрагмент изображения, идентифицирует объекты на этом участке и очерчивает их рамкой; распознанные на фрагменте изображения объекты система воспринимает как часть запроса, ответ на который предоставляется в текстовом формате —
Siliconangle#LLM #AI #Apple