View in Telegram
В популярном датасете нашли десятки тысяч спираченных книг, суд отказал нейросетям в копирайте, Nvidia заработала все деньги мира — и другие важные новости за неделю Окружной суд США постановил, что контент, созданный нейросетью, не может быть объектом копирайта. Вердикт вынесен по иску Стивена Талера, который через суд хотел добиться того, что автором изображений признали созданную им нейросеть, а владельцем изображений — самого Талера. Суд счел, что для копирайта произведение должно быть создано человеком и никак иначе; Журналист издания The Atlantic выяснил, что популярный датасет Books3 для обучения языковых моделей в значительной степени состоит из пиратских версий книг. Среди авторов, чьи книги есть в датасете: Стивен Кинг, Джеймс Паттерсон, лауреат Пулитцеровской премии Хунот Диас и многие другие. Всего в Books3 около 170 тыс. художественных и нон-фикшн произведений. На датасете обучены, в том числе модели Llama и Bloomberg GPT; И в продолжение темы: опубликован самый большой OpenSource-датасет для обучения языковых моделей. Открытый для редактуры набор Dolma создан некоммерческой организацией A12 для своей LLM, но НКО решила поделиться им со всеми желающими; В Snapchat появится генеративный инструмент Dreams, который позволит добавлять к своим селфи фон, созданный нейросетью по текстовой подсказке. Dreams можно будет использовать с друзьями. По слухам, сгенерированные бэкграунды можно будет еще и продавать; Meta* выпустила языковую модель с открытым кодом Seamless M4T, которая поддерживает 100 языков. Seamless может не просто переводить текст с одного языка на другой, но также распознавать речь, переводить ее в текст и в речь. Также компания на этой неделе запустила модель для генерации программного кода Code Llama; The Information пишет, что Microsoft запускает совместный проект со стартапом Databricks, который специализируется на ИИ-продуктах с открытым кодом. Пикантности истории добавляет то, что Microsoft одновременно вкладывает миллиарды долларов в OpenAI, которые не очень любят делиться кодом своих сервисов. То есть Microsoft, по сути, поддерживает 2-х прямых конкурентов и бизнес OpenAI может от этого пострадать; Meta* разрешит пользователям на территории ЕС отключать умную ленту в Facebook** и Instagram**, которая предлагает публикации на основе интересов. После отключения алгоритмы соцсетей перестанут собирать информацию о пользователе, который будет видеть публикации только тех, на кого он подписан. Такое решение продиктовано необходимостью соблюдать Digital Services Act, который вступит в силу на территории Евросоюза в конце августа; Чистая прибыль Nvidia за квартал выросла на сумасшедшие 843% год к году — до $6,2 млрд. Все из-за ажиотажного спроса на чипы, которые нужны для работы ИИ-моделей. В следующем квартале компании прогнозируют финансовые результаты еще лучше. *Организация, запрещенная на территории РФ **Instagram и Facebook входят в Meta — организацию, запрещенную на территории РФ
Telegram Center
Telegram Center
Channel