Meta использовала общедоступные публикации в Instagram и Facebook для обучения своего нового помощника по искусственному интеллекту

242

Meta Platforms использовала общедоступные публикации в Facebook и Instagram для обучения частей своего нового виртуального помощника Meta AI, но исключила частные публикации, которыми делятся только с семьей и друзьями, чтобы уважать конфиденциальность потребителей, сообщил агентству Reuters в интервью главный политический руководитель компании.

Meta также не использовала приватные чаты в своих службах обмена сообщениями в качестве обучающих данных для модели и предприняла шаги по фильтрации личных данных из общедоступных наборов данных, используемых для обучения, заявил президент Meta по глобальным вопросам Ник Клегг, выступая в кулуарах ежегодной конференции Connect компании. На этой неделе.

«Мы попытались исключить наборы данных, в которых преобладает личная информация», — сказал Клегг, добавив, что «подавляющее большинство» данных, используемых Meta для обучения, было общедоступно.

Он привел LinkedIn в качестве примера веб-сайта, контент которого Meta намеренно предпочла не использовать из соображений конфиденциальности.

Комментарии Клегга прозвучали в связи с тем, что технологические компании, в том числе Meta, OpenAI и Google Alphabet, подверглись критике за использование информации, полученной из Интернета, без разрешения для обучения своих моделей искусственного интеллекта, которые поглощают огромные объемы данных для обобщения информации и создания изображений.

Компании обдумывают, как обращаться с частными или защищенными авторским правом материалами, удаленными в ходе этого процесса и которые могут воспроизвести их системы искусственного интеллекта, в то же время сталкиваясь с судебными исками со стороны авторов, обвиняющих их в нарушении авторских прав.

Meta AI стал самым значимым продуктом среди первых инструментов искусственного интеллекта, ориентированных на потребителя, представленных генеральным директором Марком Цукербергом в среду на ежегодной конференции продуктов Meta Connect. В этом году на мероприятии преобладали разговоры об искусственном интеллекте, в отличие от прошлых конференций, которые были посвящены дополненной и виртуальной реальности.

Meta создала помощника, используя собственную модель, основанную на мощной модели большого языка Llama 2, которую компания выпустила для публичного коммерческого использования в июле, а также новую модель под названием Emu, которая генерирует изображения в ответ на текстовые подсказки, говорится в сообщении.

Продукт сможет генерировать текст, аудио и изображения и будет иметь доступ к информации в режиме реального времени благодаря партнерству с поисковой системой Microsoft Bing.

По словам Клегга, общедоступные публикации в Facebook и Instagram, которые использовались для обучения Meta AI, включали как текст, так и фотографии.

Эти посты использовались для обучения Emu элементам генерации изображений в продукте, а функции чата были основаны на Llama 2 с добавлением некоторых общедоступных и аннотированных наборов данных, сообщил агентству Reuters представитель Meta.

По словам представителя, взаимодействие с Meta AI также может быть использовано для улучшения будущих функций.

Клегг сказал, что Meta ввела ограничения безопасности на то, какой контент может генерировать инструмент Meta AI, например, запрет на создание фотореалистичных изображений общественных деятелей.

Что касается материалов, защищенных авторским правом, Клегг заявил, что он ожидает «изрядного количества судебных разбирательств» по ​​вопросу о том, «подпадает ли творческий контент под действие существующей доктрины добросовестного использования», которая разрешает ограниченное использование охраняемых произведений для таких целей, как комментарии, исследования и т. д. и пародия.

«Мы думаем, что да, но я сильно подозреваю, что это приведет к судебному разбирательству», — сказал Клегг.

Некоторые компании, располагающие инструментами для создания изображений, облегчают воспроизведение знаковых персонажей, таких как Микки Маус, в то время как другие платят за материалы или намеренно избегают включения их в обучающие данные.

OpenAI, например, этим летом подписала шестилетний контракт с поставщиком контента Shutterstock на использование библиотек изображений, видео и музыки компании для обучения.

На вопрос, предприняла ли Meta какие-либо подобные шаги, чтобы избежать воспроизведения изображений, защищенных авторским правом, представитель Meta указал на новые условия обслуживания, запрещающие пользователям создавать контент, нарушающий конфиденциальность и права интеллектуальной собственности.


Читать полную новость на сайте