ИИ Baidu завершает незаконченный рисунок тушью: как это работает и делает ли это людей-художников устаревшими?

180

Китайский технологический гигант Baidu недавно продемонстрировал свои возможности искусственного интеллекта, представив недавно «завершенную» картину тушью китайского художника Лу Сяомана (1903–1965), которая была завершена с помощью разработанной фирмой платформы для создания произведений искусства, основанной на глубоком обучении.

В рамках презентации произведения Baidu провела круглый стол с местным аукционным домом Duo Yun Xuan 16 ноября в Шанхае. Эти двое объединились для завершения работы Лу, которую любимый культурный деятель 20-го века оставил незавершенной.

Оригинальная незаконченная работа Лу Сяоманя (в центре), интерпретация художника-человека Ле Чжэньвэня (слева) и интерпретация Baidu AI (справа). Кредит: Байду

В этом обсуждении были представлены две попытки завершить первоначальную незавершенную работу Лу: одна от известного китайского художника Ле Чжэньвэня, а другая от Baidu Wenxin Yige, платформы для создания произведений искусства, разработанной на платформе глубокого обучения Baidu PaddlePaddle. Намерение состоит в том, чтобы предложить сравнение между интерпретацией произведения ИИ и интерпретацией человека-художника.

Согласно Baidu, его версия работы прошла четыре этапа: обучение ИИ, рисование ИИ, раскрашивание ИИ и составление тематического стихотворения. В ходе этого процесса Baidu сотрудничала с Duo Yun Xuan, чтобы собирать общедоступные рисунки тушью для обучения моделей и достижения лучшего результата.

Процесс генерации. Кредит: Байду

Работы-близнецы будут проданы 8 декабря на аукционе, посвященном 30-летию Дуо Юн Сюань.

Ниже приведены комментарии к проекту от Сяо Синьяна, главного архитектора Baidu Wenxin Yige. Его слова были переведены, отредактированы и сжаты для ясности.

Как ИИ создает такие произведения искусства?

Короче говоря, ИИ будет перетасовывать и составлять концепции и наборы данных, которые он изучил ранее, что является чем-то вроде представления знаний.

С технической точки зрения ИИ учится, прежде чем рисовать, как и люди. Он обучается на огромном количестве данных совпадений изображения и текста. Каждая картина имеет текстовое описание. Ал может выучить связь между языками и изображениями, а также несколько соответствующих концепций, связанных с изображениями.

Например, концепция гор может иметь самые разные стили изображения. Так как же люди используют ИИ для рисования? Им нужно предоставить текстовое описание, например, «сосна на горе». ИИ будет использовать свой накопленный опыт и знания, чтобы случайным образом генерировать расплывчатую начальную версию, а затем постоянно модифицировать и совершенствовать ее. Процесс модификации может состоять из сотен раундов, при этом общая схема становится все яснее и яснее в процессе, обогащая детали. Работа будет окончательно завершена, когда будет соответствовать эстетическим требованиям людей.

Как Baidu исследует технологию создания произведений искусства?

Мы [Baidu] внедрять собственную разработку. Есть два основных момента в нашей технологии рисования ИИ. Во-первых, качество изображения высокое и выглядит деликатно. Мы используем мощную диффузионную модель, которая является важным техническим нововведением. Благодаря мультимодальности текста и изображения мы можем [give AI] глубокое понимание, позволяющее создавать тонкие произведения искусства.

Кроме того, мы лучше понимаем китайскую культуру, и мы создадим соответствующий набор данных, чтобы передавать его поколениям в таком стиле. Для обучающих наборов данных мы также разработали алгоритмы для оценки эстетики, чтобы убедиться, что они соответствуют критериям.

А учитывая, что описания пользователей могут быть неточными, мы улучшили систему ввода с помощью графа знаний, чтобы предоставить связанные ключевые слова для лучшего взаимодействия с пользователем.

Пока что отзывы пользователей весьма положительные; платформа значительно повысила их эффективность. Для большинства обычных пользователей генератор ИИ весьма полезен. Забегая вперед, мы планируем изучить более широкий спектр сценариев использования, например, использование ИИ для помощи детям в рисовании.

Какова позиция человека в искусстве искусственного интеллекта?

Человек имеет большое значение в картинах, управляемых ИИ. На мой взгляд, человек является наставником ИИ. Нам нужно разработать нейросеть модели рисования ИИ: есть разные модели с разными эффектами [and we need to choose ideal ones from them].

Человек также должен снабдить ИИ некоторым материалом, чтобы узнать и определить, как следует обучать ИИ. Например, Baidu Wenxin Yige был наполнен традиционными китайскими элементами и культурными данными, чтобы лучше понять этот жанр.

[The platform] может создать изображение в течение нескольких минут. Над первой версией статьи, написанной Лу Сяоманем, команда Baidu обратилась за советом к художнику Ле. Затем он предоставил больше обучающих образцов для лучшего результата.

В самом начале ИИ нужны люди, чтобы научить его генерировать изображение: какой контент должен быть на картинке и какие стили должны быть представлены.

Люди также должны принимать окончательное решение, несмотря на то, что у машины есть автоматический алгоритм, чтобы определить, достаточно ли хороша сгенерированная работа, потому что ИИ в этом случае не так точен, как люди.

Читать полную новость на сайте