ИИ и творчество. Сильный и слабый ИИ

Сильный ИИ решает задачи творчески. Что значит – творчески? Почему сейчас не творчески?

Вывод: научить ИИ творчеству – сделать шаг к сильному ИИ.

Культура работы в среде с возрастающей ценой ошибки

Agile

Как сейчас развивается ИИ? Глубокое обучение, GAN, все дела. По сути ватерфолл: [A → B], но много-много раз, чтобы ИИ научился делать [A → B] хорошо. 

Как работает настоящее творчество? Рассмотрим на примере пространственных видов искусств.

Профессиональные художники, проектировщики работают в культуре с возрастающей ценой ошибки. То есть, подвинуть на портрете глаз правее гораздо проще, когда у тебя обрубовочными линиями накиданы пропорции, чем когда почти готовый портрет написан акварелью. Цена ошибки на начальном этапе (внесение изменений займет 20 секунд) несопоставима с ценой ошибки на финальном этапе (внесение изменений займет часы-дни-месяцы-годы-миллиарды денег, смотря что за проект – подвинь-ка туалетную комнату в небоскребе).

Художники начали применять в работе гибкие методологии (agile) еще тогда, когда такого термина не существовало.

Плюс цифровой среды: меньше затраты на проработку нескольких вариантов решения задачи даже на финальных этапах.

Диджитал как инструмент в руках человека всё ещё позволяет условно «подвинуть глаз» достаточно безболезненно, но при этом нарушает логику возрастающей цены ошибки. «Удобство диджитал среды» — это следующий шаг для ИИ, а не начальный.

Brain Storm

Для решения творческих задач часто применяется техника мозгового штурма, она показывает себя достаточно эффективно.

Мозговой штурм: сначала ставится задача, затем генерируются варианты ее решения, в конце отсекаются лишние варианты.

Изменение культуры работы в среде с возрастающей ценой ошибки для ИИ

Обычно ИИ делает так:

[A → B]

на основе датасетов.

Насмотренность художника = датасет ИИ = опыт человека (культурный фон и прочее)

Сейчас ИИ при решении задачи идет по такому пути:

Человек решает творческую задачу так:

Сам путь (пунктир) творчеством не является. Творчество – комплекс поиска развилок и принятия решений, как на этих развилках поступать, а также последующей саморефлексии (почему было принято то или иное решение?).

Разберем алгоритм творчества.

Опишем ролевую модель: Творец + Менеджер + Клиент (Artist + Manager + Client).

У человека, занимающегося творчеством, эти персоны постоянно “общаются” в голове в процессе внутреннего монолога.

Менеджер организовывает мозговой штурм, помогает формулировать задачи и ставит подзадачи. Творец находится на первом этапе мозгового штурма: он генерирует возможные варианты решения задач. Клиент выступает в роли критика (второй этап мозгового штурма): выбирает из предложенного лучшие варианты.

Базовый алгоритм творческого процесса для ИИ

Спираль AMC (Artist, Manager, Client):

A0

Задание от человека (может включать референсы)

A

Определение числа итераций, машиночитаемое задание на первую итерацию

B1-n

Варианты выполнения задания A (соответствуют заданию A, но отличаются друг от друга, являются MVP для A0)

Bi

Выбранный для дальнейшей проработки вариант (возможно, не один, Менеджер может составить ТЗ по объединению)

C

C = Bi + Btask , где:

C = новое задание Творцу (с исходными материалами в виде Bi + Btask)

Bi  = выбранный для дальнейшей проработки вариант решения задачи A

Btask = задание по доработке Bi с учетом A

D1-n

Варианты выполнения задания C (соответствуют заданию C, но отличаются друг от друга, являются MVP+ для A0)

Di

Выбранный для дальнейшей проработки вариант (возможно, не один, Менеджер может составить ТЗ по объединению)

E

E = Di + Dtask , где:

E = новое задание Творцу (с исходными материалами в виде Di + Dtask)

Di  = выбранный для дальнейшей проработки вариант решения задачи A

Dtask = задание по доработке Di с учетом A0

F1-n

Варианты выполнения задания E (соответствуют заданиям E и A0, но отличаются друг от друга)

Fi

Выбранный итоговый вариант (возможно, не один)

Алгоритм можно усовершенствовать, добавив обратную связь:

Штрихом (‘) обозначено получение непосредственно данных по задаче + обратной связи для формирования датасетов и внутренних алгоритмов в каждой роли. Так ИИ будет самообучаться в процессе.

Скорость передачи обратной связи предположительно можно увеличить, передавая ее не пошагово по спирали, а при необходимости перешагивая (например, через Клиента, когда обратная связь передается от Творца Менеджеру), но для простоты визуализации здесь и далее эти “перешагивания” не обозначены.

Вертикальные стрелки (вверх и вниз) – передача информации, горизонтальные (вправо) – обработка.

Циклов (A → Bi, C → Di, E → Fi) должно быть столько, сколько нужно для решения первоначальной задачи.

Количество циклов задает Менеджер на этапе A0 → A. Если циклов недостаточно, получается “Рисуем круг – рисуем остальную сову”. Если слишком много, получается переработка и ненужная детализация.

Человек в процессе творчества прогоняет в голове во внутреннем монологе миллионы микро-циклов (например: нарисовать линию 1, нарисовать линию 2, нарисовать линию 3…) по макро-этапам (например: набросок, подмалёвок, детализация). 

Внутри каждого макро-цикла будут маленькие микро-циклы (спираль из спирали).

Внутри каждой строки может (и будет!) сидеть GAN-пара, позволяющая Роли самообучаться. Также применяется обучение без учителя.

Референсы в данном алгоритме подает (при необходимости подбирает) Менеджер вместе с заданиями Творцу.

Человек может при необходимости вмешиваться в процесс в роли Клиента (при выборе предпочтительного варианта для проработки), реже Менеджера (например, при определении числа итераций или подборе референсов).

При желании можно также провести аналогию приведенного алгоритма с эволюцией в природе, где Творец – это размножение и мутации, Клиент – отбор наиболее приспособленных, а Менеджер – само существо, которое пытается выжить и передать свои гены.

Пример применения алгоритма на практике

Возьмем самое типичное творческое задание: нарисовать картинку по запросу.

Если говорить об изображениях, человек не думает пикселями. 

Вектор с погрешностью в % (поправка на “толщину карандашной линии”) при необходимости переводится в растр для представления человеку.

Нужен векторный датасет (как минимум для начальных итераций).

Шаг к сильному ИИ

У живого человека такой процесс, как на схеме, происходит в режиме нон-стоп, поскольку человек постоянно принимает решения, даже если сам этого не замечает; а его внутренний Менеджер то и дело получает новую информацию в обработку и формирует на ее основании новые задачи. 

Чтобы создать подобие человеческого создания, осталось процесс со схемы сделать бесконечным с учетом поступления новой информации от сенсоров или иных источников ввода.

Ну и, конечно, неплохо бы создать соответствующие датасеты для каждой роли на всевозможные темы; хотя сам человек с рождения собирает свои датасеты (культурный опыт) в процессе получения новых и новых вводных.

Таким образом, в мыслительном процессе человека алгоритм принимает следующий вид.

Алгоритм бесконечного творческого процесса 

Если конкретная творческая задача для ИИ выглядит как спираль AMC (Artist, Manager, Client), то бесконечный творческий процесс выглядит как спираль EAMC (Environment, Artist, Manager, Client).

A0

Начало мышления. Нулевой выбор Клиента – рождение. Лунтик: ↑0

A0

Первые вводные данные из среды. От Клиента данные пока нулевые, кроме “Я родился”: ↑0

A

Первое задание Творцу (пока Менеджер толком ничего не умеет, задание мало отличается от просто данных A0’)

A’

Задание Творцу A + данные, полученные из среды

B1-n

Варианты выполнения задания A’ (соответствуют заданию A, но отличаются друг от друга)

B1-n

Варианты выполнения задания A’ + данные, полученные из среды

Bi

Выбранный для дальнейшей проработки вариант 

Bi

Bi + новые данные, полученные из среды + обратная связь 

C

C = Bi’ + Btask , где:

C = новое задание Творцу (с исходными материалами в виде Bi’ и Btask)

Bi  = Bi + новые данные, полученные из среды + обратная связь 

Btask = задание по доработке Bi с учетом новых данных из среды

C’

Задание Творцу C + данные, полученные из среды + обратная связь 

D1-n

Варианты выполнения задания C’ (соответствуют заданию C, но отличаются друг от друга)

D1-n

Варианты выполнения задания C’ + данные, полученные из среды, + обратная связь 

Di

Выбранный для дальнейшей проработки вариант 

Di

Di + новые данные, полученные из среды + обратная связь 

E

E = Di’ + Dtask , где:

E = новое задание Творцу (с исходными материалами в виде Di’ + Dtask)

Di’ = Di + новые данные, полученные из среды + обратная связь 

Dtask = задание по доработке Di с учетом новых данных из среды

E’

Задание Творцу E + данные, полученные из среды + обратная связь 

F1-n

Варианты выполнения задания E’ (соответствуют заданию E, но отличаются друг от друга)

F1-n

Варианты выполнения задания E’ + данные, полученные из среды, + обратная связь 

Fi

Выбранный для дальнейшей проработки вариант 

Продолжение по аналогии

Среда находится как бы в третьем измерении по отношению к схеме AMC, но спроецирована для демонстрации.

В отличие от AMC, где датасеты заранее сформированы (что не мешает им актуализироваться между задачами), в EAMC в процессе получения новых данных из среды и обратной связи от “коллег”, каждый из “участников” формирует свои датасет и алгоритмы.

Вертикальными стрелками показаны новые данные для формирования датасетов и алгоритмов:

  • черные стрелки – передача пакета информации по основному алгоритму;

  • фиолетовые, рыжие, красные – обратная связь от Творца, Клиента, Менеджера соответственно;

  • зеленые – новые данные из Среды.

Данные из Среды преимущественно помогают формировать датасеты, а обратная связь – совершенствовать внутренние алгоритмы каждой роли.

Например, выступая в роли Среды, человеческое воспитание учит и Творца (предлагать решения), и Менеджера (анализировать данные и ставить задачи), и Клиента (выбирать лучший вариант), показывая, какие бывают варианты базового преобразования [A → B] для каждой роли. 

Разумеется, в зависимости от того, в какой Среде будут находиться ИИ и какие данные будут получать, разные ИИ будут отличным друг от друга – прямо как люди. Правда, у человека в качестве источника информации из Среды (Среды по отношению к сознанию) также выступает собственное тело (в том числе гормоны), внося дополнительный элемент хаоса. При этом в отличие от человека, в ИИ можно загрузить датасеты ещё до рождения.

Следует помнить про макро- и микро-циклы. Спираль EAMC условно фрактальна, решение практически любой задачи может содержать внутри себя более маленькую спираль.

Комментарии (1)


  1. Elpi
    09.11.2025 07:39

    1. Вы начинаете с необоснованного заявления, что ИИ работает творчески. С чего вы это взяли, подтверждения есть? И безграмотно определять один неформализованный термин через еще более (есть мнение, что вообще неформализуемый) неформализованный. Где определение "творчества"? Генерация новых комбинаций из известного набора отдельных элементов - это не творчество. Это в лучшем случае "креатив" (я так для себя давно уже определил, поскольку термин "креативщик" популярен).

    2. Вы пишите: " Творчество – комплекс поиска развилок и принятия решений, как на этих развилках поступать, а также последующей саморефлексии". Извините, но здесь нет творчества. Оно уже закончилось на этапе генерации вариантов. Между которыми выбор развилками. Дальше тупая комбинаторика.

    3. Т.е. вы взяли непонятно что, непонятно как упростили - а потом героически это алгоритмизировали. Т.е. вы очень торопились упростить задачу так, чтобы вы смогли применить ваши наличные навыки.