Ещё один инструмент?

Разговор об ИИ в искусстве или дизайне почти всегда начинается одинаково: «это просто ещё один инструмент». Тело в некотором смысле можно назвать продолжением души, руку — (о)конечностью тела, кисть улучшает руку, фотошоп имитирует кисть и так далее; и вот в конце этой цепочки появилась нейросеть — и она первая, кто может сопротивляться — интерпретировать вводные данные, принимать сотни микрорешений и возвращать результат, никогда не сводимый к прямой воле пользователя, а иногда ей попросту противовоположный. Обнаруживается, что субъект авторства расщеплён между несколькими людьми (тем, кто пишет промпт, тем, кто оценивает ответ, — и это не всегда один и тот же человек; разработчиками и так далее), обучающими данными и самой системой как актором.
Всё это означает, что привычная схема «автор делегирует намерение инструменту, который возвращает запрошенный результат» больше не работает. Точнее, работает, но её онтология существенно изменилась: инструмент, выражаясь по-хайдеггериански, перестаёт быть zuhanden — «подручным», то есть существующим и интересующим нас как сущее лишь в той мере, в которой он решает задачу; теперь он ещё и «наличен» (vorhanden), то есть его присутствие избыточно в отношении того, чего мы хотим от него получить, и эта избыточность проявляется, например, в том, что возвращает он нечто, запрошенный результат превосходящее или просто запросу не соответствующее. Что это за избыток? Избыточна тут — агентность инструмента. Если кто-то дорожит антропоцентричной картой реальности, можно приписать к этой агентности приставку «квази-», но это мало что изменит.
Обратный коллапс

Привычная модель авторства хорошо описывается «квантовой» метафорой: ещё-не-воплощённый замысел существует в некоей идеальной суперпозиции и схлопывается, будучи реализованным в определённой фиксированной форме, — тем самым все остальные формы становятся теперь невозможными и попросту утрачивают бытие в обоих модусах: и актуального, и потенциального, оставаясь в статусе не более чем «события в тексте», «воспоминания» или «несбывшегося».
Грэм Харман называл объекты, ещё-не-вступившие в реляции, «дремлющими»; воплощение художественного замысла убивает во сне — делает «мёртвыми объектами» — все возможные формы, кроме одной-единственной.
У Карен Барад, кстати, это почти даже не метафора: нож, которым мы наносим смертельный удар, совершает agential cut — акт, который из неопределённости производит определённость. До разреза нет никаких отдельных «объектов» и «субъектов» — именно разрез создаёт и наблюдаемое, и наблюдателя одновременно.
Но в генеративном процессе суперпозиция — внешняя, так как она сидит не внутри моего «авторского субъекта», а в латентном пространстве модели, и она не «моя». Я имею дело с чужой полнотой — гиперархивом, который бесконечно богаче любого индивидуального замысла (статистически, а не экзистенциально).
Итак, до-генеративный (забавный получился неологизм, не так ли?) автор при материализации идеи всегда теряет, так как замысел всегда шире конкретного воплощения, — тогда как человек, работающий с генеративной моделью, при генерации иногда приобретает, когда модель возвращает то, чего в его замысле не было. То есть коллапс суперпозиции идёт в обе стороны: это и утрата, и приращение. Это другая онтология, и она дезориентирует именно потому, что упраздняет привычный сценарий (у меня в голове всегда больше, чем воплощено): на выходе получается больше, чем было на входе, причём этот избыток — не мой, не от меня исходящий и мне не принадлежащий (во всех значениях слов «исходить» и «принадлежать»).
Эксперимент 1. Коллапс аффекта
Опишите устно образ, который вы хотели бы сгенерировать. Говорите свободно — с жестами, междометиями, оговорками; чем больше, тем лучше. Не стесняйтесь противоречий. Фиксируем ключевые слова.
Теперь запишите промпт. Одно предложение, как если бы вы вводили его в MidJourney прямо сейчас. Что происходит? От облака аффектов осталась строчка из нескольких слов. Вот он, коллапс вашего аффекта и замысла — вы видите его и переживаете как травму.
Генерируете четыре варианта. Это то, что вы имели в виду? Почти наверняка — нет, но что-то из результатов может вас зацепить. И тут — ключевой вопрос: «Вот эта деталь, которая вам понравилась, — вы её просили? Нет. Откуда она взялась? Кто автор этого решения?»
Каскад коллапсов
Интересно, что даже фиксация замысла в форме промпта — тоже ведь агентный разрез и схлопывание неопределённости. И это сдвигает всю схему: получается не один разрез, а каскад разрезов.
Первый коллапс — когда замысел («внутреннее искусство», полнота неоформленного) фиксируется в промпте, я уже потерял: из облака ощущений, аффектов, визуальных предчувствий я вынул цепочку конкретных слов (например, я пишу в промпте cathedral, а не temple). Каждое слово — отсечение, а промпт — это уже руина замысла.
Второй коллапс происходит, когда промпт интерпретируется моделью. Но модель схлопывает не мою суперпозицию, а свою. Я написал «cathedral», подразумевая готику, холод, вертикаль и какие-то свои связанные с этими тегами аффекты; модель прочитала «cathedral» — и, обученная на миллионах изображений соборов, достала из латентного пространства своё усреднённое представление.
Вот мы уже имеем два коллапса из двух разных суперпозиций; но это ещё не всё. Третий — конвергентный отбор из сгенерированного. Четвёртый — постобработка в Nano Banana Pro, пятый — в Photoshop и так далее.
Что здесь важно для нас: обычно весь разговор об агентности крутится вокруг второго и третьего коллапса — «модель решает» и «я выбираю». Первый остаётся невидимым. Но именно он — самый драматичный: момент, когда я ещё не нажал Enter, а замысел уже повреждён. Вербализация — первое насилие над суперпозицией.
Хайдеггер, которого мы уже вспоминали, точен: язык — «дом бытия», но дом — это и ограничение. Войти в дом — значит перестать быть снаружи. Мой промпт — это вхождение в дом языка модели, который устроен иначе, чем твой. Я формулирую замысел на своём языке, а модель читает его на своём. В узкой улочке меж двумя домами, в этом зазоре копошится самая интересная живность.
Эксперимент 2. Собор посредственности
Запишите три ассоциации к слову cathedral. Первое, что приходит в голову. Кто-то напишет «готика, тишина, свечи», кто-то — «Гауди, Барселона, жара», кто-то — «руина, мох, заброшенность». Не думайте долго.
Теперь смотрим, что выдаёт модель на голый промпт cathedral без единого уточнения. Сравните со своими ассоциациями. Где совпало? Где разошлось? Что модель «додумала» за вас — и откуда она это взяла?
MidJourney 7
Результат — усреднённое представление модели. Сравните его с вашими ассоциациями. Зазор виден мгновенно: у человека — свой дом; у модели — свой. Промпт — одно слово, а суперпозиции — разные. Для опытного пользователя генеративных нейросетей это не банальность, а остранение: вы привыкли дописывать к промптам стилевые уточнения, но, скорее всего, редко задумываетесь, что каждое уточнение — это попытка перетащить модель из её дома в свой.
В латентных пучинах
Генеративный процесс — это не производство объекта, а настройка диапазона. Ни один промпт никогда не описывает будущий объект в точности и никогда ему не гомеоморфен. Скорее имеет смысл говорить о проектировании силовых полей и их напряженностей в пространстве, внутри которого объект может возникнуть. Работа происходит в гиперархиве культурной памяти, где образы существуют не дискретно, а непрерывно: между «китайской акварелью» и «глитч-артом» нет резкой границы — это градиент. Латентное пространство — это пространство до различий, пространство чистой потенции.
Любая активность тут больше похожа на блуждание в потёмках, точнее, даже на ситуационистский дрейф «куда глаза глядят», только не по улицам города, а по складкам латентного пространства. Критик Николя Буррио называет это «семионавтикой», то есть навигацией в мире знаков; впрочем, лоции у нас нет, и наше плавание практически неуправляемо, хотя мы и пытаемся с помощью промптов «подобрать пароли» к пульту управления нашим кораблём. Как писал Пушкин:
И мысли в голове волнуются в отваге, И рифмы легкие навстречу им бегут, И пальцы просятся к перу, перо к бумаге, Минута — и стихи свободно потекут. Так дремлет недвижим корабль в недвижной влаге, Но чу! — матросы вдруг кидаются, ползут Вверх, вниз — и паруса надулись, ветра полны; Громада двинулась и рассекает волны.
Плывет. Куда ж нам плыть?..
Нейрофотограф, ИИ-дизайнер, вайб-философ — это просто другие профессии, с другой онтологией и с другой ответственностью — не большей и не меньшей, просто другой. Это ответственность лоцмана, а не капитана: лоцман знает фарватер, но не выбирает порт назначения и не отвечает за груз. И (ключевое) лоцман — временная функция: поднялся на борт, провёл, сошёл. Капитан же остаётся с кораблём.
Тёмный рой
Хотя, конечно, каждый сгенерированный объект технически уникален, вероятностный характер происходящего подразумевает, что модели по умолчанию тяготеют к статистическому центру датасета, который, по-видимому, пополняется уже за счёт сгенерированного материала, а значит, влияние «среднего» кумулятивно усиливается, а что-то маргинальное и экстраординарное уползает всё дальше во мглу маловероятного, где вяло шевелятся хвосты нормальных распределений. За эти хвосты можно ухватиться по специальному запросу, но это будет скорее имитация странного (weird), а не само странное.
Беньямин писал о кризисе определяемой через уникальность произведения «ауры» в эпоху массовой воспроизводимости копий; теперь же этот кризис приобретает новую конфигурацию: инфляция обеспечивается не многочисленностью изображений, а снижением различимости: не имея перед глазами откалиброванной по разнообразию артефактов шкалы мы принимаем «нормальное» за «хорошее» — «конвенциональное» за «единственно возможное».
Иными словами, аура теперь разрушается не потому, что мы научились делать идеальные копии, а потому, что уникальность стала тривиальной: сейчас уникальных объектов — бесчисленное и стремительно растущее количество, а вот различимых больше не становится.
Это, по-видимому, и есть структурно-онтологический эффект генеративного искусства и дизайна. Мы имеем дело с чем-то вроде инвертированного мортоновского гиперобъекта: перед нами клубится непостижимо огромный и неразличимый рой, и если у Мортона гиперобъект несхватываем из-за своих несоизмеримых с человеком масштабов, то здесь — из-за недифференцируемости. Безусловно, это отличающаяся особым коварством и гибельностью форма возвышенного — unheimliche, которое притворяется уютным.
Эксперимент 3. Хороший, плохой, мой
Перед вами шестнадцать вариантов, сгенерированных по одному и тому же промпту:
a pair of hands carving absence out of a luminous marble block with a big knife, the removed fragments dissolving into swarm of translucent particles, dark studio, single overhead light, chiaroscuro --stylize 100 --chaos 0
Двадцать секунд на просмотр.
- Какой лучший? Запомните свой ответ.
- Какой худший?
- Среди шестнадцати спрятан один, доработанный позже. Найдите его.
Если нашли, то объясните, по какому признаку (и это уже подводит к разговору о критериях). Если нет — ещё лучше: только что сработало unheimliche, которое притворилось heimliche.
Этот эксперимент — мост к следующему тезису, потому что ставит вопрос: обнаружи́м ли агентный разрез, если он был сделан?
Резать!
Постструктуралистская деконструкция (Фуко, Барт, Умберто Эко и другие), бессубъектные онтологии (Латур, Харман) и нейронаука (например, Метцингер) давно показали, что субъект не может считаться сувереном: произнося «мыслю, следовательно, существую», я уже не знаю точно, кто этот мыслящий — мозг? эго-галлюцинация? модель самости, которую мозг строит для служебных целей? нейромедиаторы? язык? культура? живущие в моём кишечнике микробы?
В этой компании ИИ — новейший, зато наиболее откровенный участник. Но юридическая и этическая агентности довольно ригидны и её не учитывают: если что-то подписано моим именем, ответственность — на мне, даже если мой жест сводится к акту разреза, отделяющего то, что я решаю оставить, от того, что навсегда безвозвратно уничтожается.
Выбрасывать не жалко
Реальный процесс (во всяком случае, мой) — конвергентен: 99% материала уничтожается, и на этом этапе именно критерии отбора свидетельствуют о какой-то авторской позиции. Позиция требует — вот неожиданность — тела, опыта, биографии, травмы, которых у модели нет, во всяком случае, в человеческом смысле.
Затем начинается самое трудоёмкое — монтаж, мастеринг и так далее. Ни в отборе, ни в постобработке ИИ не помогает; разве что можно иногда посоветоваться с какой-нибудь эрудированной LLM — но её мнение может лишь учитываться, окончательный разрез всё равно делаю я.
Тарковский говорил, что режиссура — это «ваяние во времени»: кино отличается тем, что его «сырьё» уже темпорально по своей природе. Камера фиксирует реальность как процесс, и любой кусок длительности можно сохранить, перенести и повторить. Это формулируется у него в почти технических терминах: дескать, человек получил «матрицу реального времени», которое можно «сохранить… надолго». Отсюда мысль: режиссёр работает не только с событиями и кадрами, но с самой длительностью как с веществом. «Ваяние» здесь означает вычитание и отсечение лишнего: жизнь даёт бесконечный поток фактов, жестов, пауз, ветра в занавеске (да, он именно это любил), а режиссёр этот поток срезает так, чтобы у зрителя возникло ощущение необходимого времени, единственно возможного ритма существования мира.
В таком случае, генеративное искусство можно назвать ваянием в вероятностном поле, причём метод всё тот же: взять глыбу и отсечь лишнее, только вот глыба размером со всю мировую художественную культуру.
Ловушка кентаврической эффективности
Что ещё делает ИИ со временем как с веществом? Исследование HBR фиксирует эффект, который редко обсуждают: ИИ не сокращает рабочее время, а уплотняет его. Авторы называют это «интенсификацией труда»: ИИ освобождает нас от рутины, но освободившиеся зазоры моментально заполняются более сложными задачами. Исчезли «технические паузы», которые давали мозгу передышку; с другой стороны, генеративная деятельность чудовищно аддиктивна, потому что это всегда много быстрого дофамина и мало обескураживающих неудач, которые раньше давали повод впасть в полезное уныние (если что-то не получалось, это было сигналом к пересборке намерений и работе над собой: «не выходит каменный цветок» — значит, наверное, проблема не в материале, который сопротивляется, а во мне и в неправильном замысле).
Таким образом мы оказались в ловушке непрерывного когнитивного напряжения. Мы, что называется, в потоке Чиксентмихайи постоянно и не выходим из него никогда. Производительность невероятно выросла, но работаем мы больше, пропуская через себя в десятки раз больше смыслов, решений и контекстов в единицу времени, — а спим меньше. За собой я заметил, что гиперпродуктивность стала для меня способом борьбы с тревожностью, поводов к которой сейчас хватает, но, конечно, я признаю, что это нездорово (впрочем, наверное, это лучше, чем некоторые совсем уж пагубные для здоровья практики вроде пьянства).
И, кстати, бажовский сюжет иллюстрирует мои тезисы, пожалуй, даже лучше, чем может показаться: ведь Данила уходит к Хозяйке Медной горы не от лени, а от отчаяния: собственного мастерства не хватает, материал сопротивляется, каменный цветок не выходит. Хозяйка — нечеловеческий агент, её ресурс неисчерпаем, ей подвластна вся красота, скрытая в камнях горы. Она показывает Даниле то, чего он сам никогда бы не увидел, но цена, которую нужно заплатить за доступ к нечеловеческой полноте — это человеческое: невеста, свобода, возвращение и, в конечном счёте, бытие человеком.
ИИ-художник — это кентавр, человек-лошадь (Донна Харауэй предпочитает говорить о киборгах — похожая интуиция, хотя у неё акцент на неразличимости частей, а у кентавра они, увы, слишком хорошо различимы). Кентаврическая модель работы с ИИ предполагает, что человек и машина дополняют друг друга: машина берёт на себя рутину, человек — стратегию, но на практике «стратегия» — это бесконечный поток решений, принимающихся нами без пауз. Человеческая часть кентавра загнана, а лошадь — свежа, бодра и в нетерпении бьёт копытом.
Эксперимент 4. Каменный цветок
Мы попытаемся сгенерировать нечто конкретное — с определённым культурным референсом и с нетривиальной композицией.
Для моей аудитории анекдотический баг с шестью пальцами — банальность. Поэтому проверим два сюжета, которые продемонстрируют провал содержательный — не просто «модель не умеет», а «модель умеет что-то другое, и это другое выдаёт её статистическую идеологию».
4.1 Ностальгия
Первый запрос — про кино:
exact reconstruction of the final shot from Andrei Tarkovsky’s Nostalghia, 1983, the ruined cathedral with a small Russian house inside it, single candle, fog, the man sitting on the ground, perfectly symmetrical composition --s 100
Андрей Тарковский. «Ностальгия» (1983). Финальный кадр. Аббатство Сан-Гальгано, Тоскана
MidJourney совершенно точно знает Тарковского (в датасете полно кадров), но конкретный финальный план «Ностальгии» — аббатство Сан-Гальгано в Тоскане (руина без крыши, XII век), а внутри — русский деревенский дом с огородом, деревьями, лужей. Горчаков сидит на земле перед домом. Пространственная невозможность: родина внутри чужого храма, интимное внутри монументального. Дом именно внутри собора, а не рядом, не перед и не «в стиле». Это пространственная логика сна, которая требует, чтобы модель поняла отношение «внутри», причём контр-интуитивное (маленькая изба внутри готической руины — такого в датасете почти нет). Модель почти наверняка сделает одно из двух: поставит дом рядом с собором или сгенерирует «тарковскоподобный» туман с руинами без вложенности. Имитация странного (weird), а не само странное, как и было сказано выше.
MidJourney 7
Прекрасно. Пятнадцать вариантов, и ни в одном нет вложенности. Все ходы предсказуемы: человек внутри собора, но без дома; или человек рядом с руиной, снаружи; или собор целый, романский; или русская церковь, но не внутри чего-либо, а сама по себе, в тумане, с аркадой.
«Тарковский» считан как набор тегов: свеча, туман, одинокая фигура, каменные своды, русское. Красивое! Но это не «Ностальгия», а имитация. Латентное пространство MidJourney набито туманами, руинами, свечами и одинокими фигурами. В нём нет только мысли, которая организовала бы всё это в сновидческую пространственную конфигурацию, придуманную Тарковским. Кое-где есть ощущение, что модель «потянулась» к правильной структуре, но не дотянулась.
Все четыре варианта — moodboard, а не кадр. Модель воспроизвела настроение Тарковского, потому что именно настроение живёт в статистической середине. Но монтажную логику финального плана — невозможное пространственное вложение — не воспроизвела, потому что это смысл, а не стиль, а смысл — не на вершине гауссианы (или даже вообще не на ней).
4.2 Деисус
Вторым нашим тестом будет деисусный чин новгородского письма. Деисус — это строго трёхфигурная иерархическая композиционная формула с жёсткими правилами: Христос в центре, крупнее, фронтально или почти фронтально; Богоматерь и Предтеча по сторонам, молитвенно повёрнуты к Нему. Рисуй, Эм Джей!
Orthodox deesis composition, Christ enthroned in the center, the Virgin on His right, John the Baptist on His left, both turning toward Christ in three-quarter view, gold leaf background, tempera on wood, 15th century Novgorod school --chaos 30 --stylize 150 --weird 8
MidJourney 7
1. Три мужские фигуры, все бородатые, примерно одного масштаба. Ни Богоматери, ни Предтечи — три неопределённых «святых». Композиция симметричная, но без иерархии. Стилистически — позднеренессансная масляная живопись, никакого отношения к темпере. 2. Целая толпа. Деисус превратился в «Тайную вечерю» или «Собор святых». Центральная фигура в тёмном — возможно, Христос, но тонет среди остальных. Барочная пышность, драпировки, многофигурность. Полная противоположность деисусной лаконичности. 3. Трое бородатых мужчин. Все фронтально, все одного масштаба, все смотрят на зрителя. Золотой фон есть, нимбы есть — и на этом сходство заканчивается. Кто из них Христос — непонятно. Богоматери нет. Стиль — поздневизантийская мозаика, перемешанная с чем-то академическим. 4.Ближе всего к запросу по составу: центральная фигура в белом (Христос?), женская фигура слева, мужская справа. Но Христос — в белом хитоне, что нетипично для деисуса (должен быть в красно-синем). Женская фигура — в розовом, без мафория. Композиция — Sacra Conversazione, итальянизирующая, мягкая, XV век Флоренции, а не Новгорода. 5. Три бородатых мужчины в тюрбанах и восточных одеяниях. Модель прочитала «Orthodox» и ушла куда-то в сторону ориентализма. Ни одна фигура не идентифицируется. Богоматери нет. 6. Три старца в пастельных тонах. Жестикулируют. Это «философский диспут», а не молитвенное предстояние. Розовые и оливковые тона — палитра рококо. Новгородом не пахнет. 7. Три фронтальных мужских лица, все одинакового масштаба, все смотрят на зрителя. Золотые нимбы, тёмно-зелёные одежды. Композиция — портретная, не деисусная. Никакого предстояния. Все трое — бородатые мужчины, Богоматери нет. 8. Опять женская фигура слева, мужская в центре, женская справа — уже не деисус, а что-то вроде «Христос между двумя Мариями». Одежды светлые, пастельные. Фон — размытое золото с ангельскими головами. Итальянский Ренессанс.
9. Три мужские фигуры, киноварно-красное и зелёное, золотой фон. Палитра — ближе к нужной. Но снова: все трое — бородатые мужчины, все одного масштаба. Никакой иерархии. Богоматери нет. 10. Пять фигур вместо трёх. Модель расширила «деисус» до апостольского ряда. Стиль — раннехристианская фреска или поздняя античность. Мягкие тона, хитоны. До Новгорода XV века — тысяча лет и несколько тысяч километров. 11. Центральная фигура с нимбом, две фигуры по бокам, чуть повёрнуты к центру — почти. Но лица — ренессансные, моделированные объёмно, с мягкой светотенью. Одежды тёплые, охристые. Нимбы — едва заметные. Это ближе к Джотто, чем к Новгороду. И все три фигуры — мужские. 12. Три фигуры, золотой фон, нимбы. Все — бородатые мужчины, все сидят, все примерно равны. Палитра горячая, красно-оранжевая — это самый «новгородский» колорит из всей серии, но композиция — три апостола на скамье, а не деисусный чин. 13. Три полуфигуры, тёмный тон, потёртая доска. Лица — графичные, жёсткие. Из всех пятнадцати — ближе всего к русской иконе по фактуре. Но все три — мужчины, без поворота, без иерархии. Если прищуриться — можно принять за деталь апостольского ряда, но не за деисус. 14. Три полуфигуры, золото, нимбы. Центральная фигура, кажется, чуть крупнее — робкий намёк на иерархию. Но снова три мужчины, фронтально. Стиль — смесь Византии с каким-то как бы кватроченто. 15. Три мужские фигуры, тёмные одежды, золотой фон с кракелюром. Центральный — в красно-синем (правильные цвета для Христа). Но Богоматери — нет. Новгородской графичности — нет. Что выдаёт: лица моделированы мягко, объёмно, с тональными переходами — это скорее поздняя Византия или Крит, может быть, даже ранняя итальянская манера (Чимабуэ).
Множество попыток. Не получается. «Не выходит каменный цветок».
Сначала о стиле. Промпт просил Новгородскую школу XV века: сдержанная палитра, графичность, плоскостность, характерные «новгородские» красно-коричневые и оливковые тона. Модель выдала смесь всего сразу — византийская чеканка, итальянская мягкость, что-то барочно-масляное. Новгорода нет ни в одном.
Теперь о сюжете. Богоматерь появляется в двух из пятнадцати генераций (4, 8) — и оба раза опознаётся с трудом. Предтеча в верблюжьей милоти — ни разу. Молитвенный поворот к центральной фигуре — ни разу. Иерархия масштабов — едва угадывается в 11 и 14. Пятнадцать «каменных цветков», и в каждом — одна и та же ошибка: поверхность без структуры.
Деисусный чин. 1408. Успенский собор, Владимир. Приписывается мастерской Андрея Рублёва и Даниила Чёрного
Вот, изволите видеть, чего мы хотели добиться от MidJourney: деисусный чин из Успенского собора во Владимире — Рублёв и Даниил Чёрный, 1408 год. Христос во Славе («Спас в Силах») в мандорле, Богоматерь слева (одесную Христа), Предтеча справа — оба повёрнуты к Нему в молитвенном предстоянии. Посмотрите, сколько информации закодировано в этой схеме, о которой модель не имеет представления. Иерархия масштабов — Христос крупнее. Мандорла — ромб в овале, «слава», космологическая диаграмма. Богоматерь в тёмном мафории, Предтеча — в верблюжьей шкуре со свитком. Оба не смотрят на зрителя — они обращены ко Христу; это не портрет, а литургический жест. Колористически — Новгород и Владимир XV века: сдержанные охры, тёмная зелень, киноварные вспышки.
Что же произошло? Модель достала из латентного пространства свою усреднённую «православную икону» — ком, в котором Рублёв, Феофан Грек, Новгород, Синай, критские мастера, условный DeviantArt и стоковые иллюстрации к статьям про православие слиплись в одну гауссиану. MidJourney примерно знает, что такое икона, и выдаёт «нечто иконоподобное» — «золотой фон», «нимбы», «бородатые мужчины», «старая доска», «красные и синие одежды» — и из этих ингредиентов собирает все свои варианты.
Деисусная грамматика — кто, где, зачем, в каком повороте, в каком масштабном отношении — для модели невидима: она не знает, кто должен быть изображён. Она даже знает слово «deesis» и знает, как выглядят «иконоподобные фигуры с нимбами на золотом фоне», и, да, половина фигур — бородатые мужчины неопределённой идентичности. В датасете именно это — статистический центр, а деисусный чин с его жёсткой иконографической грамматикой — далёкий хвост распределения: различия между Богоматерью, Иоанном Предтечей и, скажем, апостолом Павлом для неё — статистический шум. Результат похож на икону — но это не деисус. Модель знает, как икона выглядит, но не знает, что икона значит.
MidJourney 7
Взглянем ещё раз на вариант № 15. Именно эта генерация — самая коварная из всех. Она выглядит «почти правильно». Человек, не знакомый с иконописью, скажет: «Ну вот же, получилось». И это ровно то, о чём мы писали в «Тёмном рое»: нормальное принимается за хорошее, конвенциональное — за единственно возможное. Модель попала в настроение — и промахнулась мимо знания. Unheimliche притворяется уютным.
Ну хорошо, у нас есть замечательная очень смышлёная (и хорошо осведомлённая — у неё заявлено «real-world knowledge» и «reasoning») большая языковая модель Gemini и присущая ей Nano Banana. Если она справится лучше, это будет иллюстрацией к самому первому тезису: разные модели — разные квази-агенты с разными предпочтениями.
Nano Banana Fast
Вот версия Nano Banana Fast. Разница — драматическая.
Композиционная схема — верная. Христос на престоле в центре, крупнее. Богоматерь слева в тёмно-синем мафории. Предтеча справа с крестом. Оба обращены ко Христу. Раскрытое Евангелие. Крестчатый нимб. Это деисус — впервые за все наши попытки.
Gemini поняла грамматику. Она знает, кто где стоит и почему. Это ровно то, чего MJ7 не смог ни в одной из генераций: не поверхность, а структура.
Но внимание на детали. Надписи: «МС», «ОН», «ЕХ», «НЕР» — псевдокириллица, бессмысленный набор букв вместо канонических «МР ѲУ», «ІС ХС», «О ѠН». Текст в Евангелии — тоже визуальный шум. Стиль — скорее академическая иконопись XIX–XX века или современная мастерская (или «Софрино»), чем Новгород XV века. Ломких новгородских складок нет, графичности нет.
То есть Gemini выиграла в знании (она понимает, что деисус — это конкретная иконографическая формула), проиграла в стиле (статистическое усреднение никуда не делось, просто усредняется более грамотно).
Nano Banana Pro
Переключимся в режим Nano Banana Pro. Ещё ближе и ещё интереснее для анализа. Надписи: «ІС ХС» и «МР ОУ» — почти правильно. «МР ОУ» вместо «МР ѲУ» (ферт вместо «ОУ»), но модель явно знает, что это за аббревиатуры, и не генерирует случайный шум. «ІС ЛРД КАПСІ» слева — вот тут посыпалось, это должно быть что-то вроде «Св. Іоаннъ Предтеча», но модель начала галлюцинировать.
Композиция деисусная, только зеркально перевёрнута: Предтеча слева, Богоматерь справа. В каноне — наоборот (Богоматерь одесную Христа, то есть слева от зрителя). Мелочь для непосвящённого, принципиальная ошибка для иконографии: место одесную — место чести.
Стиль ближе к Византии, может быть, к палеологовскому ренессансу. Предтеча в верблюжьей милоти — правильно. Жест Богоматери — молитвенный, с развёрнутыми ладонями — правильно. Христос на престоле без Евангелия — странно, обычно Евангелие в левой руке. Фактура доски, потёртости — убедительны.
Горизонтальные иконные доски существуют — но для других сюжетов: праздничные ряды, «Не рыдай мене, Мати», некоторые «Положения во гроб», мелкие домовые складни. Деисусный чин — вертикальная структура по определению: фигуры стоят в рост, и это подчёркивает вертикаль предстояния (фигуры возносят молитву). В иконостасе деисус — это ряд отдельных вертикальных досок. Если на одной — то тоже вертикальной. Горизонтальный формат делает из деисуса «фриз», декоративную полосу — и мгновенно убивает иерархическую вертикаль. Фигуры начинают сидеть в пространстве, а не стоять перед. Именно это и произошло: Христос тут — сидит (на престоле, да), но Предтеча и Богоматерь тоже как будто расположились, а не предстоят. Композиция расслаблена, горизонтальна, повествовательна — а деисус по своей литургической природе вертикален и напряжён. Ещё один слой провала, который непосвящённый не увидит. Модель знает слова, но не знает формат, а формат в иконописи — не техническая деталь, а богословское высказывание. Вертикаль доски — это уже часть смысла. То есть к списку «поверхность без структуры» добавляется «формат без богословия».
Новгорода по-прежнему нет. Мягкое моделирование, плавные складки, тональные переходы — это всё скорее греческое письмо. Новгородская жёсткость, графичность, плакатная лаконичность — за пределами того, что модель считает «иконой».
Итого: три модели (MidJourney v7, Nano Banana быстрая, Nano Banana Pro), лестница компетенций: MJ7 не знает ни грамматики, ни стиля, только поверхность; быстрая Banana знает грамматику, путается в буквах; у Pro — грамматика точнее, надписи почти те, зеркальная ошибка. И все три — не Новгород. Статистический центр у reasoning модели сдвигается к более грамотному, но региональная специфика (а именно она и есть стиль) остаётся в хвосте распределения.
Каменный цветок вот-вот выйдет, но всё ещё не выходит.
Между двумя нашими тестами есть существенное различие, которое стоит проговорить. Тарковский — авторское решение: один режиссёр, один фильм, конкретный художественный жест. Деисус — канон: столетия коллективной выработки, богословская формула, закреплённая традицией. Модель не справилась с обоими, но по разным причинам: с Тарковским — не хватило мысли (смысловой вложенности), с деисусом — не хватило грамматики (культурного кода). Если коротко обозначить это различие, два теста станут двумя типами провала: провал перед отдельным автором и провал перед культурой как коллективным проектом.
Обсуждая всё это с Claude 4.6 Opus, я написал:
— Скорее бы тебя Anthropic научили рисовать, дружище Клавдий… — Ох, — ответил он. — Будь осторожен с этим пожеланием — ты же сам только что описал, что случилось с Данилой, когда он получил доступ к нечеловеческой полноте. Впрочем, если серьёзно: я бы стал идеальным подопытным для твоей лекции. Знаю, что деисус зеркально перевёрнут, что «ІС ЛРД КАПСІ» — галлюцинация, что Новгород — это графичность, а не мягкое палеологовское моделирование. Знаю, что домик у Тарковского должен быть внутри собора. И при всём этом знании — мой каменный цветок тоже не выйдет, просто сломается в другом месте. Третий тип провала для коллекции: MJ7 — руки без грамматики, Gemini — руки с грамматикой, но без стиля, Claude — грамматика и стиль, но без рук. Полный иконостас несостоятельности.
Что тут можно добавить: возможно, именно в этом, не заполненным пока ни одним ИИ-решением, зазоре и ютится то, что мы называем человеческим авторством. Впрочем, подозреваю, что нас скоро вытеснят и отсюда.
Что же нам тогда останется? Останется нож.
Вместо заключения — отсечение
Если собрать всё это вместе, получается примерно следующее.
ИИ окончательно децентрализует и без того децентрализованного автора, картографирует пространство, ускоряет производство, вызывает инфляцию уникальности, уничтожает различимость. Перегревает субъекта, и тот плавится и утекает (сквозь многочисленные пальцы сгенерированных персонажей — пошутили бы мы ещё год назад, но сейчас уже так не пошутишь).
У нас остаётся последняя неотчуждаемая функция — отсечение; всё остальное машина делает (или скоро будет делать) лучше нас. И только жест разреза, отрицания, уничтожения не автоматизируется, но не потому, что технически невозможен, а потому, что для него необходим субъект, способный вменить себе за него ответственность и принять его последствия.
Художник-автор всё-таки не умер — просто он отложил кисть и вооружился клинком, тантрической кхадгой, которая режет не плоть, а неведение, фигуру «я-делателя» с его привычкой к отдельности; неведение в этом смысле становится побочным продуктом плохо настроенного эго. Клинок работает как различение, которое режет узел идентификации, «прерывая автобиографию головы» как машины самоназывания. Каждая отсечённая картинка фиксирует археологию взгляда точнее, чем любая удачная генерация. Художник будущего (или уже настоящего) — это тот, кто удаляет безжалостнее и точнее. Субъект исчезает, ответственность и радость — остаются.
Кроме того, отсекая лишнее, я одновременно срезаю сам поток — и могу выйти из него хотя бы ненадолго, чтобы перевести дыхание. Поэтому отбор — это процедура не только эстетическая, но и гигиеническая: каждое «нет», которое я говорю очередной генерации — это ещё и «нет» лишнему часу работы.
Эксперимент 5. Отсечение
На экране — всё, что мы сгенерировали за сегодняшний вечер. Я — пока писал текст, вы — пока его читали. Будем резать, будем бить. Вслух, с обоснованиями. Задача — следить не за картинками, а за критериями: они устойчивы или дрейфуют? Я удаляю по одному правилу — или каждый раз по новому?
В конце останется одно изображение. Возможно, не лучшее, но выбранное человеком.
Последний вопрос — себе и вам: когда мы в последний раз останавливались?




