На этой неделе прочитала свежую статью Кьяры Пеллегрини из NN/g: «AI-агенты теперь тоже пользователи наших интерфейсов». Автор — серьёзный исследователь, статья хорошо аргументирована. У агента есть цели, агент сталкивается с интерфейсом, агент пытается достичь целей через наш дизайн. По функциональному определению — пользователь.
Я не согласна с этой рамкой. И думаю, что разница принципиальная.
Восемь лет я работала клиническим врачом, потом перешла в продуктовый дизайн. Сейчас веду UX/UI в крупной российской IT-компании. Этот переход дал мне странное двойное зрение: я постоянно вижу в дизайне проблемы, которые медицина решала десятилетиями. Вопрос с агентами — один из них.
Агент — это не новый пользователь. Это новый посредник.
Что медицина знала раньше IT
В клинической практике вы почти никогда не получаете чистые данные напрямую от человека, чьё тело — предмет разговора.
Родственник описывает симптомы за пациента, который не может говорить. Медсестра передаёт результаты обследования по телефону при пересменке. Ребёнок переводит с русского на узбекский для бабушки. Супруга заполняет пробелы, которые пациент сам не может — потому что устал, в шоке или в тяжёлом состоянии.
Я узнала на собственном опыте, что теряется на каждом переводе.
«У него болит живот» — может значить шесть разных вещей в зависимости от того, кто это произносит. Родственник, который это говорит, может не знать, что «живот» в бытовой речи покрывает всё от пищевода до малого таза. Медсестра, пересказывающая по телефону, может добавить свою оценку тяжести. Ребёнок-переводчик может упростить, потому что не знает медицинской терминологии. К моменту, когда информация доходит до меня, картина сжалась, перекосилась, иногда инвертировалась.
Эту проблему решали не введением «коммуникационных протоколов для медсестёр» или «упрощённых форм для родственников». Её решали структурированной передачей информации. У каждого отделения свой шаблон, но логика везде одна: чёткие поля с однозначными подписями, обязательные блоки (статус, анамнез, текущее состояние, что делать дальше), один порядок изложения. Не «расскажите своими словами» — а «заполните по структуре». Эта структура работает через любого посредника: дежурного врача, медсестру, лаборанта, родственника пациента.
Принципы старые. Они также удивительно близки к тому, что требует хороший дизайн интерфейсов.
Что на самом деле делает агент
Когда вы просите агента «проверить расписание школы и отметить конфликты с календарём», агент не воспринимает ваш интерфейс. Он пересказывает ваше намерение интерфейсу. А потом пересказывает ответ интерфейса обратно вам.
У агента нет своих целей. Ему всё равно, какие у вас выходные. Его задача — разобрать, что сказали вы, разобрать, что показывает экран, и построить мост между ними.
Это в точности та же задача, что и у родственника, пересказывающего симптомы по телефону. Посредник не знает, что важно, а что побочно. Он не знает, что «под заголовком» — это важная связь, если дата отрисована в другом div. Он не знает, что «вторник» в выпадающем списке означает следующий вторник, а не прошлый — если разметка ему этого не сказала.
Каждое допущение об интерфейсе, которое вы делаете про зрячего, сфокусированного человека, читающего сверху вниз при хорошем освещении — это допущение ломается одинаково для агента и для пользователя со скринридером. И для уставшего родителя с маленьким экраном на ярком солнце.
Почему переформулировка важна
Если мы считаем агентов пользователями — мы строим «agent modes». Специальные интерфейсы или API, существующие параллельно с человеческими. Это тот же тупик, по которому медицина шла годами с «формами коммуникации с пациентами», существовавшими отдельно от клинической документации. Две системы, два источника правды, два режима отказа.
Если мы считаем агентов посредниками — мы делаем человеческий интерфейс читаемым для любого посредника, который должен через него пройти. Одна система. Один источник правды. Меньше работы, не больше.
Это то же самое осознание, которое привело к accessibility-first дизайну. Скринридеры раньше считались «специальным приспособлением». Потом команды поняли, что интерфейсы, дружелюбные к скринридерам — также легче поддерживать, более устойчивы на разных устройствах, проще локализовать, проще тестировать. «Специальный случай» оказался общим случаем.
Три практических вывода
1. Семантическая структура больше не опциональна
Кнопка, стилизованная как <div>, работает для зрячих людей. Она не работает для скринридеров, для клавиатурных пользователей и для агентов. Один и тот же дефект кода, три исключённые группы.
У каждого элемента интерфейса должна быть чёткая семантическая роль. Кнопки — это <button>. Формы — это <form>. Заголовки — это <h1>–<h6>. ARIA-подписи там, где визуального контекста недостаточно. Ничего из этого не новое. Новое то, что дополнительные 30–40% вашего трафика начнут приходить через системы, которые видят только то, что вы подписали.
2. Визуальная группировка нуждается в структурном эквиваленте
Зрячий человек читает «Вторник 5 марта, 9:00, Научная ярмарка» как одно цельное событие, потому что видит пространственную группировку. Агент, разбирающий accessibility tree, видит четыре отдельные строки без явной связи между ними — если ваша разметка не говорит ему обратное.
Оборачивайте связанную информацию в семантические контейнеры. Используйте корректную иерархию заголовков. Не полагайтесь на CSS-позиционирование для передачи логических связей.
3. Предсказуемость важнее изящества
Поток, который перестраивается в зависимости от контекста — это восхитительно для вовлечённого человека и катастрофично для посредника, у которого нет полного контекста.
Стабильный порядок. Предсказуемые переходы состояний. Идемпотентные действия там, где возможно. В больнице это работало так: запись в карте велась в одном и том же порядке всегда — никто не угадывал, где искать назначения, а где результат анализа. Скучный вариант — это безопасный вариант.
Бизнес-кейс
В ближайшие 12–24 месяца значительная доля всех взаимодействий с вашим продуктом будет проходить через агентов. Точная цифра — предмет споров. Направление — нет.
Команды, которые серьёзно занимались доступностью последние десять лет, окажутся правы по случайности. Их интерфейсы уже читаются посредниками.
Команды, которые откладывали доступность — будут переделывать с нуля. Не потому что они думают про агентов, а потому что их продукт просто перестанет работать для растущей доли пользователей. К этому моменту работы будет больше, технический долг — выше.
Самая дешёвая версия этой работы — версия, где вы делаете это базой сейчас, а не доделываете потом. Клинический эквивалент этого урока — «чинить крышу, пока светит солнце». Это любимая поговорка моей мамы. Она работает и здесь.
Что делать на этой неделе
Вам не нужна «стратегия по агентам». Вам нужен честный аудит того, насколько ваш существующий интерфейс читаемый для всего, что не зрячий человек, читающий сверху вниз.
Три проверки, которые любая команда может сделать за день:
Прогоните продукт через скринридер десять минут. Запишите, что пропадает или путается.
Используйте инспектор accessibility tree в браузере на трёх самых частых сценариях. Запишите, где подписи отсутствуют, неоднозначны или не связаны с визуальным представлением.
Попробуйте один из открытых агентских фреймворков (Browser Use, Anthropic Computer Use, или подобные) на одном сценарии. Запишите, где он падает.
Три одинаковых аудита, три одинаковых режима отказа, три одинаковые группы пользователей выигрывают, когда вы это чините.
Главное наблюдение
Доступность перестаёт быть «фичей для меньшинств». Через год это будет минимальный уровень, без которого продукт не работает. Потому что половина запросов к нему будет приходить через посредников разного вида.
В медицине мы давно знаем: хорошая коммуникация с пациентом через посредника — это та же коммуникация, что и напрямую. Никаких «упрощённых протоколов для медсестёр». Один стандарт, который работает для всех.
В дизайне мы только подходим к этому пониманию. Агенты — не новый вызов. Они просто делают видимым то, что должно было быть видно всегда.
Я пишу о пересечении клинической медицины и продуктового дизайна в Telegram-канале @kikodocc. В следующем месяце пишу о том, как дальтонизм связан с поздней диагностикой рака мочевого пузыря — и почему интерфейс, в котором предупреждения сделаны только красным цветом, повторяет ту же опасную логику.
mahmud90
Нейросеть повторяется, но рандомно меняет цифры.
Kikodoc Автор
Спасибо, действительно дублировалось. Поправила.